K&R 读书笔记
“The C Programming Language” 是计算机编程的经典之作,别名 K&R
。
这是一本简短精悍的书籍,介绍了 C
语言的编程核心、ANSI 规范、编译原理等诸多方面的内容。现在很难想象这本不足 200 页的小书^[可以参考这个链接看看现在有哪些优秀的 C 编程数据:The Definitive C Book Guide and List - Stack Overflow]尽然能够放得下这么多的内容,可以说是提纲挈领、言简意垓。尤其是附录A部分,只是简要介绍了 C
的编译原理,区区几页纸张就足以为后人编写各式不同的编译器提供指引^[关于 C
的历史,这里有一篇 Dennis Ritchie 写的文章可供参考:The Development of the C Language]。
概览
根据我対本书的理解,把整本书籍分成四部分
- 第一部分:简单介绍
C
,重点在于说明为何要把C
设计成如此简要。一方面,是受到当时程序运行的硬件条件限制,最早 K.Tompson 和 D.Ritchie 是在 PDP-7、PDP-11 上面实现了 Unix 操作系统,然后才决定设计一款与这个 Unix 操作系统配套的编程语言,这必然要求新语言一定要足够精简以适应操作系统対性能的极致考验;另一方面,「小而美」是当时学术领域的一个普遍认可的观念,即根据「奥卡姆」定律:如无必要,请勿增添。因此,我们现在看到,C
语言最核心的内容其实很少,关键词不到 30 个,基本上达到了高级编程语言能够触摸的「底层地板」,但通过一定的设计之后,由这些命令组成的程序却又有着强大的能够,既能够实现対底层硬件(指针是C
语言的核心,即变量在内存的地址)的直接操控,又能提供简洁明确的逻辑范式。-
Chapter 0: Introduction
-
C is a general-purpose programming language。
C
是一个通用的编程语言,既能够用于编写操作系统这类高难度的「程序」,也提供了一套开发高级程序的工具。 -
[page.3]
we believe strongly that the way to learn a new language is to write programs in it.
其实编程就像一门传统的手艺活,需要不停的练习才能达到掌握,即 “learning by doing”。多敲键盘,多写代码,这是唯一无二的学习方法。
-
-
Chapter 1: A Tutorial Introduction
-
- 第二部分:介绍
C
编程语言的核心。- Chapter 2: Type, Operators, and Expression
- Chapter 3: Control Flow
- Chapter 4: Functions and Program Structure
- Chapter 5: Pointers and Arrays
- Chapter 6 Structures
- 第三部分:介绍标准库
- Chapter 7: Input and Output
- Chapter 8: The Unix System Interface
- 第四部分:附录:编译器
- Appendix A: Reference Manual
- Appendix B: Standard Library
PART I:入门准备
Chap. 1: Hello, world!
经典例子
经典的 Hello, world
就是从这里诞生的。
|
|
这个例子虽然看起来十分的简单,却涉及到相当多的关于该程序的知识点,因而也往往成了一门编程语言入门的「见面礼」,正如书上说的:
[page.5]
This is the big hurdle; to leap over it, you have to be able to
- create the program text somewhere
- compile it successfully
- load it
- run it
- and find out where you output went
温度转换
|
|
格式化输入、输出
这里补充一下关于 printf
与 scanf
格式化的知识点:
- 我们知道,
C
被设计的非常的简洁,核心代码量极小,甚至都不提供输入、输出这样常用的函数,因为有时候程序确实不需要这些函数也能运行,从而可以省下不必要的函数载入消耗。 ANSI C
提供了输入输出的标准库,在stdio.h
中定义了函数原形,我们可以把这个标准库载入后,调用输入输出函数。- 关于
printf
的说明- 要求参数是一个 字符串,而不能是单个的字符。前者使用双引号
“”
,后者使用单引号‘’
,而且前者的后面是\0
做为字符串结束标识。 - 可以定义输出格式
%d
:简单的私进制整型%6d
:宽度为 6 位%06d
:宽度为 6 位,且不足 6 位时以0
代替%06.1f
:浮点数,最大宽度为 6,小数点保留 1 位,且补足 6 位时以0
代替%c
:单个字符串%p
:指针%o
:八进制%x
:十六进制
- 要求参数是一个 字符串,而不能是单个的字符。前者使用双引号
- 关于
scanf
的说明- 接受输入,可以接受连续输入,中间以空格键区分,使用
ctrl+d
标示结束输入 - 把输入值的指针赋值给指定的变量,因此需要放入变量的指针,而不是变量本身,这一点往往容易出错
- 接受输入,可以接受连续输入,中间以空格键区分,使用
|
|
关于 for
与 while
书中其实是分别用了 for
和 while
两种逻辑结构来対温度进制进行转换。这两类逻辑都是属于循环结构,一般来说,
- 对于有确定循环次数的逻辑,我们使用
for
- 而对于未知循环次数的逻辑,则使用
while
[page.14]
The choice between while and for is arbitrary, based on which seems clearer. The for is usually appropriate for loops in which the initialization and increment are single statements and logically related, since it is more compact than while and it keeps the loop control statements together in one place.
关于预处理
macro
也称作预处理指令,是预处理器在编译前,执行的特殊命令,可以是插入头文件、定义全局常量、执行逻辑分支等。需要注意的是,预处理指令实际上不是一个 C
语句,因此不能在预处理命令后面添加分号 ;
。
#include <stdio.h>
:就是把头文件插入到源文件,从而保证编译器能够找到声明#ifndef
、#endif
:预处理器执行分支逻辑#define
:可以理解成定义了一个全局变量,实际上不是这样的,而是把源文件中出现的所有字符都替换为我们预定义的变量字面值,从而达到固定程序有关变量数值的目的,因此是不可改变的
getchar
|
|
函数封装
[page.24]
With properly designed functions, it is possible to ignore how a job is done; knowing what is done is sufficient.
|
|
作用域(scope)
C
使用一対大括号{}
来聚合多个命令语句块,并形成一个变量的作用域(scope)。这类变量我们称之为 automatic
。作用域遵从「可高不可低」的原则,即
- 一个作用域内部的变量只在本作用域内有效(包含子域)
- 更高层次的作用域无法调用子域变量
[page.31]
Because automatic variables come and go with function invocation, they do not retain their values from one call to the next, and must be explicitly get upon each entry. If they are not set, they will contain garbage.
比如
|
|
从函数调用的角度看这个问题,每次调用一个函数,C
是默认使用 pass-by-value
把常量复制后再传入到函数主体,因此,在函数里面対参数的修改,实际上不会影响原来传递的参数值。如果想要对其进行修改,则需要 pass-by-reference
或则 pass-by-pointer
。^[从内存地址的角度看,二者是同一个东西,都是变量的一种「映射」,只不过 reference
是别名,而 pointer
是内存实实在在的地址。]
C
编程工程项目
对于一个小型的工程项目,比如上面这个函数封装的例子,我们只需要把所有的函数原型和函数定义写在 main
同在的源文件,然后直接编译就可以运行了。但是对于一个大型的 C
程序开发项目,往往会涉及到非常多的文件关联,主函数起到的只是一个做为程序入口用于调用其他的功能模块,而这些功能模块,又都是根据各自的特征分布的各个源文件中。这在编译的时候,就需要告诉编译器各个模块之间的关联关系。这就是头文件的作用。
-
把所有的函数原型放在一个头文件
myfunctions.h
里面,指明函数的基本结构,但没有函数体-
由于头文件可能会在多个功能模块中被重复载入,因此需要使用预处理命令
1 2 3 4 5 6
#ifndef __MYFUNCTIONS__H__ #define __MYFUNCTIONS__H__ // ------------------------------ 函数原型声明 // ------------------------------ #endif
-
-
在
myfunctions.c
编写函数主体,主要需要把头文件载入,#include “myfunctions.h”
-
在
main
函数源文件中,由于需要调用函数主体,因此也需要把头文件载入,向编译器表明函数原型 -
之后便可以直接调用函数
-
编译的时候,可以使用命令,或者在
Sublime
里面设置1
"cmd": ["gcc -std=c11 -Wall ${file_path}/*.c -o ${file_base_name}"]
即把所有的文件都进行编译,然后自动进行链接
PART II:C
语言核心概念
Chap. 2: Types, Operators, and Expression
变量名
There are two hard things in computer science: cache invalidation and naming things.
– Phil Karlton
以上这句经典台词常常被用来形容给变量取一个合适的名称是多么的困难,既要简短以减少输入时间,又要直观以方便阅读。
一般来说,以下几点是在 c
编程中需要注意的:
c
是対大小写敏感的编程语言,也就意味着x
与X
代表两个不同的变量。其实还可以进一步引申出来,绝大部分的c-family
,也都遵从大小写敏感的原则,如R
、python
。当然,还是有很多的编程语言是不限制大小写的,比如数据库操作语言SQL
。c
要求变量名以英文字母、下划线开头、并可以在非开头部分使用阿拉伯数字。注意,这个往往是初学者容易犯错的地方:变量名不能以数字开头。- 以下划线开头的变量往往有特殊的意义,一般是标准开预先定义的变量名,或则是一类全局变量名。
- 变量名应以字见意,能够从字面意思推断出该变量代表的具体含义。虽然类似
a
、aa
、b
这些名称也是合法的,但无法看出来他们各自代表什么意思,因此不利于代码阅读。另外,现在很多的IDE
都有提供变量的模糊匹配功能,比如Sublime
中使用ctrl+d
或则alt+f3
是可以直接找到与该名称匹配的所有变量,而如果使用a
、aa
这类名称,则会困难很多。
基本数据类型
一般来说,基本数据类型的具体位长,与本地机器有关。
-
char
:ANSI
支持的单个字母,并以整数表示。如A
是对应65
。char
一共有256
个,一般是以整数的形式表示。需要注意的是,char
和我们在标准库使用的string
是不一样的,char
使用整数表示,只占用一个字节(byte,一共有 $2^8$);而string
是字符串,本质上是一个char array[]
,并且以\0
标示结尾(虽然打印的时候看不到,这个是系统自动加上的)。因此,A
与“A”
是两个不一样的变量,前者是一个字符,只有一个字节,而后者多了一个结尾符号\0
,因此占用了两个字符。1 2 3 4 5 6 7 8 9 10 11 12 13 14
// char 与 string 区别 #include <stdio.h> int main() { char c = 'A'; printf("%d\n", c); printf("sizeof \'A\': %ld\n", sizeof c); char s[] = "A"; printf("%s\n", s); printf("sizeof \"A\": %ld\n", sizeof s); return 0; }
-
short
、int
、long
、long long
:整型。 -
float
、double
、long double
:浮点型。尽量使用double
类型,一方面是因为精度更高;另一方面,传统上认为float
可以节省内存空间,但是现在对于大内存时代,已经不是问题,而且很多的内存机制会自动进行double
的补齐,所以直接使用double
性能是会更佳。
我们可以查看一下系统的基本数据类型长度
|
|
拓展数据类型
enum
:整型,并以1
递增。如果没有指定初始,则以0
开始计数。structure
:结构体。pointer
:指针,即变量在内存的地址。array
|
|
常量
常量,顾名思义,就是不可以更改的变量,本质上还是一个变量,只不过不能对其进行修改值,但可以在命令语句中调用。
-
字面常量(literal constant):字符常量
a
、A
,字符串常量“a long string”
。 -
常量表达式(constant expression):即在编译的时候就可以确定的表达式
1 2 3
constant int i = 10; // 编译的时候已经确定了 j 的值 int j = (i+100)*i;
类型转换
类型转换有两种实现方式:
-
显示转换,即明确写明需要转换的目标类型
-
隐式转换,系统根据一定的转换规则把原来的数据转换为目标数据,注意原来的数据类型是不变的,改变的是取值后的数据:
-
一般是采用低阶到高阶的顺序,即占用字节少的数据类型补齐成占用字节多的数据类型,以补齐所需的内存空间
char -> int -> float -> double
short -> long
-
对于溢出数据所标示数值范围的,则会根据数据类型所占用的范围进行循环,比如
1 2 3 4
short si = 32768 + 1; printf("si = %d\n", si); // 得到 si = -32767
-
|
|
运算
-
函数运算优先级最高
-
变量自增、自减
-
算数运算
-
逻辑运算
-
复合运算符
op=
,根据上面的运算优先级,op=
是先计算等式左边,得到值后再进行复合运算,即1
x *= y + z; // x = x*(y+z);
Chap. 3: Control Flow
if-else
|
|
-
expression
为逻辑判断,结果如果是非零(0
),则表示逻辑为真;如果是零(0
),则代表逻辑为假 -
注意语句后面使用分号
;
代表该语句结束 -
if-else
遵从 就近原则,即会寻找最近的else
进行配对1 2 3 4 5
if (expression) if (expression) statement; else statement;
虽然看起来,我们使用了缩进试图表示
else
是与第一个if
配对,当时要记住,c
其实不不像python
是严格使用缩进来表示代码运行逻辑的。因此,此处的运行到第二个if
后,会直接与else
配对,即1 2 3 4 5 6 7
if (expression){ if (expression) { statement; } else { statement; } }
当然,如果需要表达另外一个意思,需要使用
{}
来划分代码块1 2 3 4 5 6
if (expression) { if (expression) statement; } else { statement; }
switch
switch
使用整型变量来判断需要执行哪个命令语句。
|
|
for
与 while
其实两者是可以互相转换的
while
是先执行判断条件,如果没有符合的,则一步都不会执行下面的语句- 为了至少执行一次,我们可以使用
do-while
。
|
|
break
与continue
可以控制循环逻辑的执行:
break
提前退出整个循环continue
不执行本次循环,但需要继续执行省下的循环^[R
使用next
,python
使用continue
]
Chap. 4: Functions and Program Structure
本章的内容非常的翔实,不仅介绍了函数封装的基本知识,更是重点分析如何构建一个完整的
c
项目程序,从使用头文件、声明外部变量、到分离编译、函数调用等高级功能。