深入淺出C

Head First C

前幾章一些值得注意的小細節

A && B 表示「假如A執行成功的話，就執行B」
```
$ gcc zork.c -o zork && ./zork
```
break 不能用來中斷 if 陳述式
誤用 break 去中斷 if 的後果可以看這裡（The 1990 AT&T Long Distance Network Collapse）
串接指定
x = 4 運算式本身也具有回傳值 4
y = x = 4; 把 x 和 y 都設定成 4
陣列變數當作指標使用
doses[3] == *(doses + 3) == *(3 + doses) == 3[doses]
字串實字（String literals）永遠不能 被更新
- 指向字串實字的變數不能用來改變該字串的內容
```
char *cards = "JQK";
cards[2] = cards[1]; // 這不合法！！
```
- 如果從字串實字重新建立一個陣列，就「能夠」 修改該陣列
```
char cards[] = "JQK";
cards[2] = cards[1]; // 合法！！
```

記憶體存儲器（位址由高至低）

名稱	用途
Stack（堆疊）	區域變數（local variables）
Heap（堆積）	動態記憶體（dynamic memory）
Globals（全域區段）	全域變數（global variables）
Constants（常數區段）	唯讀
Code（程式碼區段）	唯讀

指標構成的陣列
```
char* name_for_dog[] = {"Bowser", "Bonza", "Snodgrass"};
```
每個字串實字都會有一個指標指向他
| 符號（管線）是將一個行程之標準輸出連結到另一個行程之標準輸入的符號
```
$ (./bermuda | ./geo2json) < spooky.csv > output.json
```
命令列選項（command-line option）
內容待補（P.149）
struct指標表示法（t是指向struct的指標）
(*t).age、t->age
這兩個表達式表達同一件事
strdup() 函式能夠在 heap 某處重新產生該字串的完整副本
```
char *copy = strdup(s);
```
strdup()在string.h中，函式計算該字串多長，然後呼叫malloc()函式，在 heap 上配置正確數量的字元

第七章、函式進階

指向函式的指標
用法是 回傳類型(*指標變數)(參數型別)
像這樣 char** (*names_fn)(char*, int)

舉個小小的例子

int (*wrap_fn)(int);
wrap_fn = go_to_wrap_speed; //儲存go_to_wrap_speed()函式的位址
wrap_fn(4); //這就跟呼叫go_to_wrap_speed(4)函式一樣

排序函式（sort function）與比較器函式（comparator function）
在stdlib.h裡面有一個qsort()函式，看起來長這樣

qsort(void array, //指向陣列的指標
      size_t length, //該陣列的長度
      size_t item_size, //陣列裡每個元素的尺寸
      int (*compar)(const void *, const void *)); //指向比較陣列裡頭兩個項目的函式

示範的程式放在資料夾 qsort_with_comparator 裡面

函式指標陣列
用法是回傳類型(*指標變數[])(參數型別)

void (*replies[])(response) = {dump, second_chance, marriage}; //陣列裡面存放指向函式的指標

範例程式在 [mail_merge]() 裡面

可變參數函式（Variadic function）
直接來個範例：

#include <stdarg.h> //處理可變參數函式的程式碼都在這

void print_ints(int args, ...) { //「...」被稱作「省略」（ellipsis），告訴你後面還有東西
    va_list ap; //va_list 用來儲存要傳進你的函式的額外引數
    va_start(ap, args); //va_start 指名可變動引數從哪裡開始
    for(int i = 0; i < args; i++)
        printf("argument: %d\n", va_arg(ap, int)); //va_arg 接受兩個值：va_list 和下一個引數的「型別」
    va_end(ap); //讀完之後記得要結束
}

//call the function
print_ints(3, 79, 101, 32);
print_ints(2, 10, 2);

小提示
1. va_end、va_start 等東西實際上是巨集，不是函式
2. 至少要有一個固定參數
3. 如果嘗試讀取比傳進來的還要多的引數，會發生隨機錯誤（random error）

第八章、動態與靜態程式庫

使用-I選項來告訴編譯器去哪找標頭檔
```
$ gcc -I/my_header_files test_code.c ... -o test_code
```
這樣就可以直接用 #include<some_header.h> 了（尖括號）
收藏檔五四三
- 收藏檔包含.o目的檔
- 用nm指令檢視收藏檔的內容
```
$ nm libl.a
```
- 使用ar命令建立收藏檔
```
$ ar -rcs libhfsecutity.a encrypt.o checksum.o
```
  1. r表示如果.a檔已經存在則更新
  2. c表示建立收藏檔而沒有回饋訊息
  3. s叫ar指令在.a檔案開頭處建立索引（index）
  4. 收藏檔總是該命名為lib<something>.a
- 編譯
```
$ gcc test_code.c -lhfsecutity -o test_code
```
  hfsecutity叫編譯器尋找名為libhfsecutity.a的收藏檔
  如果收藏檔放在其他地方，用-L選項指名要搜尋哪些目錄
```
$ gcc test_code.c -L/my_lib -lhfsecutity -o test_code
```
  -L旗標應該出現在gcc指令裡頭的原始碼檔案之後
動態程式庫
動態程式庫在執行時期（runtime）才被連結到程式
- 在不同的作業系統上有不同的名稱
  1. hfcal.dll（Windows 上的 MinGW）
  2. libhfcal.dll.a（Windows 上的 Cygwin）
  3. libhfcal.so（Linux 或 Unix）
  4. libhfcal.dylib（Mac）
  備註：Linux 或 Unix 上的so代表共用目的檔（shared object file），Mac 上的dylib代表動態程式庫（dynamic library）
- 用-shared旗標建立動態程式庫
```
$ gcc -shared hfcal.o -o /libs/libhfcal.dylib
```
靜態與動態程式庫的範例分別在 [static-library]() 跟 [dynamic-library]() 裡面

第九章、行程與系統呼叫

system()函式
system()函式接受單一參數並執行，就像直接在命令列上輸入一樣，簡單又方便
```
system("ls -l");
```
但是system()函式並不安全，有可能被住入（inject）程式碼片段，範例在 [unsafe_system_call]() 裡面
這個範例還有其他可能遇到的問題，詳情請洽第 403 頁
exec()函式 exec()函式透過執行某個程式來替換當前的行程
行程就是在記憶體裡執行的程式，作業系統用行程識別符（process identifier，PID）來追蹤每個行程

exec()函式有很多不同版本，主要分成兩群，串列（list）函式跟陣列（array）函式
- 串列（list）函式，接受參數串列的命令列引數：
  - execl()
  - execlp()：根據路徑（PATH）搜尋程式
  - execle()：使用環境陣列的字串
- 陣列（array）函式，如果命令列引數已經先存在串列裡面的話：
  - execv()
  - execvp()：根據路徑（PATH）搜尋程式
  - execve()：使用環境陣列的字串
看出規則了吧～～

範例在這，假如有一個檔案dinner_info.c，內容如下：
```
#include <stdio.h>
#include <stdlib.h>

int main(int argc, char *argv[]) {
    printf("Dinners: %s\n", argv[1]);
    printf("Juice: %s\n", getenv("JUICE")); //stdlib.h 裡的 getenv() 讓你讀取環境變數
    return 0;
}
```
然後你執行：
```
//陣列的最後一個項目必須是 NULL
char *my_env[] = {"JUICE=peach and apple", NULL};

//這裡需要 NULL 告訴函式沒有其他引數了
execle("dinner_info", "dinner_info", "4", NULL, my_env);
```
結果會長這樣：
```
Dinners: 4
Juice: peach and apple
```
系統呼叫的錯誤處理
檢查錯誤的方法有很多：
1. 如果exec()呼叫成功，當前程式便會停止執行，因此，假如程式在呼叫exec()之後還在執行任何工作，那一定是有問題
2. 也可以檢查exec()函式是否回傳-1
3. 但這邊要介紹的是errno變數
  
  errno變數是儲存在errno.h裡的全域變數，有一連串標準錯誤值：
  - EPERM=1 Operation not permitted
  - ENOENT=2 No such file or directory
  - ESRCH=3 No such process
  - 還有另外一百多種錯誤，詳情可參見維基百科
  因為errno變數實際上只是數字，可以使用string.h裡的strerror()函式查詢標準錯誤訊息（就是那個數字代表的含意）：
```
puts(strerror(errno));  //將錯誤數字轉換為錯誤訊息
```
相關的範例放在 [exec_error_handle]() 裡面
fork()函式
fork()函式會複製你的行程，為當前行程產生完整副本
原先的行程被稱作父行程，新建立的副本叫做子行程

呼叫fork()的方法：
```
pid_t pid = fork();
```
pid_t的型態取決於作業系統，有些使用short，有些可能使用int
fork()回傳0的整數值給子行程，回傳正的整數值給父行程，父行程會收到子行程的行程識別符（PID）

範例（在 [rssgossip]() 裡的 [newshound.c]()）：用exec()呼叫 Python 程式讀取 RSS 檔案
小整理
1. system()像控制台命令那樣執行字串
2. fork()複製當前行程
3. fork()+exec()建立子行程

第十章、行程間通訊（Interprocess communication）

檔案描述子是代表資料串流的數字
表格的前三個槽位（slot）總是相同
- 槽位 0 是標準輸入
- 槽位 1 是標準輸出
- 槽位 2 是標準錯誤
使用>及2>重導向標準輸出和標準錯誤
```
$ ./myprog > output.txt 2> errors.log
```
2代表描述子表格裡的標準錯誤數字
也可以把標準錯誤重導向到與標準輸出相同的地方
```
$ ./myprog 2> &1
```
2>表示「重導向標準錯誤」 &1表示「到標準輸出去」
fileno()告訴你描述子
假如你讀了一個檔案
```
FILE *my_file = fopen("Gguitar.mp3", "r");
```
描述子表格（description table）變這樣

# 資料串流在幹嘛

0 鍵盤標準輸入

1 螢幕標準輸出

2 螢幕標準錯誤

3 資料庫連接其他串流

4 guitar.mp3 檔案我們讀進來的檔案在這

最後
```
 int descriptor = fileno(my_file);  //這會回傳 4
```
dup2()複製資料串流
waitpid() 函式
在sys/wait.h標頭檔裡
有三個參數，像這樣用：
```
waitpid(pid, pid_status, options);
```
1. pid：就行程識別符
2. pid_status：指向整數的指標（因為需要更新它），儲存行程的結束資訊（exit information）
3. options：沒事的話設定 0 就好，代表等到該行程結束，欲知詳情，可用 man waitpid查詢
以上三個函式的範例在 [rssgossip]() 裡的 [newshound2.c]()（改編前面的程式來的！）

#	資料串流	在幹嘛
0	鍵盤	標準輸入
1	螢幕	標準輸出
2	螢幕	標準錯誤
3	資料庫連接	其他串流
4	guitar.mp3 檔案	我們讀進來的檔案在這

用 pipe() 連接行程
先來看看怎麼用

int fd[2]; //The descriptors will be stored in this array.

//You pass the name of the array to the pipe() function
if (pipe(fd) == -1) {
    error("Can't create the pipe");
}

其中，fd[1]是資料的入口（寫入管線），fd[0]是資料的出口（可以從管線讀取）
注意一點是一個管線只能單向傳送資料串流，所以如果是子行程要傳送資料給父行程
在子行程中：

close(fd[0]); //The child won’t read from the pipe, this will close the read end of the pipe.
dup2(fd[1], 1); //The child then connects the write end to the Standard Output

在父行程中：

dup2(fd[0], 0); //The parent connects the read end to the Standard Output.
close(fd[1]); //This will close the write end of the pipe.

詳細的範例在 [rssgossip]() 裡的 [new_opener.c]()（也是改編前面的程式來的）

信號（signal）
平常在終端機執行程式時，使用者鍵入Ctrl-C，程式便終止，實際上發生的流程如下：
1. 鍵入 Ctrl-C
2. 作業系統傳送中斷信號
3. 行程執行它的預設中斷處理器（interrupt handler），呼叫exit()
每一種信號都有對應的信號處理器（signal handler），記錄在信號表格（signal table）中，信號處理器的內容可以用自己寫的程式碼取代
- sigaction
  sigaction是包含指向函式之指標的struct，用來告訴作業系統，當某個信號被送給行程時，他應該呼叫哪個函式
  以下說明如何建立sigaction
```
struct sigaction action; //建立新動作
action.sa_handler = diediedie; //想要電腦呼叫的函式名稱，sigaction 包裹的函式稱作處理器
sigemptyset(&sction.sa_mask); //mask（遮罩）是過濾 sigaction 將處理之信號的機制，通常用空的就好
action.sa_flags = 0; //額外的旗標，平常沒事用 0 就好
```
  因為所有信號都只是整數值，自訂處理器函式（custom handler function）必須接受int引數
```
void diediedie(int sig) //sig 是處理器已經捕捉到的信號數字
{
    puts("Goodbye cruel world...\n");
    exit(1);
}
```
  - sigaction以sigaction()註冊
    用sigaction()函式來告訴作業系統我們剛剛建立的sigaction
    sigaction()接受三個參數：
```
sigaction(signal_no, &new_action, &old_action);
```
    1. 信號數字：你想要處理的信號整數值
    2. 新動作：你想要註冊的sigaction的位址
    3. 舊動作：沒事的話用NULL就好如果發生失敗，sigaction()會回傳 -1，並且設定errno變數
    把它變得更容易使用一點，寫一個函式把這個過程包起來：
```
int catch_signal(int sig, void (*handler)(int)) //信號數字跟指向處理器函式的指標
{
    struct sigaction action; //建立 aciton
    action.sa_handler = handler; //將該 action 的處理器函式設定成傳進來的處理器函式
    sigemptyset(&sction.sa_mask); //使用空的 mask
    action.sa_flags = 0;
    return sigaction(sig, &action, NULL);
}
```
    用法像這樣：
```
catch_signal(SIGINT, diediedie);
```
    簡單的範例在 [signal_handle]() 裡的 [SIGINT_handle.c]()
- 常出現的信號與成因
  - SIGINT行程被中斷
  - SIGQUIT有人要求形成停止，並且將記憶體傾瀉在 core dump 檔案中
  - SIGFPE浮點數錯誤
  - SIGTRAP偵錯器詢問行程在哪裡
  - SIGSEGV行程試圖存取不合法的記憶體
  - SIGWINCH終端視窗改變尺寸
  - SIGTERM有人要求核心（kernal）殺掉行程
  - SIGPIPE行程寫入沒有東西讀取的管線
- 使用kill傳送訊號
```
$ ps
77868 ttys003 0:00.02 bash
78222 ttys003 0:00.01 ./testprog
```
```
$ kill 78222 #傳送 SIGTERM 給程式
$ kill -INT 78222 #傳送 SIGTINT 給程式
$ kill -SEGV 78222 #傳送 SIGSEGV 給程式
$ kill -KILL 78222 #傳送 SIGKILL 給程式，不能被忽略！！
```
  SIGKILL不能被程式碼捕捉，也不能被忽略，所以無論如何kill -KILL <pid>總是會殺掉你的程式
- 用raise()傳送信號
  使用raise()命令可以讓行程把信號傳送給自己，像這樣：
```
raise(SIGTERM);
```
  舉例來說，警示信號（alarm signal），SIGALARM，就是個常見的用法
  警示信號通常由行程的定時器（interval timer）所建立，他將在未來的某個時間，觸發SIGALARM信號
```
catch_signal(SIGALARM, pour_coffee);
alarm(120); // 定時器每隔120秒觸發一次
do_important_busy_work();
do_more_busy_work();
```
  警示信號讓你進行多工（multitask）處理，假如你每隔幾秒就必需執行特定工作，或是想要限制花在某項工作的時間量，那警示信號就是讓程式打斷他自己的好方法
  
  別同時使用 alarm() 跟 sleep()，因為他們使用相同的定時器，會互相干擾
- 重設及忽略信號
  SIG_DFL表示預設的處理方式
```
catch_signal(SIGTERM, SIG_DFL);
```
  SIG_IGN叫行程完全忽略信號
```
catch_signal(SIGINT, SIG_IGN);
```
總結這部分的範例放在 [signal_handle]() 的 [signals_example.c]()

第十一章、Socket 與網路連接

協定是結構化的溝通與對話

如果要寫程式與網路交談，需要一種新類型的資料串流，叫做 Socket

#include <sys/socket.h>
...
//listener_d 是該 socket 的描述子
int listener_d = socket(PF_INET, SOCK_STREAM, 0); //最後一個參數是協定數字
if(listener_d == -1)
    error("Can't open socket"); //這是之前我們寫的

在伺服器能夠使用 socket 與客戶端交談之前，必須經歷四個階段：

Bind（繫結埠口）
Listen（偵聽）
Accept（接受連接）
Begin（開始交談） > 可以用四個單字單第一個字母 BLAB 來記憶

繫結（Bind）到某個埠口

#include <arpa/inet.h> //需要這個標頭建立網際網路位址
...
//下面四行表示「網際網路埠口30000」的埠口名稱
struct sockaddr_in name;
name.sin_family = PF_INET;
name.sin_port = (in_port_t)htons(30000);
name.sin_addr.s_addr = htonl(INADDR_ANY);
int c = bind(listener_d, (struct sockaddr *) &name, sizeof(name));
if(c == -1)
    error("Can't bind to socket");

偵聽
```
if(listen(listener_d, 10) == -1)
    error("Can't listen");
```
以 10 的長度呼叫listen()表示同時間最多可以有 10 個客戶端試著連接伺服器，他們不會全部立即被回覆，但是他們可以等待，而第 11 個客戶端皆被告知伺服器「過於忙碌」。 >先來的先服務，所以客戶端是在佇列（queue）裡等待

接受連接

//client_addr 會儲存有關連接上來之客戶端的細節資訊
struct sockaddr_storage client_addr;
unsigned int address_size = sizeof(client_addr);
int connect_d = accept(listener_d, (struct sockaddr *)&client_addr, &address_size);
if(connect_d == -1)
    error("Can't open secondary socket");

這個新的連接描述子（connect_d）是伺服器將使用的那個

開始對話

socket 並非典型的資料串流
socket 是雙向的，可以使用於輸入和輸出

目錄