README.md 107.6 KB
Newer Older
1
# C/C++ 面试知识总结
辉哈's avatar
辉哈 已提交
2

辉哈's avatar
辉哈 已提交
3 4 5
为 2018 年春招总结的 C/C++ 面试知识,只为复习、分享。部分知识点与图片来自网络,侵删。欢迎 Star,欢迎 Issues。

秋招陆续开始了,祝大家斩获心仪 Offer。
辉哈's avatar
辉哈 已提交
6 7 8

## 使用建议

辉哈's avatar
辉哈 已提交
9 10 11
* `Ctrl + F`:快速查找定位知识点
* `TOC 导航`:使用 [jawil/GayHub](https://github.com/jawil/GayHub) 插件快速目录跳转
* `T`:按 `T` 激活文件查找器快速查找 / 跳转文件
辉哈's avatar
辉哈 已提交
12

辉哈's avatar
辉哈 已提交
13 14
## 目录

辉哈's avatar
辉哈 已提交
15
* [C/C++](#cc)
辉哈's avatar
辉哈 已提交
16 17 18 19 20 21
* [STL](#stl)
* [数据结构](#%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84)
* [算法](#%E7%AE%97%E6%B3%95)
* [Problems](#problems)
* [操作系统](#%E6%93%8D%E4%BD%9C%E7%B3%BB%E7%BB%9F)
* [计算机网络](#%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BD%91%E7%BB%9C)
辉哈's avatar
辉哈 已提交
22
* [网络编程](#%E7%BD%91%E7%BB%9C%E7%BC%96%E7%A8%8B)
辉哈's avatar
辉哈 已提交
23 24
* [数据库](#%E6%95%B0%E6%8D%AE%E5%BA%93)
* [设计模式](#%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F)
辉哈's avatar
辉哈 已提交
25
* [链接装载库](#%E9%93%BE%E6%8E%A5%E8%A3%85%E8%BD%BD%E5%BA%93)
辉哈's avatar
辉哈 已提交
26
* [海量数据处理](#%E6%B5%B7%E9%87%8F%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86)
27
* [音视频](#%E9%9F%B3%E8%A7%86%E9%A2%91)
辉哈's avatar
辉哈 已提交
28 29 30
* [其他](#%E5%85%B6%E4%BB%96)
* [书籍](#%E4%B9%A6%E7%B1%8D)
* [复习刷题网站](#%E5%A4%8D%E4%B9%A0%E5%88%B7%E9%A2%98%E7%BD%91%E7%AB%99)
辉哈's avatar
辉哈 已提交
31
* [招聘时间岗位](#%E6%8B%9B%E8%81%98%E6%97%B6%E9%97%B4%E5%B2%97%E4%BD%8D)
辉哈's avatar
辉哈 已提交
32
* [面试题目经验](#%E9%9D%A2%E8%AF%95%E9%A2%98%E7%9B%AE%E7%BB%8F%E9%AA%8C)
辉哈's avatar
辉哈 已提交
33 34 35

## C/C++

36 37 38 39 40 41 42 43 44 45 46 47
### const

#### 作用

1. 修饰变量,说明该变量不可以被改变;
2. 修饰指针,分为指向常量的指针和指针常量;
3. 常量引用,经常用于形参类型,即避免了拷贝,又避免了函数对值的修改;
4. 修饰成员函数,说明该成员函数内不能修改成员变量。

#### 使用

<details><summary>const 使用</summary> 
48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

```cpp
// 类
class A
{
private:
    const int a;                // 常对象成员,只能在初始化列表赋值

public:
    // 构造函数
    A() { };
    A(int x) : a(x) { };        // 初始化列表

    // const可用于对重载函数的区分
    int getValue();             // 普通成员函数
辉哈's avatar
辉哈 已提交
63
    int getValue() const;       // 常成员函数,不得修改类中的任何数据成员的值
64 65 66 67 68 69 70
};

void function()
{
    // 对象
    A b;                        // 普通对象,可以调用全部成员函数
    const A a;                  // 常对象,只能调用常成员函数、更新常成员变量
辉哈's avatar
辉哈 已提交
71 72
    const A *p = &a;            // 常指针
    const A &q = a;             // 常引用
73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93

    // 指针
    char greeting[] = "Hello";
    char* p1 = greeting;                // 指针变量,指向字符数组变量
    const char* p2 = greeting;          // 指针变量,指向字符数组常量
    char* const p3 = greeting;          // 常指针,指向字符数组变量
    const char* const p4 = greeting;    // 常指针,指向字符数组常量
}

// 函数
void function1(const int Var);           // 传递过来的参数在函数内不可变
void function2(const char* Var);         // 参数指针所指内容为常量
void function3(char* const Var);         // 参数指针为常指针
void function4(const int& Var);          // 引用参数在函数内为常量

// 函数返回值
const int function5();      // 返回一个常数
const int* function6();     // 返回一个指向常量的指针变量,使用:const int *p = function6();
int* const function7();     // 返回一个指向变量的常指针,使用:int* const p = function7();
```

辉哈's avatar
辉哈 已提交
94 95
</details>

辉哈's avatar
辉哈 已提交
96 97 98 99
### static

#### 作用

100 101
1. 修饰普通变量,修改变量的存储区域和生命周期,使变量存储在静态区,在 main 函数运行前就分配了空间,如果有初始值就用初始值初始化它,如果没有初始值系统用默认值初始化它。
2. 修饰普通函数,表明函数的作用范围,仅在定义该函数的文件内才能使用。在多人开发项目时,为了防止与他人命令函数重名,可以将函数定位为 static。
辉哈's avatar
辉哈 已提交
102
3. 修饰成员变量,修饰成员变量使所有的对象只保存一个该变量,而且不需要生成对象就可以访问该成员。
103
4. 修饰成员函数,修饰成员函数使得不需要生成对象就可以访问该函数,但是在 static 函数内不能访问非静态成员。
辉哈's avatar
辉哈 已提交
104 105 106 107 108 109 110

### this 指针

1. `this` 指针是一个隐含于每一个成员函数中的特殊指针。它指向正在被该成员函数操作的那个对象。
2. 当对一个对象调用成员函数时,编译程序先将对象的地址赋给 `this` 指针,然后调用成员函数,每次成员函数存取数据成员时,由隐含使用 `this` 指针。
3. 当一个成员函数被调用时,自动向它传递一个隐含的参数,该参数是一个指向这个成员函数所在的对象的指针。
4. `this` 指针被隐含地声明为: `ClassName *const this`,这意味着不能给 `this` 指针赋值;在 `ClassName` 类的 `const` 成员函数中,`this` 指针的类型为:`const ClassName* const`,这说明不能对 `this` 指针所指向的这种对象是不可修改的(即不能对这种对象的数据成员进行赋值操作);
辉哈's avatar
辉哈 已提交
111
5. `this` 并不是一个常规变量,而是个右值,所以不能取得 `this` 的地址(不能 `&this`)。
辉哈's avatar
辉哈 已提交
112
6. 在以下场景中,经常需要显式引用 `this` 指针:
辉哈's avatar
辉哈 已提交
113 114 115
    1. 为实现对象的链式引用;
    2. 为避免对同一对象进行赋值操作;
    3. 在实现一些数据结构时,如 `list`
辉哈's avatar
辉哈 已提交
116

117 118 119 120 121 122 123
### inline 内联函数

#### 特征

* 相当于把内联函数里面的内容写在调用内联函数处;
* 相当于不用执行进入函数的步骤,直接执行函数体;
* 相当于宏,却比宏多了类型检查,真正具有函数特性;
124
* 不能包含循环、递归、switch 等复杂操作;
125
* 类中除了虚函数的其他函数都会自动隐式地当成内联函数。
126 127 128

#### 使用

129 130 131
<details><summary>inline 使用</summary> 


132
```cpp
133
// 声明1(加 inline,建议使用)
134 135
inline int functionName(int first, int secend,...);

136
// 声明2(不加 inline)
137 138 139 140 141 142
int functionName(int first, int secend,...);

// 定义
inline int functionName(int first, int secend,...) {/****/};
```

143 144
</details>

辉哈's avatar
辉哈 已提交
145
#### 编译器对 inline 函数的处理步骤
146

147 148 149 150
1. 将 inline 函数体复制到 inline 函数调用点处; 
2. 为所用 inline 函数中的局部变量分配内存空间; 
3. 将 inline 函数的的输入参数和返回值映射到调用方法的局部变量空间中; 
4. 如果 inline 函数有多个返回点,将其转变为 inline 函数代码块末尾的分支(使用 GOTO)。
151 152 153 154 155 156 157 158 159 160 161 162 163

#### 优缺点

优点

1. 内联函数同宏函数一样将在被调用处进行代码展开,省去了参数压栈、栈帧开辟与回收,结果返回等,从而提高程序运行速度。
2. 内联函数相比宏函数来说,在代码展开时,会做安全检查或自动类型转换(同普通函数),而宏定义则不会。 
3. 在类中声明同时定义的成员函数,自动转化为内联函数,因此内联函数可以访问类的成员变量,宏定义则不能。
4. 内联函数在运行时可调试,而宏定义不可以。

缺点

1. 代码膨胀。内联是以代码膨胀(复制)为代价,消除函数调用带来的开销。如果执行函数体内代码的时间,相比于函数调用的开销较大,那么效率的收获会很少。另一方面,每一处内联函数的调用都要复制代码,将使程序的总代码量增大,消耗更多的内存空间。
164
2. inline 函数无法随着函数库升级而升级。inline函数的改变需要重新编译,不像 non-inline 可以直接链接。
165 166
3. 是否内联,程序员不可控。内联函数只是对编译器的建议,是否对函数内联,决定权在于编译器。

167 168 169 170 171 172
#### 虚函数(virtual)可以是内联函数(inline)吗?

[Are "inline virtual" member functions ever actually "inlined"?](http://www.cs.technion.ac.il/users/yechiel/c++-faq/inline-virtuals.html)

* 虚函数可以是内联函数,内联是可以修饰虚函数的,但是当虚函数表现多态性的时候不能内联。
* 内联是在编译器建议编译器内联,而虚函数的多态性在运行期,编译器无法知道运行期调用哪个代码,因此虚函数表现为多态性时(运行期)不可以内联。
173
* `inline virtual` 唯一可以内联的时候是:编译器知道所调用的对象是哪个类(如 `Base::who()`),这只有在编译器具有实际对象而不是对象的指针或引用时才会发生。
174

175 176 177
<details><summary>虚函数内联使用</summary> 


178 179
```cpp
#include <iostream>  
辉哈's avatar
辉哈 已提交
180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200
using namespace std;
class Base
{
public:
	inline virtual void who()
	{
		cout << "I am Base\n";
	}
	virtual ~Base() {}
};
class Derived : public Base
{
public:
	inline void who()  // 不写inline时隐式内联
	{
		cout << "I am Derived\n";
	}
};

int main()
{
201
	// 此处的虚函数 who(),是通过类(Base)的具体对象(b)来调用的,编译期间就能确定了,所以它可以是内联的,但最终是否内联取决于编译器。 
辉哈's avatar
辉哈 已提交
202 203 204 205 206 207 208
	Base b;
	b.who();

	// 此处的虚函数是通过指针调用的,呈现多态性,需要在运行时期间才能确定,所以不能为内联。  
	Base *ptr = new Derived();
	ptr->who();

209
	// 因为Base有虚析构函数(virtual ~Base() {}),所以 delete 时,会先调用派生类(Derived)析构函数,再调用基类(Base)析构函数,防止内存泄漏。
辉哈's avatar
辉哈 已提交
210 211 212 213 214 215
	delete ptr;
	ptr = nullptr;

	system("pause");
	return 0;
} 
216 217
```

218 219
</details>

辉哈's avatar
辉哈 已提交
220 221
### assert()

辉哈's avatar
辉哈 已提交
222
断言,是宏,而非函数。assert 宏的原型定义在`<assert.h>`(C)、`<cassert>`(C++)中,其作用是如果它的条件返回错误,则终止程序执行。如:
辉哈's avatar
辉哈 已提交
223 224 225 226 227 228 229

```cpp
assert( p != NULL );
```

### sizeof()

230 231
* sizeof 对数组,得到整个数组所占空间大小。
* sizeof 对指针,得到指针本身所占空间大小。
辉哈's avatar
辉哈 已提交
232 233 234

### #pragma pack(n)

235
设定结构体、联合以及类成员变量以 n 字节方式对齐
辉哈's avatar
辉哈 已提交
236

237 238
<details><summary>#pragma pack(n) 使用</summary> 

辉哈's avatar
辉哈 已提交
239 240

```cpp
241 242
#pragma pack(push)  // 保存对齐状态
#pragma pack(4)     // 设定为 4 字节对齐
辉哈's avatar
辉哈 已提交
243

辉哈's avatar
辉哈 已提交
244 245
struct test
{
辉哈's avatar
辉哈 已提交
246 247 248
    char m1;
    double m4;
    int m3;
辉哈's avatar
辉哈 已提交
249
};
辉哈's avatar
辉哈 已提交
250

251
#pragma pack(pop)   // 恢复对齐状态
辉哈's avatar
辉哈 已提交
252 253
```

254 255
</details>

辉哈's avatar
辉哈 已提交
256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278
### 位域

```cpp
Bit mode: 2;    // mode 占 2 位
```

类可以将其(非静态)数据成员定义为位域(bit-field),在一个位域中含有一定数量的二进制位。当一个程序需要向其他程序或硬件设备传递二进制数据时,通常会用到位域。

* 位域在内存中的布局是与机器有关的
* 位域的类型必须是整型或枚举类型,带符号类型中的位域的行为将因具体实现而定
* 取地址运算符(&)不能作用于位域,任何指针都无法指向类的位域

### volatile

```cpp
volatile int i = 10; 
```

* volatile 关键字是一种类型修饰符,用它声明的类型变量表示可以被某些编译器未知的因素(操作系统、硬件、其它线程等)更改。所以使用 volatile 告诉编译器不应对这样的对象进行优化。
* volatile 关键字声明的变量,每次访问时都必须从内存中取出值(没有被 volatile 修饰的变量,可能由于编译器的优化,从 CPU 寄存器中取值)
* const 可以是 volatile (如只读的状态寄存器)
* 指针可以是 volatile

辉哈's avatar
辉哈 已提交
279 280
### extern "C"

281 282
* 被 extern 限定的函数或变量是 extern 类型的
*`extern "C"` 修饰的变量和函数是按照 C 语言方式编译和连接的
辉哈's avatar
辉哈 已提交
283

284
`extern "C"` 的作用是让 C++ 编译器将 `extern "C"` 声明的代码当作 C 语言代码处理,可以避免 C++ 因符号修饰导致代码不能和C语言库中的符号进行链接的问题。
辉哈's avatar
辉哈 已提交
285

286 287
<details><summary>extern "C" 使用</summary> 

辉哈's avatar
辉哈 已提交
288 289 290 291 292 293 294 295 296 297 298 299
```cpp
#ifdef __cplusplus
extern "C" {
#endif

void *memset(void *, int, size_t);

#ifdef __cplusplus
}
#endif
```

300 301
</details>

辉哈's avatar
辉哈 已提交
302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341
### struct 和 typedef struct

#### C 中

```c
// c
typedef struct Student {
    int age; 
} S;
```

等价于

```c
// c
struct Student { 
    int age; 
};

typedef struct Student S;
```

此时 `S` 等价于 `struct Student`,但两个标识符名称空间不相同。

另外还可以定义与 `struct Student` 不冲突的 `void Student() {}`

#### C++ 中

由于编译器定位符号的规则(搜索规则)改变,导致不同于C语言。

一、如果在类标识符空间定义了 `struct Student {...};`,使用 `Student me;` 时,编译器将搜索全局标识符表,`Student` 未找到,则在类标识符内搜索。

即表现为可以使用 `Student` 也可以使用 `struct Student`,如下:

```cpp
// cpp
struct Student { 
    int age; 
};

辉哈's avatar
辉哈 已提交
342
void f( Student me );       // 正确,"struct" 关键字可省略
辉哈's avatar
辉哈 已提交
343 344 345 346 347 348 349 350 351
```

二、若定义了与 `Student` 同名函数之后,则 `Student` 只代表函数,不代表结构体,如下:

```cpp
typedef struct Student { 
    int age; 
} S;

辉哈's avatar
辉哈 已提交
352
void Student() {}           // 正确,定义后 "Student" 只代表此函数
辉哈's avatar
辉哈 已提交
353

辉哈's avatar
辉哈 已提交
354
//void S() {}               // 错误,符号 "S" 已经被定义为一个 "struct Student" 的别名
辉哈's avatar
辉哈 已提交
355 356 357

int main() {
    Student(); 
辉哈's avatar
辉哈 已提交
358
    struct Student me;      // 或者 "S me";
辉哈's avatar
辉哈 已提交
359 360 361 362 363 364
    return 0;
}
```

### C++ 中 struct 和 class

365
总的来说,struct 更适合看成是一个数据结构的实现体,class 更适合看成是一个对象的实现体。
辉哈's avatar
辉哈 已提交
366 367 368 369

#### 区别

* 最本质的一个区别就是默认的访问控制
370 371
    1. 默认的继承访问权限。struct 是 public 的,class 是 private 的。  
    2. struct 作为数据结构的实现体,它默认的数据访问控制是 public 的,而 class 作为对象的实现体,它默认的成员变量访问控制是 private 的。
辉哈's avatar
辉哈 已提交
372

373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423
### union 联合

联合(union)是一种节省空间的特殊的类,一个 union 可以有多个数据成员,但是在任意时刻只有一个数据成员可以有值。当某个成员被赋值后其他成员变为未定义状态。联合有如下特点:

* 默认访问控制符为 public
* 可以含有构造函数、析构函数
* 不能含有引用类型的成员
* 不能继承自其他类,不能作为基类
* 不能含有虚函数
* 匿名 union 在定义所在作用域可直接访问 union 成员
* 匿名 union 不能包含 protected 成员或 private 成员
* 全局匿名联合必须是静态(static)的

<details><summary>union 使用</summary> 

```cpp
#include<iostream>

union UnionTest {
    UnionTest() : i(10) {};
    int i;
    double d;
};

static union {
    int i;
    double d;
};

int main() {
    UnionTest u;

    union {
        int i;
        double d;
    };

    std::cout << u.i << std::endl;  // 输出 UnionTest 联合的 10

    ::i = 20;
    std::cout << ::i << std::endl;  // 输出全局静态匿名联合的 20

    i = 30;
    std::cout << i << std::endl;    // 输出局部匿名联合的 30

    return 0;
}
```

</details>

424
### C 实现 C++ 类
425

426
[C 语言实现封装、继承和多态](http://dongxicheng.org/cpp/ooc/)
427

428
### explicit(显式)构造函数
辉哈's avatar
辉哈 已提交
429

430
explicit 修饰的构造函数可用来防止隐式转换
辉哈's avatar
辉哈 已提交
431

432
<details><summary>explicit 使用</summary> 
辉哈's avatar
辉哈 已提交
433 434 435 436 437

```cpp
class Test1
{
public:
438
    Test1(int n)            // 普通构造函数
辉哈's avatar
辉哈 已提交
439 440
    {
        num=n;
辉哈's avatar
辉哈 已提交
441
    }
辉哈's avatar
辉哈 已提交
442 443 444
private:
    int num;
};
辉哈's avatar
辉哈 已提交
445

辉哈's avatar
辉哈 已提交
446 447 448
class Test2
{
public:
449
    explicit Test2(int n)   // explicit(显式)构造函数
辉哈's avatar
辉哈 已提交
450 451
    {
        num=n;
辉哈's avatar
辉哈 已提交
452
    }
辉哈's avatar
辉哈 已提交
453 454 455
private:
    int num;
};
辉哈's avatar
辉哈 已提交
456

辉哈's avatar
辉哈 已提交
457 458
int main()
{
459 460 461
    Test1 t1=12;            // 隐式调用其构造函数,成功
    Test2 t2=12;            // 编译错误,不能隐式调用其构造函数
    Test2 t2(12);           // 显式调用成功
辉哈's avatar
辉哈 已提交
462 463 464 465
    return 0;
}
```

466 467
</details>

辉哈's avatar
辉哈 已提交
468
### friend 友元类和友元函数
辉哈's avatar
辉哈 已提交
469 470 471 472 473 474 475

* 能访问私有成员  
* 破坏封装性
* 友元关系不可传递
* 友元关系的单向性
* 友元声明的形式及数量不受限制

476 477 478 479 480
### using

#### using 声明

一条 `using 声明` 语句一次只引入命名空间的一个成员。它使得我们可以清楚知道程序中所引用的到底是哪个名字。如:
辉哈's avatar
辉哈 已提交
481 482

```cpp
483
using namespace_name::name;
辉哈's avatar
辉哈 已提交
484 485
```

486 487
#### 构造函数的 using 声明【C++11】

辉哈's avatar
辉哈 已提交
488
在 C++11 中,派生类能够重用其直接基类定义的构造函数。
489 490 491 492 493 494 495 496 497 498 499 500 501 502 503

```cpp
class Derived : Base {
public:
    using Base::Base;
    /* ... */
};
```

如上 using 声明,对于基类的每个构造函数,编译器都生成一个与之对应(形参列表完全相同)的派生类构造函数。生成如下类型构造函数:

```cpp
derived(parms) : base(args) { }
```

504 505 506 507 508 509 510 511 512
#### using 指示

`using 指示` 使得某个特定命名空间中所有名字都可见,这样我们就无需再为它们添加任何前缀限定符了。如:

```cpp
using namespace_name name;
```

#### 尽量少使用 `using 指示` 污染命名空间
辉哈's avatar
辉哈 已提交
513

514
> 一般说来,使用 using 命令比使用 using 编译命令更安全,这是由于它**只导入了制定的名称**。如果该名称与局部名称发生冲突,编译器将**发出指示**。using编译命令导入所有的名称,包括可能并不需要的名称。如果与局部名称发生冲突,则**局部名称将覆盖名称空间版本**,而编译器**并不会发出警告**。另外,名称空间的开放性意味着名称空间的名称可能分散在多个地方,这使得难以准确知道添加了哪些名称。
辉哈's avatar
辉哈 已提交
515

516 517 518
<details><summary>using 使用</summary> 

尽量少使用 `using 指示`
辉哈's avatar
辉哈 已提交
519 520 521 522 523

```cpp
using namespace std;
```

524
应该多使用 `using 声明`
辉哈's avatar
辉哈 已提交
525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542

```cpp
int x;
std::cin >> x ;
std::cout << x << std::endl;
```

或者

```cpp
using std::cin;
using std::cout;
using std::endl;
int x;
cin >> x;
cout << x << endl;
```

543 544
</details>

辉哈's avatar
辉哈 已提交
545
### :: 范围解析运算符
辉哈's avatar
辉哈 已提交
546

547
#### 分类
辉哈's avatar
辉哈 已提交
548

549 550 551 552 553
1. 全局作用域符(`::name`):用于类型名称(类、类成员、成员函数、变量等)前,表示作用域为全局命名空间
2. 类作用域符(`class::name`):用于表示指定类型的作用域范围是具体某个类的
3. 命名空间作用域符(`namespace::name`):用于表示指定类型的作用域范围是具体某个命名空间的

<details><summary>:: 使用</summary> 
辉哈's avatar
辉哈 已提交
554 555

```cpp
556
int count = 0;        // 全局(::)的 count
557 558 559

class A {
public:
560
    static int count; // 类 A 的 count(A::count)
561
};
辉哈's avatar
辉哈 已提交
562 563

int main() {
564 565
    ::count = 1;      // 设置全局的 count 的值为 1

566
    A::count = 2;     // 设置类 A 的 count 为 2
567 568 569 570 571

    int count = 0;    // 局部的 count
    count = 3;        // 设置局部的 count 的值为 3

    return 0;
辉哈's avatar
辉哈 已提交
572 573 574
}
```

575 576
</details>

577 578 579 580 581 582 583 584 585 586 587 588 589 590 591
### enum 枚举类型

#### 限定作用域的枚举类型

```cpp
enum class open_modes { input, output, append };
```

#### 不限定作用域的枚举类型

```cpp
enum color { red, yellow, green };
enum { floatPrec = 6, doublePrec = 10 };
```

辉哈's avatar
辉哈 已提交
592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620
### decltype

decltype 关键字用于检查实体的声明类型或表达式的类型及值分类。语法:

```cpp
decltype ( expression )
```

<details><summary>decltype 使用</summary> 

```cpp
// 尾置返回允许我们在参数列表之后声明返回类型
template <typename It>
auto fcn(It beg, It end) -> decltype(*beg)
{
    // 处理序列
    return *beg;    // 返回序列中一个元素的引用
}
// 为了使用模板参数成员,必须用 typename
template <typename It>
auto fcn2(It beg, It end) -> typename remove_reference<decltype(*beg)>::type
{
    // 处理序列
    return *beg;    // 返回序列中一个元素的拷贝
}
```

</details>

621 622 623 624 625 626 627 628
### 引用

#### 左值引用

常规引用,一般表示对象的身份。

#### 右值引用

辉哈's avatar
辉哈 已提交
629
右值引用就是必须绑定到右值(一个临时对象、将要销毁的对象)的引用,一般表示对象的值。
630 631 632 633 634 635 636 637 638

右值引用可实现转移语义(Move Sementics)和精确传递(Perfect Forwarding),它的主要目的有两个方面:

* 消除两个对象交互时不必要的对象拷贝,节省运算存储资源,提高效率。
* 能够更简洁明确地定义泛型函数。

#### 引用折叠

* `X& &``X& &&``X&& &` 可折叠成 `X&`
辉哈's avatar
辉哈 已提交
639
* `X&& &&` 可折叠成 `X&&`
640

辉哈's avatar
辉哈 已提交
641 642
### 宏

643
* 宏定义可以实现类似于函数的功能,但是它终归不是函数,而宏定义中括弧中的“参数”也不是真的参数,在宏展开的时候对 “参数” 进行的是一对一的替换。
辉哈's avatar
辉哈 已提交
644

645
### 成员初始化列表
辉哈's avatar
辉哈 已提交
646 647 648 649 650 651 652 653 654

好处

* 更高效:少了一次调用默认构造函数的过程。
* 有些场合必须要用初始化列表:
  1. 常量成员,因为常量只能初始化不能赋值,所以必须放在初始化列表里面
  2. 引用类型,引用必须在定义的时候初始化,并且不能重新赋值,所以也要写在初始化列表里面
  3. 没有默认构造函数的类类型,因为使用初始化列表可以不必调用默认构造函数来初始化,而是直接调用拷贝构造函数初始化。

655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712
### initializer_list 列表初始化【C++11】

用花括号初始化器列表列表初始化一个对象,其中对应构造函数接受一个 `std::initializer_list` 参数.

<details><summary>initializer_list 使用</summary> 

```cpp
#include <iostream>
#include <vector>
#include <initializer_list>
 
template <class T>
struct S {
    std::vector<T> v;
    S(std::initializer_list<T> l) : v(l) {
         std::cout << "constructed with a " << l.size() << "-element list\n";
    }
    void append(std::initializer_list<T> l) {
        v.insert(v.end(), l.begin(), l.end());
    }
    std::pair<const T*, std::size_t> c_arr() const {
        return {&v[0], v.size()};  // 在 return 语句中复制列表初始化
                                   // 这不使用 std::initializer_list
    }
};
 
template <typename T>
void templated_fn(T) {}
 
int main()
{
    S<int> s = {1, 2, 3, 4, 5}; // 复制初始化
    s.append({6, 7, 8});      // 函数调用中的列表初始化
 
    std::cout << "The vector size is now " << s.c_arr().second << " ints:\n";
 
    for (auto n : s.v)
        std::cout << n << ' ';
    std::cout << '\n';
 
    std::cout << "Range-for over brace-init-list: \n";
 
    for (int x : {-1, -2, -3}) // auto 的规则令此带范围 for 工作
        std::cout << x << ' ';
    std::cout << '\n';
 
    auto al = {10, 11, 12};   // auto 的特殊规则
 
    std::cout << "The list bound to auto has size() = " << al.size() << '\n';
 
//    templated_fn({1, 2, 3}); // 编译错误!“ {1, 2, 3} ”不是表达式,
                             // 它无类型,故 T 无法推导
    templated_fn<std::initializer_list<int>>({1, 2, 3}); // OK
    templated_fn<std::vector<int>>({1, 2, 3});           // 也 OK
}
```

</details>
辉哈's avatar
辉哈 已提交
713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735

### 面向对象

面向对象程序设计(Object-oriented programming,OOP)是种具有对象概念的程序编程典范,同时也是一种程序开发的抽象方针。

![面向对象特征](http://img.my.csdn.net/uploads/201211/22/1353564524_6375.png)

面向对象三大特征 —— 封装、继承、多态

### 封装

* 把客观事物封装成抽象的类,并且类可以把自己的数据和方法只让可信的类或者对象操作,对不可信的进行信息隐藏。
* 关键字:public, protected, friendly, private。不写默认为 friendly。

| 关键字 | 当前类 | 包内 | 子孙类 | 包外 |
| --- | --- | --- | --- | --- |
| public | √ | √ | √ | √ |
| protected | √ | √ | √ | × |
| friendly | √ | √ | × | × |
| private | √ | × | × | × |

### 继承

736
* 基类(父类)——&gt; 派生类(子类)
辉哈's avatar
辉哈 已提交
737 738 739

### 多态

740 741
* 多态,即多种状态,在面向对象语言中,接口的多种不同的实现方式即为多态。
* C++ 多态有两种:静态多态(早绑定)、动态多态(晚绑定)。静态多态是通过函数重载实现的;动态多态是通过虚函数实现的。
辉哈's avatar
辉哈 已提交
742 743 744 745
* 多态是以封装和继承为基础的。

#### 静态多态(早绑定)

746 747
函数重载

辉哈's avatar
辉哈 已提交
748 749 750 751 752 753
```cpp
class A
{
public:
    void do(int a);
    void do(int a, int b);
754
};
辉哈's avatar
辉哈 已提交
755 756 757 758
```

#### 动态多态(晚绑定)

759
* 虚函数:用 virtual 修饰成员函数,使其成为虚函数
辉哈's avatar
辉哈 已提交
760 761 762

**注意:**

763 764
* 普通函数(非类成员函数)不能是虚函数
* 静态函数(static)不能是虚函数
765
* 构造函数不能是虚函数(因为在调用构造函数时,虚表指针并没有在对象的内存空间中,必须要构造函数调用完成后才会形成虚表指针)
766
* 内联函数不能是表现多态性时的虚函数,解释见:[虚函数(virtual)可以是内联函数(inline)吗?](https://github.com/huihut/interview#%E8%99%9A%E5%87%BD%E6%95%B0virtual%E5%8F%AF%E4%BB%A5%E6%98%AF%E5%86%85%E8%81%94%E5%87%BD%E6%95%B0inline%E5%90%97)
辉哈's avatar
辉哈 已提交
767

768 769
<details><summary>动态多态使用</summary> 

辉哈's avatar
辉哈 已提交
770
```cpp
771
class Shape                     // 形状类
辉哈's avatar
辉哈 已提交
772 773 774 775 776 777
{
public:
    virtual double calcArea()
    {
        ...
    }
778
    virtual ~Shape();
779
};
780
class Circle : public Shape     // 圆形类
辉哈's avatar
辉哈 已提交
781 782 783 784
{
public:
    virtual double calcArea();
    ...
785
};
786
class Rect : public Shape       // 矩形类
辉哈's avatar
辉哈 已提交
787 788 789 790
{
public:
    virtual double calcArea();
    ...
791
};
辉哈's avatar
辉哈 已提交
792 793 794 795
int main()
{
    Shape * shape1 = new Circle(4.0);
    Shape * shape2 = new Rect(5.0, 6.0);
796 797
    shape1->calcArea();         // 调用圆形类里面的方法
    shape2->calcArea();         // 调用矩形类里面的方法
798 799 800 801
    delete shape1;
    shape1 = nullptr;
    delete shape2;
    shape2 = nullptr;
802
    return 0;
辉哈's avatar
辉哈 已提交
803 804 805
}
```

806 807 808 809 810 811 812
</details>

### 虚析构函数

虚析构函数是为了解决基类的指针指向派生类对象,并用基类的指针删除派生类对象。

<details><summary>虚析构函数使用</summary> 
辉哈's avatar
辉哈 已提交
813 814 815 816 817

```cpp
class Shape
{
public:
818
    Shape();                    // 构造函数不能是虚函数
辉哈's avatar
辉哈 已提交
819
    virtual double calcArea();
820
    virtual ~Shape();           // 虚析构函数
821
};
822
class Circle : public Shape     // 圆形类
辉哈's avatar
辉哈 已提交
823 824 825 826
{
public:
    virtual double calcArea();
    ...
827
};
辉哈's avatar
辉哈 已提交
828 829 830 831
int main()
{
    Shape * shape1 = new Circle(4.0);
    shape1->calcArea();    
832
    delete shape1;  // 因为Shape有虚析构函数,所以delete释放内存时,先调用子类析构函数,再调用基类析构函数,防止内存泄漏。
辉哈's avatar
辉哈 已提交
833 834 835 836 837
    shape1 = NULL;
    return 0
}
```

838 839 840 841 842
</details>

### 纯虚函数

纯虚函数是一种特殊的虚函数,在基类中不能对虚函数给出有意义的实现,而把它声明为纯虚函数,它的实现留给该基类的派生类去做。
辉哈's avatar
辉哈 已提交
843 844 845 846 847

```cpp
virtual int A() = 0;
```

848 849
### 虚函数、纯虚函数

850
[CSDN . C++ 中的虚函数、纯虚函数区别和联系](https://blog.csdn.net/u012260238/article/details/53610462)
851 852 853

* 类里如果声明了虚函数,这个函数是实现的,哪怕是空实现,它的作用就是为了能让这个函数在它的子类里面可以被覆盖,这样的话,这样编译器就可以使用后期绑定来达到多态了。纯虚函数只是一个接口,是个函数的声明而已,它要留到子类里去实现。 
* 虚函数在子类里面也可以不重载的;但纯虚函数必须在子类去实现。
854 855
* 虚函数的类用于 “实作继承”,继承接口的同时也继承了父类的实现。当然大家也可以完成自己的实现。纯虚函数关注的是接口的统一性,实现由子类完成。 
* 带纯虚函数的类叫虚基类,这种基类不能直接生成对象,而只有被继承,并重写其虚函数后,才能使用。这样的类也叫抽象类。抽象类和大家口头常说的虚基类还是有区别的,在 C# 中用 abstract 定义抽象类,而在 C++ 中有抽象类的概念,但是没有这个关键字。抽象类被继承后,子类可以继续是抽象类,也可以是普通类,而虚基类,是含有纯虚函数的类,它如果被继承,那么子类就必须实现虚基类里面的所有纯虚函数,其子类不能是抽象类。
856 857 858

### 虚函数指针、虚函数表

859
* 虚函数指针:在含有虚函数类的对象中,指向虚函数表,在运行时确定。
860
* 虚函数表:在程序只读数据段(`.rodata section`,见:[目标文件存储结构](#%E7%9B%AE%E6%A0%87%E6%96%87%E4%BB%B6%E5%AD%98%E5%82%A8%E7%BB%93%E6%9E%84)),存放虚函数指针,如果派生类实现了基类的某个虚函数,则在虚表中覆盖原本基类的那个虚函数指针,在编译时根据类的声明创建。
861

862
### 虚继承
辉哈's avatar
辉哈 已提交
863 864 865 866 867

虚继承用于解决多继承条件下的菱形继承问题(浪费存储空间、存在二义性)。

底层实现原理与编译器相关,一般通过**虚基类指针****虚基类表**实现,每个虚继承的子类都有一个虚基类指针(占用一个指针的存储空间,4字节)和虚基类表(不占用类对象的存储空间)(需要强调的是,虚基类依旧会在子类里面存在拷贝,只是仅仅最多存在一份而已,并不是不在子类里面了);当虚继承的子类被当做父类继承时,虚基类指针也会被继承。

868
实际上,vbptr 指的是虚基类表指针(virtual base table pointer),该指针指向了一个虚基类表(virtual table),虚表中记录了虚基类与本类的偏移地址;通过偏移地址,这样就找到了虚基类成员,而虚继承也不用像普通多继承那样维持着公共基类(虚基类)的两份同样的拷贝,节省了存储空间。
辉哈's avatar
辉哈 已提交
869

870
### 虚继承、虚函数
辉哈's avatar
辉哈 已提交
871 872 873 874 875 876 877 878 879 880

* 相同之处:都利用了虚指针(均占用类的存储空间)和虚表(均不占用类的存储空间)
* 不同之处:
    * 虚继承
        * 虚基类依旧存在继承类中,只占用存储空间
        * 虚基类表存储的是虚基类相对直接继承类的偏移
    * 虚函数
        * 虚函数不占用存储空间
        * 虚函数表存储的是虚函数地址

881 882 883 884 885
### 模板类、成员模板、虚函数

* 模板类中可以使用虚函数
* 一个类(无论是普通类还是类模板)的成员模板(本身是模板的成员函数)不能是虚函数

886 887 888 889 890 891 892 893 894 895
### 抽象类、接口类、聚合类

* 抽象类:含有纯虚函数的类
* 接口类:仅含有纯虚函数的抽象类
* 聚合类:用户可以直接访问其成员,并且具有特殊的初始化语法形式。满足如下特点:
    * 所有成员都是 public
    * 没有有定于任何构造函数
    * 没有类内初始化
    * 没有基类,也没有 virtual 函数

辉哈's avatar
辉哈 已提交
896 897 898 899 900
### 内存分配和管理

#### malloc、calloc、realloc、alloca

1. malloc:申请指定字节数的内存。申请到的内存中的初始值不确定。
901 902 903
2. calloc:为指定长度的对象,分配能容纳其指定个数的内存。申请到的内存的每一位(bit)都初始化为 0。
3. realloc:更改以前分配的内存长度(增加或减少)。当增加长度时,可能需将以前分配区的内容移到另一个足够大的区域,而新增区域内的初始值则不确定。
4. alloca:在栈上申请内存。程序在出栈的时候,会自动释放内存。但是需要注意的是,alloca 不具可移植性, 而且在没有传统堆栈的机器上很难实现。alloca 不宜使用在必须广泛移植的程序中。C99 中支持变长数组 (VLA),可以用来替代 alloca。
辉哈's avatar
辉哈 已提交
904 905 906

#### malloc、free

907 908 909 910
用于分配、释放内存

<details><summary>malloc、free 使用</summary> 

辉哈's avatar
辉哈 已提交
911 912 913 914 915 916 917 918 919 920 921 922 923 924
申请内存,确认是否申请成功

```cpp
char *str = (char*) malloc(100);
assert(str != nullptr);
```

释放内存后指针置空

```cpp
free(p); 
p = nullptr;
```

925 926
</details>

辉哈's avatar
辉哈 已提交
927 928
#### new、delete

929
1. new / new[]:完成两件事,先底层调用 malloc 分了配内存,然后调用构造函数(创建对象)。
930 931
2. delete/delete[]:也完成两件事,先调用析构函数(清理资源),然后底层调用 free 释放空间。
3. new 在申请内存时会自动计算所需字节数,而 malloc 则需我们自己输入申请内存空间的字节数。
辉哈's avatar
辉哈 已提交
932

933 934 935 936
<details><summary>new、delete 使用</summary> 

申请内存,确认是否申请成功

辉哈's avatar
辉哈 已提交
937 938 939
```cpp
int main()
{
辉哈's avatar
辉哈 已提交
940 941
    T* t = new T();     // 先内存分配 ,再构造函数
    delete t;           // 先析构函数,再内存释放
辉哈's avatar
辉哈 已提交
942 943 944 945
    return 0;
}
```

946 947
</details>

948 949 950 951 952 953 954 955 956 957 958 959 960 961
#### 定位 new

定位 new(placement new)允许我们向 new 传递额外的参数。

```cpp
new (palce_address) type
new (palce_address) type (initializers)
new (palce_address) type [size]
new (palce_address) type [size] { braced initializer list }
```

* `palce_address` 是个指针
* `initializers` 提供一个(可能为空的)以逗号分隔的初始值列表

962
### delete this 合法吗?
963 964 965 966 967

[Is it legal (and moral) for a member function to say delete this?](https://isocpp.org/wiki/faq/freestore-mgmt#delete-this)

合法,但:

968 969 970
1. 必须保证 this 对象是通过 `new`(不是 `new[]`、不是 placement new、不是栈上、不是全局、不是其他对象成员)分配的
2. 必须保证调用 `delete this` 的成员函数是最后一个调用 this 的成员函数
3. 必须保证成员函数的 `delete this ` 后面没有调用 this 了
辉哈's avatar
辉哈 已提交
971
4. 必须保证 `delete this` 后没有人使用了
972

973
### 如何定义一个只能在堆上(栈上)生成对象的类?
974 975 976

[如何定义一个只能在堆上(栈上)生成对象的类?](https://www.nowcoder.com/questionTerminal/0a584aa13f804f3ea72b442a065a7618)

977
#### 只能在堆上
978 979 980 981 982

方法:将析构函数设置为私有

原因:C++ 是静态绑定语言,编译器管理栈上对象的生命周期,编译器在为类对象分配栈空间时,会先检查类的析构函数的访问性。若析构函数不可访问,则不能在栈上创建对象。

983
#### 只能在栈上
984 985 986

方法:将 new 和 delete 重载为私有

辉哈's avatar
辉哈 已提交
987
原因:在堆上生成对象,使用 new 关键词操作,其过程分为两阶段:第一阶段,使用 new 在堆上寻找可用内存,分配给对象;第二阶段,调用构造函数生成对象。将 new 操作设置为私有,那么第一阶段就无法完成,就不能够在堆上生成对象。
988

辉哈's avatar
辉哈 已提交
989 990
### 智能指针

991
#### C++ 标准库(STL)中
辉哈's avatar
辉哈 已提交
992 993 994

头文件:`#include <memory>`

995
#### C++ 98
辉哈's avatar
辉哈 已提交
996 997 998 999 1000

```cpp
std::auto_ptr<std::string> ps (new std::string(str))
```

1001
#### C++ 11
辉哈's avatar
辉哈 已提交
1002 1003 1004 1005

1. shared_ptr
2. unique_ptr
3. weak_ptr
1006
4. auto_ptr(被 C++11 弃用)
1007

1008 1009
* Class shared_ptr 实现共享式拥有(shared ownership)概念。多个智能指针指向相同对象,该对象和其相关资源会在 “最后一个 reference 被销毁” 时被释放。为了在结构较复杂的情景中执行上述工作,标准库提供 weak_ptr、bad_weak_ptr 和 enable_shared_from_this 等辅助类。
* Class unique_ptr 实现独占式拥有(exclusive ownership)或严格拥有(strict ownership)概念,保证同一时间内只有一个智能指针可以指向该对象。你可以移交拥有权。它对于避免内存泄漏(resource leak)——如 new 后忘记 delete ——特别有用。
1010 1011 1012 1013 1014

##### shared_ptr

多个智能指针可以共享同一个对象,对象的最末一个拥有着有责任销毁对象,并清理与该对象相关的所有资源。

辉哈's avatar
辉哈 已提交
1015 1016
* 支持定制型删除器(custom deleter),可防范 Cross-DLL 问题(对象在动态链接库(DLL)中被 new 创建,却在另一个 DLL 内被 delete 销毁)、自动解除互斥锁

1017 1018
##### weak_ptr

1019
weak_ptr 允许你共享但不拥有某对象,一旦最末一个拥有该对象的智能指针失去了所有权,任何 weak_ptr 都会自动成空(empty)。因此,在 default 和 copy 构造函数之外,weak_ptr 只提供 “接受一个 shared_ptr” 的构造函数。
1020

辉哈's avatar
辉哈 已提交
1021 1022
* 可打破环状引用(cycles of references,两个其实已经没有被使用的对象彼此互指,使之看似还在 “被使用” 的状态)的问题

1023 1024
##### unique_ptr

1025
unique_ptr 是 C++11 才开始提供的类型,是一种在异常时可以帮助避免资源泄漏的智能指针。采用独占式拥有,意味着可以确保一个对象和其相应的资源同一时间只被一个 pointer 拥有。一旦拥有着被销毁或编程 empty,或开始拥有另一个对象,先前拥有的那个对象就会被销毁,其任何相应资源亦会被释放。
1026

辉哈's avatar
辉哈 已提交
1027
* unique_ptr 用于取代 auto_ptr
1028 1029

##### auto_ptr
辉哈's avatar
辉哈 已提交
1030

1031
被 c++11 弃用,原因是缺乏语言特性如 “针对构造和赋值” 的 `std::move` 语义,以及其他瑕疵。
辉哈's avatar
辉哈 已提交
1032

辉哈's avatar
辉哈 已提交
1033 1034
##### auto_ptr 与 unique_ptr 比较

1035 1036
* auto_ptr 可以赋值拷贝,复制拷贝后所有权转移;unqiue_ptr 无拷贝赋值语义,但实现了`move` 语义;
* auto_ptr 对象不能管理数组(析构调用 `delete`),unique_ptr 可以管理数组(析构调用 `delete[]` );
辉哈's avatar
辉哈 已提交
1037

1038 1039 1040 1041 1042 1043 1044 1045 1046 1047 1048 1049 1050 1051 1052 1053 1054 1055
### 强制类型转换运算符

[MSDN . 强制转换运算符](https://msdn.microsoft.com/zh-CN/library/5f6c9f8h.aspx)

#### static_cast

* 用于非多态类型的转换
* 不执行运行时类型检查(转换安全性不如 dynamic_cast)
* 通常用于转换数值数据类型(如 float -> int)
* 可以在整个类层次结构中移动指针,子类转化为父类安全(向上转换),父类转化为子类不安全(因为子类可能有不在父类的字段或方法)

> 向上转换是一种隐式转换。

#### dynamic_cast

* 用于多态类型的转换
* 执行行运行时类型检查
* 只适用于指针或引用
1056
* 对不明确的指针的转换将失败(返回 nullptr),但不引发异常
1057 1058 1059 1060 1061 1062 1063 1064 1065 1066
* 可以在整个类层次结构中移动指针,包括向上转换、向下转换

#### const_cast 

* 用于删除 const、volatile 和 __unaligned 特性(如将 const int 类型转换为 int 类型 )

#### reinterpret_cast

* 用于位的简单重新解释
* 滥用 reinterpret_cast 运算符可能很容易带来风险。 除非所需转换本身是低级别的,否则应使用其他强制转换运算符之一。
1067
* 允许将任何指针转换为任何其他指针类型(如 `char*``int*``One_class*``Unrelated_class*` 之类的转换,但其本身并不安全)
1068 1069 1070 1071 1072 1073 1074 1075
* 也允许将任何整数类型转换为任何指针类型以及反向转换。
* reinterpret_cast 运算符不能丢掉 const、volatile 或 __unaligned 特性。 
* reinterpret_cast 的一个实际用途是在哈希函数中,即,通过让两个不同的值几乎不以相同的索引结尾的方式将值映射到索引。

#### bad_cast

* 由于强制转换为引用类型失败,dynamic_cast 运算符引发 bad_cast 异常。

1076 1077
<details><summary>bad_cast 使用</summary> 

1078 1079 1080 1081 1082 1083 1084 1085 1086
```cpp
try {  
    Circle& ref_circle = dynamic_cast<Circle&>(ref_shape);   
}  
catch (bad_cast b) {  
    cout << "Caught: " << b.what();  
} 
```

1087 1088
</details>

1089 1090 1091 1092 1093 1094 1095 1096 1097 1098 1099 1100 1101 1102 1103 1104 1105 1106
### 运行时类型信息 (RTTI) 

#### dynamic_cast

* 用于多态类型的转换

#### typeid

* typeid 运算符允许在运行时确定对象的类型
* type\_id 返回一个 type\_info 对象的引用
* 如果想通过基类的指针获得派生类的数据类型,基类必须带有虚函数
* 只能获取对象的实际类型

#### type_info

* type_info 类描述编译器在程序中生成的类型信息。 此类的对象可以有效存储指向类型的名称的指针。 type_info 类还可存储适合比较两个类型是否相等或比较其排列顺序的编码值。 类型的编码规则和排列顺序是未指定的,并且可能因程序而异。
* 头文件:`typeinfo`

1107
<details><summary>typeid、type_info 使用</summary>
辉哈's avatar
辉哈 已提交
1108 1109

```cpp
1110
class Flyable                       // 能飞的
辉哈's avatar
辉哈 已提交
1111 1112
{
public:
辉哈's avatar
辉哈 已提交
1113 1114
    virtual void takeoff() = 0;     // 起飞
    virtual void land() = 0;        // 降落
1115
};
1116
class Bird : public Flyable         // 鸟
辉哈's avatar
辉哈 已提交
1117 1118
{
public:
辉哈's avatar
辉哈 已提交
1119
    void foraging() {...}           // 觅食
辉哈's avatar
辉哈 已提交
1120 1121
    virtual void takeoff() {...}
    virtual void land() {...}
1122
};
1123
class Plane : public Flyable        // 飞机
辉哈's avatar
辉哈 已提交
1124 1125
{
public:
辉哈's avatar
辉哈 已提交
1126
    void carry() {...}              // 运输
辉哈's avatar
辉哈 已提交
1127 1128
    virtual void take off() {...}
    virtual void land() {...}
1129
};
辉哈's avatar
辉哈 已提交
1130 1131 1132 1133 1134 1135 1136 1137 1138 1139 1140

class type_info
{
public:
    const char* name() const;
    bool operator == (const type_info & rhs) const;
    bool operator != (const type_info & rhs) const;
    int before(const type_info & rhs) const;
    virtual ~type_info();
private:
    ...
1141
};
辉哈's avatar
辉哈 已提交
1142

1143
class doSomething(Flyable *obj)                 // 做些事情
辉哈's avatar
辉哈 已提交
1144 1145 1146
{
    obj->takeoff();

1147
    cout << typeid(*obj).name() << endl;        // 输出传入对象类型("class Bird" or "class Plane")
辉哈's avatar
辉哈 已提交
1148

1149
    if(typeid(*obj) == typeid(Bird))            // 判断对象类型
辉哈's avatar
辉哈 已提交
1150
    {
1151
        Bird *bird = dynamic_cast<Bird *>(obj); // 对象转化
辉哈's avatar
辉哈 已提交
1152 1153 1154 1155
        bird->foraging();
    }

    obj->land();
1156
};
辉哈's avatar
辉哈 已提交
1157 1158
```

1159 1160
</details>

1161 1162
### Effective C++

辉哈's avatar
辉哈 已提交
1163
1. 视 C++ 为一个语言联邦(C、Object-Oriented C++、Template C++、STL)
1164
2. 尽量以 `const``enum``inline` 替换 `#define`(宁可以编译器替换预处理器)
辉哈's avatar
辉哈 已提交
1165
3. 尽可能使用 const
1166
4. 确定对象被使用前已先被初始化(构造时赋值(copy 构造函数)比 default 构造后赋值(copy assignment)效率高)
辉哈's avatar
辉哈 已提交
1167 1168 1169 1170 1171
5. 了解 C++ 默默编写并调用哪些函数(编译器暗自为 class 创建 default 构造函数、copy 构造函数、copy assignment 操作符、析构函数)
6. 若不想使用编译器自动生成的函数,就应该明确拒绝(将不想使用的成员函数声明为 private,并且不予实现)
7. 为多态基类声明 virtual 析构函数(如果 class 带有任何 virtual 函数,它就应该拥有一个 virtual 析构函数)
8. 别让异常逃离析构函数(析构函数应该吞下不传播异常,或者结束程序,而不是吐出异常;如果要处理异常应该在非析构的普通函数处理)
9. 绝不在构造和析构过程中调用 virtual 函数(因为这类调用从不下降至 derived class)
1172 1173 1174
10.`operator=` 返回一个 `reference to *this` (用于连锁赋值)
11.`operator=` 中处理 “自我赋值”
12. 赋值对象时应确保复制 “对象内的所有成员变量” 及 “所有 base class 成分”(调用基类复制构造函数)
辉哈's avatar
辉哈 已提交
1175
13. 以对象管理资源(资源在构造函数获得,在析构函数释放,建议使用智能指针,资源取得时机便是初始化时机(Resource Acquisition Is Initialization,RAII))
1176
14. 在资源管理类中小心 copying 行为(普遍的 RAII class copying 行为是:抑制 copying、引用计数、深度拷贝、转移底部资源拥有权(类似 auto_ptr))
辉哈's avatar
辉哈 已提交
1177 1178 1179 1180 1181 1182 1183 1184 1185
15. 在资源管理类中提供对原始资源(raw resources)的访问(对原始资源的访问可能经过显式转换或隐式转换,一般而言显示转换比较安全,隐式转换对客户比较方便)
16. 成对使用 new 和 delete 时要采取相同形式(`new` 中使用 `[]``delete []``new` 中不使用 `[]``delete`
17. 以独立语句将 newed 对象存储于(置入)智能指针(如果不这样做,可能会因为编译器优化,导致难以察觉的资源泄漏)
18. 让接口容易被正确使用,不易被误用(促进正常使用的办法:接口的一致性、内置类型的行为兼容;阻止误用的办法:建立新类型,限制类型上的操作,约束对象值、消除客户的资源管理责任)
19. 设计 class 犹如设计 type,需要考虑对象创建、销毁、初始化、赋值、值传递、合法值、继承关系、转换、一般化等等。
20. 宁以 pass-by-reference-to-const 替换 pass-by-value (前者通常更高效、避免切割问题(slicing problem),但不适用于内置类型、STL迭代器、函数对象)
21. 必须返回对象时,别妄想返回其 reference(绝不返回 pointer 或 reference 指向一个 local stack 对象,或返回 reference 指向一个 heap-allocated 对象,或返回 pointer 或 reference 指向一个 local static 对象而有可能同时需要多个这样的对象。)
22. 将成员变量声明为 private(为了封装、一致性、对其读写精确控制等)
23. 宁以 non-member、non-friend 替换 member 函数(可增加封装性、包裹弹性(packaging flexibility)、机能扩充性)
辉哈's avatar
辉哈 已提交
1186
24. 若所有参数(包括被this指针所指的那个隐喻参数)皆须要类型转换,请为此采用 non-member 函数
1187 1188
25. 考虑写一个不抛异常的 swap 函数
26. 尽可能延后变量定义式的出现时间(可增加程序清晰度并改善程序效率)
辉哈's avatar
辉哈 已提交
1189 1190 1191
27. 尽量少做转型动作(旧式:`(T)expression``T(expression)`;新式:`const_cast<T>(expression)``dynamic_cast<T>(expression)``reinterpret_cast<T>(expression)``static_cast<T>(expression)`、;尽量避免转型、注重效率避免 dynamic_casts、尽量设计成无需转型、可把转型封装成函数、宁可用新式转型)
28. 避免使用 handles(包括 引用、指针、迭代器)指向对象内部(以增加封装性、使 const 成员函数的行为更像 const、降低 “虚吊号码牌”(dangling handles,如悬空指针等)的可能性)

1192

辉哈's avatar
辉哈 已提交
1193 1194
### Google C++ Style Guide

1195 1196
<details><summary>Google C++ Style Guide 图</summary>

辉哈's avatar
辉哈 已提交
1197 1198
![Google C++ Style Guide](http://img.blog.csdn.net/20140713220242000)

辉哈's avatar
辉哈 已提交
1199
> 图片来源于:[CSDN . 一张图总结Google C++编程规范(Google C++ Style Guide)](http://blog.csdn.net/voidccc/article/details/37599203)
辉哈's avatar
辉哈 已提交
1200

1201 1202
</details>

辉哈's avatar
辉哈 已提交
1203 1204
## STL

辉哈's avatar
辉哈 已提交
1205 1206
### 索引

辉哈's avatar
辉哈 已提交
1207
[STL 方法含义](https://github.com/huihut/interview/tree/master/STL)
辉哈's avatar
辉哈 已提交
1208 1209

### 容器
辉哈's avatar
辉哈 已提交
1210

1211 1212
容器 | 底层数据结构 | 有无序 | 可不可重复 | 其他
---|---|---|---|---
辉哈's avatar
辉哈 已提交
1213 1214 1215 1216 1217 1218 1219 1220 1221 1222 1223
[array](https://github.com/huihut/interview/tree/master/STL#array)|数组|无序|可重复|支持快速随机访问
[vector](https://github.com/huihut/interview/tree/master/STL#vector)|数组|无序|可重复|支持快速随机访问
[list](https://github.com/huihut/interview/tree/master/STL#list)|双向链表|无序|可重复|支持快速增删
[deque](https://github.com/huihut/interview/tree/master/STL#deque)|双端队列(一个中央控制器+多个缓冲区)|无序|可重复|支持首尾快速增删,支持随机访问
[stack](https://github.com/huihut/interview/tree/master/STL#stack)|deque 或 list 封闭头端开口|无序|可重复|不用 vector 的原因应该是容量大小有限制,扩容耗时
[queue](https://github.com/huihut/interview/tree/master/STL#queue)|deque 或 list 封闭底端出口和前端入口|无序|可重复|不用 vector 的原因应该是容量大小有限制,扩容耗时
[priority_queue](https://github.com/huihut/interview/tree/master/STL#priority_queue)|vector|无序|可重复|vector容器+heap处理规则
[set](https://github.com/huihut/interview/tree/master/STL#set)|红黑树|有序|不可重复|
[multiset](https://github.com/huihut/interview/tree/master/STL#multiset)|红黑树|有序|可重复|
[map](https://github.com/huihut/interview/tree/master/STL#map)|红黑树|有序|不可重复|
[multimap](https://github.com/huihut/interview/tree/master/STL#multimap)|红黑树|有序|可重复|
1224 1225 1226 1227 1228
hash_set|hash表|无序|不可重复|
hash_multiset|hash表|无序|可重复|
hash_map|hash表|无序|不可重复|
hash_multimap|hash表|无序|可重复|

辉哈's avatar
辉哈 已提交
1229 1230
## 数据结构

辉哈's avatar
辉哈 已提交
1231 1232 1233 1234
### 顺序结构

#### 顺序栈(Sequence Stack)

辉哈's avatar
辉哈 已提交
1235 1236
[SqStack.cpp](DataStructure/SqStack.cpp)

1237 1238
<details><summary>顺序栈数据结构和图片</summary>

辉哈's avatar
辉哈 已提交
1239 1240 1241 1242 1243 1244 1245 1246 1247 1248 1249
```cpp
typedef struct {
	ElemType *elem;
	int top;
	int size;
	int increment;
} SqSrack;
```

![](images/SqStack.png)

1250 1251
</details>

辉哈's avatar
辉哈 已提交
1252 1253
#### 队列(Sequence Queue)

1254 1255
<details><summary>队列数据结构</summary>

辉哈's avatar
辉哈 已提交
1256 1257 1258 1259 1260 1261 1262 1263 1264
```cpp
typedef struct {
	ElemType * elem;
	int front;
	int rear;
	int maxSize;
}SqQueue;
```

1265 1266
</details>

辉哈's avatar
辉哈 已提交
1267 1268
##### 非循环队列

1269 1270
<details><summary>非循环队列图片</summary>

辉哈's avatar
辉哈 已提交
1271 1272 1273 1274
![](images/SqQueue.png)

`SqQueue.rear++`

1275 1276
</details>

辉哈's avatar
辉哈 已提交
1277 1278
##### 循环队列

1279 1280
<details><summary>循环队列图片</summary>

辉哈's avatar
辉哈 已提交
1281 1282 1283 1284
![](images/SqLoopStack.png)

`SqQueue.rear = (SqQueue.rear + 1) % SqQueue.maxSize`

1285 1286
</details>

辉哈's avatar
辉哈 已提交
1287 1288
#### 顺序表(Sequence List)

辉哈's avatar
辉哈 已提交
1289 1290
[SqList.cpp](DataStructure/SqList.cpp)

1291 1292
<details><summary>顺序表数据结构和图片</summary>

辉哈's avatar
辉哈 已提交
1293 1294 1295 1296 1297 1298 1299 1300 1301 1302 1303
```cpp
typedef struct {
	ElemType *elem;
	int length;
	int size;
	int increment;
} SqList;
```

![](images/SqList.png)

1304 1305 1306
</details>


辉哈's avatar
辉哈 已提交
1307 1308
### 链式结构

辉哈's avatar
辉哈 已提交
1309 1310 1311 1312
[LinkList.cpp](DataStructure/LinkList.cpp)

[LinkList_with_head.cpp](DataStructure/LinkList_with_head.cpp)

1313 1314
<details><summary>链式数据结构</summary>

1315 1316 1317 1318 1319 1320
```cpp
typedef struct LNode {
    ElemType data;
    struct LNode *next;
} LNode, *LinkList; 
```
辉哈's avatar
辉哈 已提交
1321

1322 1323
</details>

辉哈's avatar
辉哈 已提交
1324 1325
#### 链队列(Link Queue)

1326 1327
<details><summary>链队列图片</summary>

1328 1329
![](images/LinkQueue.png)

1330 1331
</details>

1332 1333 1334 1335
#### 线性表的链式表示

##### 单链表(Link List)

1336 1337
<details><summary>单链表图片</summary>

1338 1339
![](images/LinkList.png)

1340 1341 1342
</details>


1343 1344
##### 双向链表(Du-Link-List)

1345 1346
<details><summary>双向链表图片</summary>

1347 1348
![](images/DuLinkList.png)

1349 1350
</details>

1351 1352
##### 循环链表(Cir-Link-List)

1353 1354
<details><summary>循环链表图片</summary>

1355
![](images/CirLinkList.png)
辉哈's avatar
辉哈 已提交
1356

1357 1358
</details>

辉哈's avatar
辉哈 已提交
1359 1360
### 哈希表

辉哈's avatar
辉哈 已提交
1361 1362
[HashTable.cpp](DataStructure/HashTable.cpp)

1363 1364 1365 1366 1367 1368 1369 1370 1371 1372 1373 1374 1375 1376
#### 概念

哈希函数:`H(key): K -> D , key ∈ K`

#### 构造方法

* 直接定址法
* 除留余数法
* 数字分析法
* 折叠法
* 平方取中法

#### 冲突处理方法

1377
* 链地址法:key 相同的用单链表链接
1378
* 开放定址法
1379 1380
    * 线性探测法:key 相同 -> 放到 key 的下一个位置,`Hi = (H(key) + i) % m`
    * 二次探测法:key 相同 -> 放到 `Di = 1^2, -1^2, ..., ±(k)^2,(k<=m/2)`
1381 1382 1383 1384
    * 随机探测法:`H = (H(key) + 伪随机数) % m`

#### 线性探测的哈希表数据结构

1385
<details><summary>线性探测的哈希表数据结构和图片</summary>
1386

1387
```cpp
1388 1389 1390 1391 1392 1393 1394 1395 1396 1397 1398 1399 1400
typedef char KeyType;

typedef struct {
	KeyType key;
}RcdType;

typedef struct {
	RcdType *rcd;
	int size;
	int count;
	bool *tag;
}HashTable;
```
1401

1402 1403
![](images/HashTable.png)

1404 1405 1406
</details>


辉哈's avatar
辉哈 已提交
1407 1408
### 递归

辉哈's avatar
辉哈 已提交
1409 1410 1411 1412 1413 1414 1415 1416 1417 1418 1419 1420 1421 1422 1423 1424 1425 1426 1427 1428 1429 1430 1431
#### 概念

函数直接或间接地调用自身

#### 递归与分治

* 分治法
    * 问题的分解
    * 问题规模的分解
* 折半查找(递归)
* 归并查找(递归)
* 快速排序(递归)

#### 递归与迭代

* 迭代:反复利用变量旧值推出新值
* 折半查找(迭代)
* 归并查找(迭代)

#### 广义表

##### 头尾链表存储表示

1432 1433
<details><summary>广义表的头尾链表存储表示和图片</summary>

辉哈's avatar
辉哈 已提交
1434 1435 1436 1437 1438 1439 1440 1441 1442 1443
```cpp
// 广义表的头尾链表存储表示
typedef enum {ATOM, LIST} ElemTag;
// ATOM==0:原子,LIST==1:子表
typedef struct GLNode {
    ElemTag tag;
    // 公共部分,用于区分原子结点和表结点
    union {
        // 原子结点和表结点的联合部分
        AtomType atom;
1444
        // atom 是原子结点的值域,AtomType 由用户定义
辉哈's avatar
辉哈 已提交
1445 1446 1447
        struct {
            struct GLNode *hp, *tp;
        } ptr;
1448
        // ptr 是表结点的指针域,prt.hp 和 ptr.tp 分别指向表头和表尾
辉哈's avatar
辉哈 已提交
1449 1450 1451 1452 1453 1454
    } a;
} *GList, GLNode;
```

![](images/GeneralizedList1.png)

1455 1456
</details>

辉哈's avatar
辉哈 已提交
1457 1458
##### 扩展线性链表存储表示

1459 1460
<details><summary>扩展线性链表存储表示和图片</summary>

辉哈's avatar
辉哈 已提交
1461 1462 1463 1464 1465 1466 1467 1468 1469 1470 1471 1472 1473
```cpp
// 广义表的扩展线性链表存储表示
typedef enum {ATOM, LIST} ElemTag;
// ATOM==0:原子,LIST==1:子表
typedef struct GLNode1 {
    ElemTag tag;
    // 公共部分,用于区分原子结点和表结点
    union {
        // 原子结点和表结点的联合部分
        AtomType atom; // 原子结点的值域
        struct GLNode1 *hp; // 表结点的表头指针
    } a;
    struct GLNode1 *tp;
1474
    // 相当于线性链表的 next,指向下一个元素结点
辉哈's avatar
辉哈 已提交
1475 1476 1477 1478 1479
} *GList1, GLNode1;
```

![](images/GeneralizedList2.png)

1480 1481
</details>

辉哈's avatar
辉哈 已提交
1482 1483
### 二叉树

辉哈's avatar
辉哈 已提交
1484 1485
[BinaryTree.cpp](DataStructure/BinaryTree.cpp)

辉哈's avatar
辉哈 已提交
1486 1487
#### 性质

1488 1489 1490 1491 1492
1. 非空二叉树第 i 层最多 2<sup>(i-1)</sup> 个结点 (i >= 1)
2. 深度为 k 的二叉树最多 2<sup>k</sup> - 1 个结点 (k >= 1)
3. 度为 0 的结点数为 n<sub>0</sub>,度为 2 的结点数为 n<sub>2</sub>,则 n<sub>0</sub> = n<sub>2</sub> + 1
4. 有 n 个结点的完全二叉树深度 k = ⌊ log<sub>2</sub>(n) ⌋ + 1 
5. 对于含 n 个结点的完全二叉树中编号为 i (1 <= i <= n) 的结点
辉哈's avatar
辉哈 已提交
1493 1494 1495 1496 1497 1498
    1. 若 i = 1,为根,否则双亲为 ⌊ i / 2 ⌋
    2. 若 2i > n,则 i 结点没有左孩子,否则孩子编号为 2i + 1
    3. 若 2i + 1 > n,则 i 结点没有右孩子,否则孩子编号为 2i + 1

#### 存储结构

1499 1500
<details><summary>二叉树数据结构</summary>

辉哈's avatar
辉哈 已提交
1501 1502 1503 1504 1505 1506 1507 1508
```cpp
typedef struct BiTNode
{
    TElemType data;
    struct BiTNode *lchild, *rchild;
}BiTNode, *BiTree;
```

1509 1510 1511
</details>


辉哈's avatar
辉哈 已提交
1512 1513
##### 顺序存储

1514 1515
<details><summary>二叉树顺序存储图片</summary>

辉哈's avatar
辉哈 已提交
1516 1517
![](images/SqBinaryTree.png)

1518 1519
</details>

辉哈's avatar
辉哈 已提交
1520 1521
##### 链式存储

1522 1523
<details><summary>二叉树链式存储图片</summary>

辉哈's avatar
辉哈 已提交
1524 1525
![](images/LinkBinaryTree.png)

1526 1527
</details>

辉哈's avatar
辉哈 已提交
1528 1529 1530 1531 1532 1533 1534 1535 1536 1537 1538 1539 1540 1541 1542 1543 1544 1545 1546 1547
#### 遍历方式

* 先序遍历
* 中序遍历
* 后续遍历
* 层次遍历

#### 分类

* 满二叉树
* 完全二叉树(堆)
    * 大顶堆:根 >= 左 && 根 >= 右
    * 小顶堆:根 <= 左 && 根 <= 右
* 二叉查找树(二叉排序树):左 < 根 < 右
* 平衡二叉树(AVL树):| 左子树树高 - 右子树树高 | <= 1
* 最小失衡树:平衡二叉树插入新结点导致失衡的子树:调整:
    * LL型:根的左孩子右旋
    * RR型:根的右孩子左旋
    * LR型:根的左孩子左旋,再右旋
    * RL型:右孩子的左子树,先右旋,再左旋
辉哈's avatar
辉哈 已提交
1548

辉哈's avatar
辉哈 已提交
1549
### 其他树及森林
辉哈's avatar
辉哈 已提交
1550

辉哈's avatar
辉哈 已提交
1551 1552 1553 1554 1555 1556 1557 1558 1559 1560
#### 树的存储结构

* 双亲表示法
* 双亲孩子表示法
* 孩子兄弟表示法

#### 并查集

一种不相交的子集所构成的集合 S = {S1, S2, ..., Sn}

辉哈's avatar
辉哈 已提交
1561 1562
#### 平衡二叉树(AVL树)

辉哈's avatar
辉哈 已提交
1563 1564 1565 1566
##### 性质

* | 左子树树高 - 右子树树高 | <= 1
* 平衡二叉树必定是二叉搜索树,反之则不一定
1567
* 最小二叉平衡树的节点的公式:`F(n)=F(n-1)+F(n-2)+1` (1 是根节点,F(n-1) 是左子树的节点数量,F(n-2) 是右子树的节点数量)
辉哈's avatar
辉哈 已提交
1568

1569 1570
<details><summary>平衡二叉树图片</summary>

辉哈's avatar
辉哈 已提交
1571 1572
![](images/Self-balancingBinarySearchTree.png)

1573 1574
</details>

辉哈's avatar
辉哈 已提交
1575 1576 1577 1578 1579 1580
##### 最小失衡树

平衡二叉树插入新结点导致失衡的子树

调整:

1581 1582 1583 1584
* LL 型:根的左孩子右旋
* RR 型:根的右孩子左旋
* LR 型:根的左孩子左旋,再右旋
* RL 型:右孩子的左子树,先右旋,再左旋
辉哈's avatar
辉哈 已提交
1585

辉哈's avatar
辉哈 已提交
1586 1587
#### 红黑树

1588
##### 红黑树的特征是什么?
辉哈's avatar
辉哈 已提交
1589

1590 1591
1. 节点是红色或黑色。
2. 根是黑色。
1592
3. 所有叶子都是黑色(叶子是 NIL 节点)。
1593 1594
4. 每个红色节点必须有两个黑色的子节点。(从每个叶子到根的所有路径上不能有两个连续的红色节点。)(新增节点的父节点必须相同)
5. 从任一节点到其每个叶子的所有简单路径都包含相同数目的黑色节点。(新增节点必须为红)
辉哈's avatar
辉哈 已提交
1595

1596 1597 1598 1599 1600 1601 1602
##### 调整

1. 变色
2. 左旋
3. 右旋

##### 应用
辉哈's avatar
辉哈 已提交
1603

1604
* 关联数组:如 STL 中的 map、set
辉哈's avatar
辉哈 已提交
1605

1606
##### 红黑树、B 树、B+ 树的区别?
辉哈's avatar
辉哈 已提交
1607

1608 1609
* 红黑树的深度比较大,而 B 树和 B+ 树的深度则相对要小一些
* B+ 树则将数据都保存在叶子节点,同时通过链表的形式将他们连接在一起。
辉哈's avatar
辉哈 已提交
1610

1611
#### B 树(B-tree)、B+ 树(B+-tree)
辉哈's avatar
辉哈 已提交
1612

1613 1614
<details><summary>B 树、B+ 树图片</summary>

1615
![B 树(B-tree)、B+ 树(B+-tree)](https://i.stack.imgur.com/l6UyF.png)
辉哈's avatar
辉哈 已提交
1616

1617 1618
</details>

辉哈's avatar
辉哈 已提交
1619 1620 1621 1622 1623 1624 1625 1626 1627 1628 1629 1630 1631 1632 1633 1634 1635 1636 1637 1638
##### 特点

* 一般化的二叉查找树(binary search tree)
* “矮胖”,内部(非叶子)节点可以拥有可变数量的子节点(数量范围预先定义好)

##### 应用

* 大部分文件系统、数据库系统都采用B树、B+树作为索引结构

##### 区别

* B+树中只有叶子节点会带有指向记录的指针(ROWID),而B树则所有节点都带有,在内部节点出现的索引项不会再出现在叶子节点中。
* B+树中所有叶子节点都是通过指针连接在一起,而B树不会。

##### B树的优点

对于在内部节点的数据,可直接得到,不必根据叶子节点来定位。

##### B+树的优点

1639
* 非叶子节点不会带上 ROWID,这样,一个块中可以容纳更多的索引项,一是可以降低树的高度。二是一个内部节点可以定位更多的叶子节点。
辉哈's avatar
辉哈 已提交
1640 1641
* 叶子节点之间通过指针来连接,范围扫描将十分简单,而对于B树来说,则需要在叶子节点和内部节点不停的往返移动。

1642
> B 树、B+ 树区别来自:[differences-between-b-trees-and-b-trees](https://stackoverflow.com/questions/870218/differences-between-b-trees-and-b-trees)、[B树和B+树的区别](https://www.cnblogs.com/ivictor/p/5849061.html)
辉哈's avatar
辉哈 已提交
1643 1644 1645

#### 八叉树

1646 1647
<details><summary>八叉树图片</summary>

辉哈's avatar
辉哈 已提交
1648 1649
![](https://upload.wikimedia.org/wikipedia/commons/thumb/3/35/Octree2.png/400px-Octree2.png)

1650 1651
</details>

辉哈's avatar
辉哈 已提交
1652 1653 1654 1655 1656 1657 1658
八叉树(octree),或称八元树,是一种用于描述三维空间(划分空间)的树状数据结构。八叉树的每个节点表示一个正方体的体积元素,每个节点有八个子节点,这八个子节点所表示的体积元素加在一起就等于父节点的体积。一般中心点作为节点的分叉中心。

##### 用途

* 三维计算机图形
* 最邻近搜索

辉哈's avatar
辉哈 已提交
1659 1660
### 图

辉哈's avatar
辉哈 已提交
1661 1662 1663 1664
## 算法

### 排序

1665 1666 1667 1668 1669 1670
排序算法 | 平均时间复杂度 | 最差时间复杂度 | 空间复杂度 | 数据对象稳定性
---|---|---|---|---
[冒泡排序](Algorithm/BubbleSort.h) | O(n<sup>2</sup>)|O(n<sup>2</sup>)|O(1)|稳定
[选择排序](Algorithm/SelectionSort.h) | O(n<sup>2</sup>)|O(n<sup>2</sup>)|O(1)|数组不稳定、链表稳定
[插入排序](Algorithm/InsertSort.h) | O(n<sup>2</sup>)|O(n<sup>2</sup>)|O(1)|稳定
[快速排序](Algorithm/QuickSort.h) | O(n*log<sub>2</sub>n) |  O(n<sup>2</sup>) | O(log<sub>2</sub>n) | 不稳定
1671
[堆排序](Algorithm/HeapSort.cpp) | O(n*log<sub>2</sub>n)|O(n<sup>2</sup>)|O(1)|不稳定
1672 1673
[归并排序](Algorithm/MergeSort.h) | O(n*log<sub>2</sub>n) | O(n*log<sub>2</sub>n)|O(1)|稳定
[希尔排序](Algorithm/ShellSort.h) | O(n*log<sup>2</sup>n)|O(n<sup>2</sup>)|O(1)|不稳定
1674 1675
[计数排序](Algorithm/CountSort.cpp) | O(n+m)|O(n+m)|O(n+m)|稳定
[桶排序](Algorithm/BucketSort.cpp) | O(n)|O(n)|O(m)|稳定
1676
[基数排序](Algorithm/RadixSort.h) | O(k*n)|O(n<sup>2</sup>)| |稳定
辉哈's avatar
辉哈 已提交
1677

1678
> * 均按从小到大排列
1679
> * k:代表数值中的 “数位” 个数
1680 1681
> * n:代表数据规模
> * m:代表数据的最大值减最小值
辉哈's avatar
辉哈 已提交
1682
> * 来自:[wikipedia . 排序算法](https://zh.wikipedia.org/wiki/%E6%8E%92%E5%BA%8F%E7%AE%97%E6%B3%95)
1683

辉哈's avatar
辉哈 已提交
1684 1685
### 查找

1686 1687 1688 1689
查找算法 | 平均时间复杂度 | 空间复杂度 | 查找条件
---|---|---|---
[顺序查找](Algorithm/SequentialSearch.h) | O(n) | O(1) | 无序或有序
[二分查找(折半查找)](Algorithm/BinarySearch.h) | O(log<sub>2</sub>n)| O(1) | 有序
1690 1691 1692 1693 1694 1695 1696
[插值查找](Algorithm/InsertionSearch.h) | O(log<sub>2</sub>(log<sub>2</sub>n)) | O(1) | 有序
[斐波那契查找](Algorithm/FibonacciSearch.cpp) | O(log<sub>2</sub>n) | O(1) | 有序
[哈希查找](DataStructure/HashTable.cpp) | O(1) | O(n) | 无序或有序
[二叉查找树(二叉搜索树查找)](Algorithm/BSTSearch.h) |O(log<sub>2</sub>n) |   | 
[红黑树](DataStructure/RedBlackTree.cpp) |O(log<sub>2</sub>n) | |
2-3树 | O(log<sub>2</sub>n - log<sub>3</sub>n) |   | 
B树/B+树 |O(log<sub>2</sub>n) |   | 
辉哈's avatar
辉哈 已提交
1697

1698 1699 1700 1701 1702 1703 1704 1705 1706 1707 1708 1709 1710 1711 1712
### 图搜索算法

图搜索算法 |数据结构| 遍历时间复杂度 | 空间复杂度
---|---|---|---
[BFS广度优先搜索](https://zh.wikipedia.org/wiki/%E5%B9%BF%E5%BA%A6%E4%BC%98%E5%85%88%E6%90%9C%E7%B4%A2)|邻接矩阵<br/>邻接链表|O(\|v\|<sup>2</sup>)<br/>O(\|v\|+\|E\|)|O(\|v\|<sup>2</sup>)<br/>O(\|v\|+\|E\|)
[DFS深度优先搜索](https://zh.wikipedia.org/wiki/%E6%B7%B1%E5%BA%A6%E4%BC%98%E5%85%88%E6%90%9C%E7%B4%A2)|邻接矩阵<br/>邻接链表|O(\|v\|<sup>2</sup>)<br/>O(\|v\|+\|E\|)|O(\|v\|<sup>2</sup>)<br/>O(\|v\|+\|E\|)

### 其他算法

其他算法 |思想| 应用
---|---|---
[分治法](https://zh.wikipedia.org/wiki/%E5%88%86%E6%B2%BB%E6%B3%95)|把一个复杂的问题分成两个或更多的相同或相似的子问题,直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并|[循环赛日程安排问题](https://github.com/huihut/interview/tree/master/Problems/RoundRobinProblem)、排序算法(快速排序、归并排序)
[动态规划](https://zh.wikipedia.org/wiki/%E5%8A%A8%E6%80%81%E8%A7%84%E5%88%92)|通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法,适用于有重叠子问题和最优子结构性质的问题|[背包问题](https://github.com/huihut/interview/tree/master/Problems/KnapsackProblem)、斐波那契数列
[贪心法](https://zh.wikipedia.org/wiki/%E8%B4%AA%E5%BF%83%E6%B3%95)|一种在每一步选择中都采取在当前状态下最好或最优(即最有利)的选择,从而希望导致结果是最好或最优的算法|旅行推销员问题(最短路径问题)、最小生成树、哈夫曼编码

辉哈's avatar
辉哈 已提交
1713 1714
## Problems

辉哈's avatar
辉哈 已提交
1715 1716
### Single Problem

1717 1718 1719 1720 1721
* [Chessboard Coverage Problem(棋盘覆盖问题)](Problems/ChessboardCoverageProblem)
* [Knapsack Problem(背包问题)](Problems/KnapsackProblem)
* [Neumann Neighbor Problem(冯诺依曼邻居问题)](Problems/NeumannNeighborProblem)
* [Round Robin Problem(循环赛日程安排问题)](Problems/RoundRobinProblem)
* [Tubing Problem(输油管道问题)](Problems/TubingProblem)
辉哈's avatar
辉哈 已提交
1722

辉哈's avatar
辉哈 已提交
1723 1724
### Leetcode Problems

1725 1726
* [Github . haoel/leetcode](https://github.com/haoel/leetcode)
* [Github . pezy/LeetCode](https://github.com/pezy/LeetCode)
辉哈's avatar
辉哈 已提交
1727

辉哈's avatar
辉哈 已提交
1728 1729 1730 1731 1732 1733 1734 1735 1736 1737 1738 1739 1740 1741
### 剑指 Offer

* [Github . zhedahht/CodingInterviewChinese2](https://github.com/zhedahht/CodingInterviewChinese2)
* [Github . gatieme/CodingInterviews](https://github.com/gatieme/CodingInterviews)

### Cracking the Coding Interview 程序员面试金典

* [Github . careercup/ctci](https://github.com/careercup/ctci)
* [牛客网 . 程序员面试金典](https://www.nowcoder.com/ta/cracking-the-coding-interview)

### 牛客网

* [牛客网 . 在线编程专题](https://www.nowcoder.com/activity/oj)

辉哈's avatar
辉哈 已提交
1742 1743
## 操作系统

辉哈's avatar
辉哈 已提交
1744 1745 1746 1747 1748 1749 1750 1751 1752 1753 1754
### 进程与线程

对于有线程系统:
* 进程是资源分配的独立单位
* 线程是资源调度的独立单位

对于无线程系统:
* 进程是资源调度、分配的独立单位

#### 进程之间的通信方式以及优缺点

辉哈's avatar
辉哈 已提交
1755
* 管道(PIPE)
辉哈's avatar
辉哈 已提交
1756 1757 1758 1759 1760 1761 1762 1763 1764 1765 1766
    * 有名管道:一种半双工的通信方式,它允许无亲缘关系进程间的通信
        * 优点:可以实现任意关系的进程间的通信
        * 缺点:
            1. 长期存于系统中,使用不当容易出错
            2. 缓冲区有限
    * 无名管道:一种半双工的通信方式,只能在具有亲缘关系的进程间使用(父子进程)
        * 优点:简单方便
        * 缺点:
            1. 局限于单向通信 
            2. 只能创建在它的进程以及其有亲缘关系的进程之间
            3. 缓冲区有限
辉哈's avatar
辉哈 已提交
1767
* 信号量(Semaphore):一个计数器,可以用来控制多个线程对共享资源的访问
辉哈's avatar
辉哈 已提交
1768 1769
    * 优点:可以同步进程
    * 缺点:信号量有限
辉哈's avatar
辉哈 已提交
1770 1771
* 信号(Signal):一种比较复杂的通信方式,用于通知接收进程某个事件已经发生
* 消息队列(Message Queue):是消息的链表,存放在内核中并由消息队列标识符标识
辉哈's avatar
辉哈 已提交
1772
    * 优点:可以实现任意进程间的通信,并通过系统调用函数来实现消息发送和接收之间的同步,无需考虑同步问题,方便
1773
    * 缺点:信息的复制需要额外消耗 CPU 的时间,不适宜于信息量大或操作频繁的场合
辉哈's avatar
辉哈 已提交
1774
* 共享内存(Shared Memory):映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问
辉哈's avatar
辉哈 已提交
1775 1776 1777 1778
    * 优点:无须复制,快捷,信息量大
    * 缺点:
        1. 通信是通过将共享空间缓冲区直接附加到进程的虚拟地址空间中来实现的,因此进程间的读写操作的同步问题
        2. 利用内存缓冲区直接交换信息,内存的实体存在于计算机中,只能同一个计算机系统中的诸多进程共享,不方便网络通信
辉哈's avatar
辉哈 已提交
1779
* 套接字(Socket):可用于不同及其间的进程通信
辉哈's avatar
辉哈 已提交
1780 1781 1782 1783 1784 1785 1786 1787 1788
    * 优点:
        1. 传输数据为字节级,传输数据可自定义,数据量小效率高
        2. 传输数据时间短,性能高
        3. 适合于客户端和服务器端之间信息实时交互
        4. 可以加密,数据安全性强
    * 缺点:需对传输的数据进行解析,转化成应用级的数据。

#### 线程之间的通信方式

辉哈's avatar
辉哈 已提交
1789 1790 1791 1792 1793
* 锁机制:包括互斥锁/量(mutex)、读写锁(reader-writer lock)、自旋锁(spin lock)、条件变量(condition)
    * 互斥锁/量(mutex):提供了以排他方式防止数据结构被并发修改的方法。
    * 读写锁(reader-writer lock):允许多个线程同时读共享数据,而对写操作是互斥的。
    * 自旋锁(spin lock)与互斥锁类似,都是为了保护共享资源。互斥锁是当资源被占用,申请者进入睡眠状态;而自旋锁则循环检测保持着是否已经释放锁。
    * 条件变量(condition):可以以原子的方式阻塞进程,直到某个特定条件为真为止。对条件的测试是在互斥锁的保护下进行的。条件变量始终与互斥锁一起使用。
辉哈's avatar
辉哈 已提交
1794 1795 1796 1797
* 信号量机制(Semaphore)
    * 无名线程信号量
    * 命名线程信号量
* 信号机制(Signal):类似进程间的信号处理
辉哈's avatar
辉哈 已提交
1798
* 屏障(barrier):屏障允许每个线程等待,直到所有的合作线程都达到某一点,然后从该点继续执行。
辉哈's avatar
辉哈 已提交
1799 1800 1801

线程间的通信目的主要是用于线程同步,所以线程没有像进程通信中的用于数据交换的通信机制  

1802
> 进程之间的通信方式以及优缺点来源于:[进程线程面试题总结](http://blog.csdn.net/wujiafei_njgcxy/article/details/77098977)
辉哈's avatar
辉哈 已提交
1803

1804 1805 1806
#### 进程之间私有和共享的资源

* 私有:地址空间、堆、全局变量、栈、寄存器
1807
* 共享:代码段,公共数据,进程目录,进程 ID
1808 1809 1810 1811 1812 1813

#### 线程之间私有和共享的资源

* 私有:线程栈,寄存器,程序寄存器
* 共享:堆,地址空间,全局变量,静态变量

1814 1815 1816 1817 1818 1819 1820 1821 1822 1823 1824 1825 1826 1827 1828 1829 1830 1831 1832 1833 1834 1835 1836 1837 1838 1839 1840 1841 1842 1843
#### 多进程与多线程间的对比、优劣与选择

##### 对比

对比维度 | 多进程 | 多线程 | 总结
---|---|---|---
数据共享、同步|数据共享复杂,需要用 IPC;数据是分开的,同步简单|因为共享进程数据,数据共享简单,但也是因为这个原因导致同步复杂|各有优势
内存、CPU|占用内存多,切换复杂,CPU 利用率低|占用内存少,切换简单,CPU 利用率高|线程占优
创建销毁、切换|创建销毁、切换复杂,速度慢|创建销毁、切换简单,速度很快|线程占优
编程、调试|编程简单,调试简单|编程复杂,调试复杂|进程占优
可靠性|进程间不会互相影响|一个线程挂掉将导致整个进程挂掉|进程占优
分布式|适应于多核、多机分布式;如果一台机器不够,扩展到多台机器比较简单|适应于多核分布式|进程占优

##### 优劣

优劣|多进程|多线程
---|---|---
优点|编程、调试简单,可靠性较高|创建、销毁、切换速度快,内存、资源占用小
缺点|创建、销毁、切换速度慢,内存、资源占用大|编程、调试复杂,可靠性较差

##### 选择

* 需要频繁创建销毁的优先用线程
* 需要进行大量计算的优先使用线程
* 强相关的处理用线程,弱相关的处理用进程
* 可能要扩展到多机分布的用进程,多核分布的用线程
* 都满足需求的情况下,用你最熟悉、最拿手的方式

> 多进程与多线程间的对比、优劣与选择来自:[多线程还是多进程的选择及区别](https://blog.csdn.net/lishenglong666/article/details/8557215)

1844 1845 1846 1847 1848 1849 1850 1851 1852 1853 1854 1855 1856 1857 1858 1859 1860 1861
### Linux 内核的同步方式

#### 原因

在现代操作系统里,同一时间可能有多个内核执行流在执行,因此内核其实象多进程多线程编程一样也需要一些同步机制来同步各执行单元对共享数据的访问。尤其是在多处理器系统上,更需要一些同步机制来同步不同处理器上的执行单元对共享的数据的访问。

#### 同步方式

* 原子操作
* 信号量(semaphore)
* 读写信号量(rw_semaphore)
* 自旋锁(spinlock)
* 大内核锁(BKL,Big Kernel Lock)
* 读写锁(rwlock)
* 大读者锁(brlock-Big Reader Lock)
* 读-拷贝修改(RCU,Read-Copy Update)
* 顺序锁(seqlock)

辉哈's avatar
辉哈 已提交
1862
> 来自:[Linux 内核的同步机制,第 1 部分](https://www.ibm.com/developerworks/cn/linux/l-synch/part1/)、[Linux 内核的同步机制,第 2 部分](https://www.ibm.com/developerworks/cn/linux/l-synch/part2/)
1863

辉哈's avatar
辉哈 已提交
1864 1865
### 死锁

1866 1867 1868 1869 1870 1871
#### 原因

* 系统资源不足
* 资源分配不当
* 进程运行推进顺序不合适

辉哈's avatar
辉哈 已提交
1872 1873 1874 1875 1876 1877 1878 1879 1880 1881 1882 1883 1884 1885 1886 1887 1888 1889
#### 产生条件

* 互斥
* 请求和保持
* 不剥夺
* 环路

#### 预防

* 打破互斥条件:改造独占性资源为虚拟资源,大部分资源已无法改造。
* 打破不可抢占条件:当一进程占有一独占性资源后又申请一独占性资源而无法满足,则退出原占有的资源。
* 打破占有且申请条件:采用资源预先分配策略,即进程运行前申请全部资源,满足则运行,不然就等待,这样就不会占有且申请。
* 打破循环等待条件:实现资源有序分配策略,对所有设备实现分类编号,所有进程只能采用按序号递增的形式申请资源。
* 有序资源分配法
* 银行家算法

### 文件系统

1890
* Windows:FCB 表 + FAT + 位图
1891
* Unix:inode + 混合索引 + 成组链接
辉哈's avatar
辉哈 已提交
1892

1893 1894
### 主机字节序与网络字节序

1895
#### 主机字节序(CPU 字节序)
1896 1897 1898

##### 概念

1899
主机字节序又叫 CPU 字节序,其不是由操作系统决定的,而是由 CPU 指令集架构决定的。主机字节序分为两种:
1900 1901 1902 1903 1904 1905

* 大端字节序(Big Endian):高序字节存储在低位地址,低序字节存储在高位地址
* 小端字节序(Little Endian):高序字节存储在高位地址,低序字节存储在低位地址

##### 存储方式

1906
32 位整数 `0x12345678` 是从起始位置为 `0x00` 的地址开始存放,则:
1907 1908 1909

内存地址 | 0x00 | 0x01 | 0x02 | 0x03
---|---|---|---|---
1910 1911 1912
大端|12|34|56|78
小端|78|56|34|12

1913 1914 1915

<details><summary>大端小端图片</summary>

1916 1917
![大端序](images/CPU-Big-Endian.svg.png)
![小端序](images/CPU-Little-Endian.svg.png)
1918

1919 1920
</details>

1921 1922
##### 判断大端小端

1923 1924
<details><summary>判断大端小端</summary>

1925
可以这样判断自己 CPU 字节序是大端还是小端:
1926 1927 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942

```cpp
#include <iostream>
using namespace std;

int main()
{
	int i = 0x12345678;

	if (*((char*)&i) == 0x12)
		cout << "大端" << endl;
	else	
		cout << "小端" << endl;

	return 0;
}
```
1943 1944 1945

</details>

1946 1947
##### 各架构处理器的字节序

1948 1949 1950
* x86(Intel、AMD)、MOS Technology 6502、Z80、VAX、PDP-11 等处理器为小端序;
* Motorola 6800、Motorola 68000、PowerPC 970、System/370、SPARC(除 V9 外)等处理器为大端序;
* ARM(默认小端序)、PowerPC(除 PowerPC 970 外)、DEC Alpha、SPARC V9、MIPS、PA-RISC 及 IA64 的字节序是可配置的。
1951 1952 1953

#### 网络字节序

1954
网络字节顺序是 TCP/IP 中规定好的一种数据表示格式,它与具体的 CPU 类型、操作系统等无关,从而可以保重数据在不同主机之间传输时能够被正确解释。
1955 1956 1957

网络字节顺序采用:大端(Big Endian)排列方式。

1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978
### 页面置换算法

在地址映射过程中,若在页面中发现所要访问的页面不在内存中,则产生缺页中断。当发生缺页中断时,如果操作系统内存中没有空闲页面,则操作系统必须在内存选择一个页面将其移出内存,以便为即将调入的页面让出空间。而用来选择淘汰哪一页的规则叫做页面置换算法。

#### 分类

* 全局置换:在整个内存空间置换
* 局部置换:在本进程中进行置换

#### 算法

全局:
* 工作集算法
* 缺页率置换算法

局部:
* 最佳置换算法(OPT)
* 先进先出置换算法(FIFO)
* 最近最久未使用(LRU)算法
* 时钟(Clock)置换算法

辉哈's avatar
辉哈 已提交
1979 1980
## 计算机网络

辉哈's avatar
辉哈 已提交
1981
计算机经网络体系结构:
辉哈's avatar
辉哈 已提交
1982

辉哈's avatar
辉哈 已提交
1983
![计算机经网络体系结构](images/计算机经网络体系结构.png)
1984

1985 1986 1987 1988
### 各层作用及协议

分层 | 作用 | 协议
---|---|---
1989 1990 1991 1992 1993 1994 1995
物理层 | 通过媒介传输比特,确定机械及电气规范(比特 Bit) | RJ45、CLOCK、IEEE802.3(中继器,集线器)
数据链路层|将比特组装成帧和点到点的传递(帧 Frame)| PPP、FR、HDLC、VLAN、MAC(网桥,交换机)
网络层|负责数据包从源到宿的传递和网际互连(包 Packet)|IP、ICMP、ARP、RARP、OSPF、IPX、RIP、IGRP(路由器)
运输层|提供端到端的可靠报文传递和错误恢复( 段Segment)|TCP、UDP、SPX
会话层|建立、管理和终止会话(会话协议数据单元 SPDU)|NFS、SQL、NETBIOS、RPC
表示层|对数据进行翻译、加密和压缩(表示协议数据单元 PPDU)|JPEG、MPEG、ASII
应用层|允许访问OSI环境的手段(应用协议数据单元 APDU)|FTP、DNS、Telnet、SMTP、HTTP、WWW、NFS
1996

1997

辉哈's avatar
辉哈 已提交
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024
### 物理层

* 传输数据的单位 ———— 比特
* 数据传输系统:源系统(源点、发送器) --> 传输系统 --> 目的系统(接收器、终点)

通道:
* 单向通道(单工通道):只有一个方向通信,没有反方向交互,如广播
* 双向交替通行(半双工通信):通信双方都可发消息,但不能同时发送或接收
* 双向同时通信(全双工通信):通信双方可以同时发送和接收信息

通道复用技术:
* 频分复用(FDM,Frequency Division Multiplexing):不同用户在不同频带,所用用户在同样时间占用不同带宽资源
* 时分复用(TDM,Time Division Multiplexing):不同用户在同一时间段的不同时间片,所有用户在不同时间占用同样的频带宽度
* 波分复用(WDM,Wavelength Division Multiplexing):光的频分复用
* 码分复用(CDM,Code Division Multiplexing):不同用户使用不同的码,可以在同样时间使用同样频带通信

### 数据链路层

主要信道:
* 点对点信道
* 广播信道

#### 点对点信道

* 数据单元 ———— 帧

三个基本问题:
2025
* 封装成帧:把网络层的 IP 数据报封装成帧,`SOH - 数据部分 - EOT`
辉哈's avatar
辉哈 已提交
2026 2027 2028 2029
* 透明传输:不管数据部分什么字符,都能传输出去;可以通过字节填充方法解决(冲突字符前加转义字符)
* 差错检测:降低误码率(BER,Bit Error Rate),广泛使用循环冗余检测(CRC,Cyclic Redundancy Check)

点对点协议(Point-to-Point Protocol):
2030
* 点对点协议(Point-to-Point Protocol):用户计算机和 ISP 通信时所使用的协议
辉哈's avatar
辉哈 已提交
2031 2032 2033 2034

#### 广播信道

广播通信:
2035 2036
* 硬件地址(物理地址、MAC 地址)
* 单播(unicast)帧(一对一):收到的帧的 MAC 地址与本站的硬件地址相同
辉哈's avatar
辉哈 已提交
2037 2038 2039 2040 2041 2042 2043 2044 2045 2046 2047 2048
* 广播(broadcast)帧(一对全体):发送给本局域网上所有站点的帧
* 多播(multicast)帧(一对多):发送给本局域网上一部分站点的帧

### 网络层

* IP(Internet Protocol,网际协议)是为计算机网络相互连接进行通信而设计的协议。
* ARP(Address Resolution Protocol,地址解析协议)
* ICMP(Internet Control Message Protocol,网际控制报文协议)
* IGMP(Internet Group Management Protocol,网际组管理协议)

#### IP 网际协议

2049 2050
IP 地址分类:
* `IP 地址 ::= {<网络号>,<主机号>}`
辉哈's avatar
辉哈 已提交
2051

2052
IP 地址类别 | 网络号 | 网络范围 | 主机号 | IP 地址范围
辉哈's avatar
辉哈 已提交
2053 2054 2055 2056 2057 2058 2059 2060 2061
---|---|---|---|---
A 类 | 8bit,第一位固定为 0 | 0 —— 127 | 24bit | 1.0.0.0 —— 127.255.255.255
B 类 | 16bit,前两位固定为  10 | 128.0 —— 191.255 | 16bit | 128.0.0.0 —— 191.255.255.255
C  类 | 24bit,前三位固定为  110 | 192.0.0 —— 223.255.255 | 8bit | 192.0.0.0 —— 223.255.255.255
D  类 | 前四位固定为 1110,后面为多播地址
E  类 | 前五位固定为 11110,后面保留为今后所用

IP 数据报格式:

2062
![IP 数据报格式](images/IP数据报格式.png)
辉哈's avatar
辉哈 已提交
2063 2064 2065 2066 2067

#### ICMP 网际控制报文协议

ICMP 报文格式:

2068
![ICMP 报文格式](images/ICMP报文格式.png)
辉哈's avatar
辉哈 已提交
2069 2070 2071

应用:
* PING(Packet InterNet Groper,分组网间探测)测试两个主机之间的连通性
2072
    * TTL(Time To Live,生存时间)该字段指定 IP 包被路由器丢弃之前允许通过的最大网段数量
辉哈's avatar
辉哈 已提交
2073 2074 2075 2076 2077 2078 2079

#### 内部网关协议

* RIP(Routing Information Protocol,路由信息协议)
* OSPF(Open Sortest Path First,开放最短路径优先)

#### 外部网关协议
2080

辉哈's avatar
辉哈 已提交
2081
* BGP(Border Gateway Protocol,边界网关协议)
2082

辉哈's avatar
辉哈 已提交
2083
#### IP多播
2084

辉哈's avatar
辉哈 已提交
2085 2086
* IGMP(Internet Group Management Protocol,网际组管理协议)
* 多播路由选择协议
2087

辉哈's avatar
辉哈 已提交
2088
#### VPN 和 NAT
2089

辉哈's avatar
辉哈 已提交
2090 2091
* VPN(Virtual Private Network,虚拟专用网)
* NAT(Network Address Translation,网络地址转换)
2092

2093 2094
#### 路由表包含什么?

2095 2096 2097
1. 网络 ID(Network ID, Network number):就是目标地址的网络 ID。
2. 子网掩码(subnet mask):用来判断 IP 所属网络
3. 下一跳地址/接口(Next hop / interface):就是数据在发送到目标地址的旅途中下一站的地址。其中 interface 指向 next hop(即为下一个 route)。一个自治系统(AS, Autonomous system)中的 route 应该包含区域内所有的子网络,而默认网关(Network id: `0.0.0.0`, Netmask: `0.0.0.0`)指向自治系统的出口。
2098 2099 2100 2101 2102 2103 2104

根据应用和执行的不同,路由表可能含有如下附加信息:

1. 花费(Cost):就是数据发送过程中通过路径所需要的花费。
2. 路由的服务质量
3. 路由中需要过滤的出/入连接列表

辉哈's avatar
辉哈 已提交
2105
### 运输层
2106

辉哈's avatar
辉哈 已提交
2107 2108 2109 2110 2111 2112 2113
协议:

* TCP(Transmission Control Protocol,传输控制协议)
* UDP(User Datagram Protocol,用户数据报协议)

端口:

辉哈's avatar
辉哈 已提交
2114 2115 2116
应用程序 | FTP | TELNET | SMTP | DNS | TFTP | HTTP | HTTPS | SNMP  
--- | --- | --- |--- |--- |--- |--- |--- |---   
端口号 | 21 | 23 | 25 | 53 | 69 | 80 | 443 | 161  
辉哈's avatar
辉哈 已提交
2117 2118 2119 2120 2121 2122 2123 2124 2125 2126 2127 2128

#### TCP

* TCP(Transmission Control Protocol,传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议,其传输的单位是报文段。

特征:
* 面向连接
* 只能点对点(一对一)通信
* 可靠交互
* 全双工通信
* 面向字节流

2129
TCP 如何保证可靠传输:
辉哈's avatar
辉哈 已提交
2130 2131
* 确认和超时重传
* 数据合理分片和排序
辉哈's avatar
辉哈 已提交
2132 2133
* 流量控制
* 拥塞控制
辉哈's avatar
辉哈 已提交
2134
* 数据校验
辉哈's avatar
辉哈 已提交
2135 2136 2137

TCP 报文结构

2138
![TCP 报文](images/TCP报文.png)
辉哈's avatar
辉哈 已提交
2139 2140 2141

TCP 首部

2142
![TCP 首部](images/TCP首部.png)
辉哈's avatar
辉哈 已提交
2143

2144 2145
TCP:状态控制码(Code,Control Flag),占 6 比特,含义如下:
* URG:紧急比特(urgent),当 `URG=1` 时,表明紧急指针字段有效,代表该封包为紧急封包。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据), 且上图中的 Urgent Pointer 字段也会被启用。
辉哈's avatar
辉哈 已提交
2146 2147 2148 2149 2150
* ACK:确认比特(Acknowledge)。只有当 `ACK=1` 时确认号字段才有效,代表这个封包为确认封包。当 `ACK=0` 时,确认号无效。
* PSH:(Push function)若为 1 时,代表要求对方立即传送缓冲区内的其他对应封包,而无需等缓冲满了才送。
* RST:复位比特(Reset),当 `RST=1` 时,表明 TCP 连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。
* SYN:同步比特(Synchronous),SYN 置为 1,就表示这是一个连接请求或连接接受报文,通常带有 SYN 标志的封包表示『主动』要连接到对方的意思。
* FIN:终止比特(Final),用来释放一个连接。当 `FIN=1` 时,表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。
2151

辉哈's avatar
辉哈 已提交
2152 2153
#### UDP

2154
* UDP(User Datagram Protocol,用户数据报协议)是 OSI(Open System Interconnection 开放式系统互联) 参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务,其传输的单位是用户数据报。
辉哈's avatar
辉哈 已提交
2155 2156 2157 2158 2159 2160 2161 2162 2163 2164 2165

特征:
* 无连接
* 尽最大努力交付
* 面向报文
* 没有拥塞控制
* 支持一对一、一对多、多对一、多对多的交互通信
* 首部开销小

UDP 报文结构

2166
![UDP 报文](images/UDP报文.png)
辉哈's avatar
辉哈 已提交
2167 2168 2169

UDP 首部

2170
![UDP 首部](images/UDP首部.png)
辉哈's avatar
辉哈 已提交
2171 2172 2173

> TCP/UDP 图片来源于:<https://github.com/JerryC8080/understand-tcp-udp>

2174 2175
#### TCP 与 UDP 的区别

2176 2177 2178 2179 2180 2181 2182
1. TCP 面向连接,UDP 是无连接的;
2. TCP 提供可靠的服务,也就是说,通过 TCP 连接传送的数据,无差错,不丢失,不重复,且按序到达;UDP 尽最大努力交付,即不保证可靠交付
3. TCP 的逻辑通信信道是全双工的可靠信道;UDP 则是不可靠信道
5. 每一条 TCP 连接只能是点到点的;UDP 支持一对一,一对多,多对一和多对多的交互通信
6. TCP 面向字节流(可能出现黏包问题),实际上是 TCP 把数据看成一连串无结构的字节流;UDP 是面向报文的(不会出现黏包问题)
7. UDP 没有拥塞控制,因此网络出现拥塞不会使源主机的发送速率降低(对实时应用很有用,如 IP 电话,实时视频会议等)
8. TCP 首部开销20字节;UDP 的首部开销小,只有 8 个字节
2183

2184
#### TCP 黏包问题
辉哈's avatar
辉哈 已提交
2185 2186 2187

##### 原因

2188
TCP 是一个基于字节流的传输服务(UDP 基于报文的),“流” 意味着 TCP 所传输的数据是没有边界的。所以可能会出现两个数据包黏在一起的情况。
辉哈's avatar
辉哈 已提交
2189 2190 2191 2192

##### 解决

* 发送定长包。如果每个消息的大小都是一样的,那么在接收对等方只要累计接收数据,直到数据等于一个定长的数值就将它作为一个消息。
2193 2194
* 包头加上包体长度。包头是定长的 4 个字节,说明了包体的长度。接收对等方先接收包头长度,依据包头长度来接收包体。
* 在数据包之间设置边界,如添加特殊符号 `\r\n` 标记。FTP 协议正是这么做的。但问题在于如果数据正文中也含有 `\r\n`,则会误判为消息的边界。
辉哈's avatar
辉哈 已提交
2195 2196
* 使用更加复杂的应用层协议。

2197
#### TCP 传输连接管理
辉哈's avatar
辉哈 已提交
2198

2199
> 因为 TCP 三次握手建立连接、四次挥手释放连接很重要,所以附上《计算机网络(第 7 版)-谢希仁》书中对此章的详细描述:<https://github.com/huihut/interview/blob/master/images/TCP-transport-connection-management.png>
2200

辉哈's avatar
辉哈 已提交
2201 2202
##### TCP 三次握手建立连接

2203
![UDP 报文](images/TCP三次握手建立连接.png)
辉哈's avatar
辉哈 已提交
2204

2205
【TCP 建立连接全过程解释】
2206

2207 2208 2209 2210
1. 客户端发送 SYN 给服务器,说明客户端请求建立连接;
2. 服务端收到客户端发的 SYN,并回复 SYN+ACK 给客户端(同意建立连接);
3. 客户端收到服务端的 SYN+ACK 后,回复 ACK 给服务端(表示客户端收到了服务端发的同意报文);
4. 服务端收到客户端的 ACK,连接已建立,可以数据传输。
2211

2212
##### TCP 为什么要进行三次握手?
2213

2214
【答案一】因为信道不可靠,而 TCP 想在不可靠信道上建立可靠地传输,那么三次通信是理论上的最小值。(而 UDP 则不需建立可靠传输,因此 UDP 不需要三次握手。)
2215

2216
> [Google Groups . TCP 建立连接为什么是三次握手?{技术}{网络通信}](https://groups.google.com/forum/#!msg/pongba/kF6O7-MFxM0/5S7zIJ4yqKUJ)
2217 2218 2219 2220 2221 2222 2223

【答案二】因为双方都需要确认对方收到了自己发送的序列号,确认过程最少要进行三次通信。

> [知乎 . TCP 为什么是三次握手,而不是两次或四次?](https://www.zhihu.com/question/24853633/answer/115173386)

【答案三】为了防止已失效的连接请求报文段突然又传送到了服务端,因而产生错误。

2224
> [《计算机网络(第 7 版)-谢希仁》](https://github.com/huihut/interview/blob/master/images/TCP-transport-connection-management.png)
2225 2226 2227

##### TCP 四次挥手释放连接

2228
![UDP 报文](images/TCP四次挥手释放连接.png)
2229

2230
【TCP 释放连接全过程解释】
2231

2232 2233 2234
1. 客户端发送 FIN 给服务器,说明客户端不必发送数据给服务器了(请求释放从客户端到服务器的连接);
2. 服务器接收到客户端发的 FIN,并回复 ACK 给客户端(同意释放从客户端到服务器的连接);
3. 客户端收到服务端回复的 ACK,此时从客户端到服务器的连接已释放(但服务端到客户端的连接还未释放,并且客户端还可以接收数据);
2235
4. 服务端继续发送之前没发完的数据给客户端;
2236 2237 2238
5. 服务端发送 FIN+ACK 给客户端,说明服务端发送完了数据(请求释放从服务端到客户端的连接,就算没收到客户端的回复,过段时间也会自动释放);
6. 客户端收到服务端的 FIN+ACK,并回复 ACK 给客户端(同意释放从服务端到客户端的连接);
7. 服务端收到客户端的 ACK 后,释放从服务端到客户端的连接。
2239

2240
##### TCP 为什么要进行四次挥手?
2241

2242
【问题一】TCP 为什么要进行四次挥手? / 为什么 TCP 建立连接需要三次,而释放连接则需要四次?
2243

2244
【答案一】因为 TCP 是全双工模式,客户端请求关闭连接后,客户端向服务端的连接关闭(一二次挥手),服务端继续传输之前没传完的数据给客户端(数据传输),服务端向客户端的连接关闭(三四次挥手)。所以 TCP 释放连接时服务器的 ACK 和 FIN 是分开发送的(中间隔着数据传输),而 TCP 建立连接时服务器的 ACK 和 SYN 是一起发送的(第二次握手),所以 TCP 建立连接需要三次,而释放连接则需要四次。
2245

2246
【问题二】为什么 TCP 连接时可以 ACK 和 SYN 一起发送,而释放时则 ACK 和 FIN 分开发送呢?(ACK 和 FIN 分开是指第二次和第三次挥手)
2247

2248
【答案二】因为客户端请求释放时,服务器可能还有数据需要传输给客户端,因此服务端要先响应客户端 FIN 请求(服务端发送 ACK),然后数据传输,传输完成后,服务端再提出 FIN 请求(服务端发送 FIN);而连接时则没有中间的数据传输,因此连接时可以 ACK 和 SYN 一起发送。
2249

2250
【问题三】为什么客户端释放最后需要 TIME-WAIT 等待 2MSL 呢?
2251 2252 2253

【答案三】

2254 2255
1. 为了保证客户端发送的最后一个 ACK 报文能够到达服务端。若未成功到达,则服务端超时重传 FIN+ACK 报文段,客户端再重传 ACK,并重新计时。
2. 防止已失效的连接请求报文段出现在本连接中。TIME-WAIT 持续 2MSL 可使本连接持续的时间内所产生的所有报文段都从网络中消失,这样可使下次连接中不会出现旧的连接报文段。
辉哈's avatar
辉哈 已提交
2256

2257
#### TCP 有限状态机
辉哈's avatar
辉哈 已提交
2258

2259 2260
<details><summary>TCP 有限状态机图片</summary>

2261
![TCP 的有限状态机](images/TCP的有限状态机.png)
2262

2263 2264
</details>

辉哈's avatar
辉哈 已提交
2265 2266
### 应用层

辉哈's avatar
辉哈 已提交
2267 2268
#### DNS

2269
* DNS(Domain Name System,域名系统)是互联网的一项服务。它作为将域名和 IP 地址相互映射的一个分布式数据库,能够使人更方便地访问互联网。DNS 使用 TCP 和 UDP 端口 53。当前,对于每一级域名长度的限制是 63 个字符,域名总长度则不能超过 253 个字符。
辉哈's avatar
辉哈 已提交
2270 2271

域名:
2272
* `域名 ::= {<三级域名>.<二级域名>.<顶级域名>}`,如:`blog.huihut.com`
辉哈's avatar
辉哈 已提交
2273 2274 2275

#### FTP

2276
* FTP(File Transfer Protocol,文件传输协议)是用于在网络上进行文件传输的一套标准协议,使用客户/服务器模式,使用 TCP 数据报,提供交互式访问,双向传输。
辉哈's avatar
辉哈 已提交
2277 2278 2279 2280
* TFTP(Trivial File Transfer Protocol,简单文件传输协议)一个小且易实现的文件传输协议,也使用客户-服务器方式,使用UDP数据报,只支持文件传输而不支持交互,没有列目录,不能对用户进行身份鉴定

#### TELNET

2281
* TELNET 协议是 TCP/IP 协议族中的一员,是 Internet 远程登陆服务的标准协议和主要方式。它为用户提供了在本地计算机上完成远程主机工作的能力。
辉哈's avatar
辉哈 已提交
2282

2283
* HTTP(HyperText Transfer Protocol,超文本传输协议)是用于从 WWW(World Wide Web,万维网)服务器传输超文本到本地浏览器的传送协议。
辉哈's avatar
辉哈 已提交
2284

2285 2286
* SMTP(Simple Mail Transfer Protocol,简单邮件传输协议)是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。
* Socket 建立网络通信连接至少要一对端口号(Socket)。Socket 本质是编程接口(API),对 TCP/IP 的封装,TCP/IP 也要提供可供程序员做网络开发所用的接口,这就是 Socket 编程接口。
2287

辉哈's avatar
辉哈 已提交
2288 2289 2290 2291 2292 2293 2294 2295 2296 2297
#### WWW

* WWW(World Wide Web,环球信息网,万维网)是一个由许多互相链接的超文本组成的系统,通过互联网访问

##### URL

* URL(Uniform Resource Locator,统一资源定位符)是因特网上标准的资源的地址(Address)

标准格式:

2298
* `协议类型:[//服务器地址[:端口号]][/资源层级UNIX文件路径]文件名[?查询][#片段ID]`
辉哈's avatar
辉哈 已提交
2299 2300 2301
    
完整格式:

2302
* `协议类型:[//[访问资源需要的凭证信息@]服务器地址[:端口号]][/资源层级UNIX文件路径]文件名[?查询][#片段ID]`
辉哈's avatar
辉哈 已提交
2303 2304

> 其中【访问凭证信息@;:端口号;?查询;#片段ID】都属于选填项  
2305
> 如:`https://github.com/huihut/interview#cc`
辉哈's avatar
辉哈 已提交
2306 2307 2308

##### HTTP

2309
HTTP(HyperText Transfer Protocol,超文本传输协议)是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP 是万维网的数据通信的基础。
辉哈's avatar
辉哈 已提交
2310 2311 2312 2313 2314 2315 2316

请求方法

方法 | 意义
--- | ---
OPTIONS | 请求一些选项信息,允许客户端查看服务器的性能
GET | 请求指定的页面信息,并返回实体主体
2317
HEAD | 类似于 get 请求,只不过返回的响应中没有具体的内容,用于获取报头
辉哈's avatar
辉哈 已提交
2318 2319 2320 2321 2322
POST | 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改
PUT | 从客户端向服务器传送的数据取代指定的文档的内容
DELETE | 请求服务器删除指定的页面
TRACE | 回显服务器收到的请求,主要用于测试或诊断

辉哈's avatar
辉哈 已提交
2323
状态码(Status-Code)
辉哈's avatar
辉哈 已提交
2324 2325 2326

* 1xx:表示通知信息,如请求收到了或正在进行处理
    * 100 Continue:继续,客户端应继续其请求
2327
    * 101 Switching Protocols 切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到 HTTP 的新版本协议
辉哈's avatar
辉哈 已提交
2328 2329 2330
* 2xx:表示成功,如接收或知道了
    * 200 OK: 请求成功
* 3xx:表示重定向,如要完成请求还必须采取进一步的行动
2331
    * 301 Moved Permanently: 永久移动。请求的资源已被永久的移动到新 URL,返回信息会包括新的 URL,浏览器会自动定向到新 URL。今后任何新的请求都应使用新的 URL 代替
辉哈's avatar
辉哈 已提交
2332 2333 2334
* 4xx:表示客户的差错,如请求中有错误的语法或不能完成
    * 400 Bad Request: 客户端请求的语法错误,服务器无法理解
    * 401 Unauthorized: 请求要求用户的身份认证
2335
    * 403 Forbidden: 服务器理解请求客户端的请求,但是拒绝执行此请求(权限不够)
2336
    * 404 Not Found: 服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置 “您所请求的资源无法找到” 的个性页面
辉哈's avatar
辉哈 已提交
2337 2338 2339
    * 408 Request Timeout: 服务器等待客户端发送的请求时间过长,超时
* 5xx:表示服务器的差错,如服务器失效无法完成请求
    * 500 Internal Server Error: 服务器内部错误,无法完成请求
2340
    * 503 Service Unavailable: 由于超载或系统维护,服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的 Retry-After 头信息中
辉哈's avatar
辉哈 已提交
2341 2342
    * 504 Gateway Timeout: 充当网关或代理的服务器,未及时从远端服务器获取请求

辉哈's avatar
辉哈 已提交
2343
> 更多状态码:[菜鸟教程 . HTTP状态码](http://www.runoob.com/http/http-status-codes.html)
辉哈's avatar
辉哈 已提交
2344 2345 2346

##### 其他协议

2347 2348 2349
* SMTP(Simple Main Transfer Protocol,简单邮件传输协议)是在 Internet 传输 Email 的标准,是一个相对简单的基于文本的协议。在其之上指定了一条消息的一个或多个接收者(在大多数情况下被确认是存在的),然后消息文本会被传输。可以很简单地通过 Telnet 程序来测试一个 SMTP 服务器。SMTP 使用 TCP 端口 25。
* DHCP(Dynamic Host Configuration Protocol,动态主机设置协议)是一个局域网的网络协议,使用 UDP 协议工作,主要有两个用途:
    * 用于内部网络或网络服务供应商自动分配 IP 地址给用户
辉哈's avatar
辉哈 已提交
2350
    * 用于内部网络管理员作为对所有电脑作中央管理的手段
2351
* SNMP(Simple Network Management Protocol,简单网络管理协议)构成了互联网工程工作小组(IETF,Internet Engineering Task Force)定义的 Internet 协议族的一部分。该协议能够支持网络管理系统,用以监测连接到网络上的设备是否有任何引起管理上关注的情况。
辉哈's avatar
辉哈 已提交
2352

2353 2354 2355 2356
## 网络编程

### Socket

2357
[Linux Socket 编程(不限 Linux)](https://www.cnblogs.com/skynet/archive/2010/12/12/1903949.html)
2358

2359
![Socket 客户端服务器通讯](images/socket客户端服务器通讯.jpg)
2360 2361 2362 2363 2364 2365 2366 2367 2368


#### Socket 中的 read()、write() 函数

```cpp
ssize_t read(int fd, void *buf, size_t count);
ssize_t write(int fd, const void *buf, size_t count);
```

2369 2370 2371 2372 2373 2374 2375 2376 2377 2378 2379 2380 2381 2382 2383
##### read()

* read 函数是负责从 fd 中读取内容。
* 当读成功时,read 返回实际所读的字节数。
* 如果返回的值是 0 表示已经读到文件的结束了,小于 0 表示出现了错误。
* 如果错误为 EINTR 说明读是由中断引起的;如果是 ECONNREST 表示网络连接出了问题。

##### write()

* write 函数将 buf 中的 nbytes 字节内容写入文件描述符 fd。
* 成功时返回写的字节数。失败时返回 -1,并设置 errno 变量。
* 在网络程序中,当我们向套接字文件描述符写时有俩种可能。
* (1)write 的返回值大于 0,表示写了部分或者是全部的数据。
* (2)返回的值小于 0,此时出现了错误。
* 如果错误为 EINTR 表示在写的时候出现了中断错误;如果为 EPIPE 表示网络连接出现了问题(对方已经关闭了连接)。
2384

2385
#### Socket 中 TCP 的三次握手建立连接
2386

2387
我们知道 TCP 建立连接要进行 “三次握手”,即交换三个分组。大致流程如下:
2388

2389 2390 2391
1. 客户端向服务器发送一个 SYN J
2. 服务器向客户端响应一个 SYN K,并对 SYN J 进行确认 ACK J+1
3. 客户端再想服务器发一个确认 ACK K+1
2392

2393
只有就完了三次握手,但是这个三次握手发生在 Socket 的那几个函数中呢?请看下图:
2394

2395
![socket 中发送的 TCP 三次握手](http://images.cnblogs.com/cnblogs_com/skynet/201012/201012122157467258.png)
2396 2397

从图中可以看出:
2398 2399 2400 2401
1. 当客户端调用 connect 时,触发了连接请求,向服务器发送了 SYN J 包,这时 connect 进入阻塞状态;  
2. 服务器监听到连接请求,即收到 SYN J 包,调用 accept 函数接收请求向客户端发送 SYN K ,ACK J+1,这时 accept 进入阻塞状态;  
3. 客户端收到服务器的 SYN K ,ACK J+1 之后,这时 connect 返回,并对 SYN K 进行确认;  
4. 服务器收到 ACK K+1 时,accept 返回,至此三次握手完毕,连接建立。
2402

2403
#### Socket 中 TCP 的四次握手释放连接
2404

2405
上面介绍了 socket 中 TCP 的三次握手建立过程,及其涉及的 socket 函数。现在我们介绍 socket 中的四次握手释放连接的过程,请看下图:
2406

2407
![socket 中发送的 TCP 四次握手](http://images.cnblogs.com/cnblogs_com/skynet/201012/201012122157487616.png)
2408 2409 2410

图示过程如下:

2411 2412 2413 2414
1. 某个应用进程首先调用 close 主动关闭连接,这时 TCP 发送一个 FIN M;
2. 另一端接收到 FIN M 之后,执行被动关闭,对这个 FIN 进行确认。它的接收也作为文件结束符传递给应用进程,因为 FIN 的接收意味着应用进程在相应的连接上再也接收不到额外数据;
3. 一段时间之后,接收到文件结束符的应用进程调用 close 关闭它的 socket。这导致它的 TCP 也发送一个 FIN N;
4. 接收到这个 FIN 的源发送端 TCP 对它进行确认。
2415

2416
这样每个方向上都有一个 FIN 和 ACK。
2417

辉哈's avatar
辉哈 已提交
2418 2419 2420
## 数据库

* 数据库事务四大特性:原子性、一致性、分离性、持久性
2421 2422
* 数据库索引:顺序索引、B+ 树索引、hash 索引
[MySQL 索引背后的数据结构及算法原理](http://blog.codinglabs.org/articles/theory-of-mysql-index.html)
2423
* [SQL 约束 (Constraints)](http://www.w3school.com.cn/sql/sql_constraints.asp)
辉哈's avatar
辉哈 已提交
2424

辉哈's avatar
辉哈 已提交
2425 2426 2427
### 范式

* 第一范式(1NF):属性(字段)是最小单位不可再分
2428 2429 2430 2431
* 第二范式(2NF):满足 1NF,每个非主属性完全依赖于主键(消除 1NF 非主属性对码的部分函数依赖)
* 第三范式(3NF):满足 2NF,任何非主属性不依赖于其他非主属性(消除 2NF 主属性对码的传递函数依赖)
* 鲍依斯-科得范式(BCNF):满足 3NF,任何非主属性不能对主键子集依赖(消除 3NF 主属性对码的部分和传递函数依赖)
* 第四范式(4NF):满足 3NF,属性之间不能有非平凡且非函数依赖的多值依赖(消除 3NF 非平凡且非函数依赖的多值依赖)
辉哈's avatar
辉哈 已提交
2432

2433
## 设计模式
辉哈's avatar
辉哈 已提交
2434

2435 2436
> 各大设计模式例子参考:[CSDN专栏 . C++ 设计模式](https://blog.csdn.net/column/details/15392.html) 系列博文

辉哈's avatar
辉哈 已提交
2437
[设计模式工程目录](DesignPattern)
2438

2439 2440
### 单例模式

2441
[单例模式例子](DesignPattern/SingletonPattern)
2442

2443 2444 2445 2446 2447 2448 2449 2450 2451 2452 2453 2454 2455 2456 2457
### 抽象工厂模式

[抽象工厂模式例子](DesignPattern/AbstractFactoryPattern)

### 适配器模式

[适配器模式例子](DesignPattern/AdapterPattern)

### 桥接模式

[桥接模式例子](DesignPattern/BridgePattern)

### 观察者模式

[观察者模式例子](DesignPattern/ObserverPattern)
2458

辉哈's avatar
辉哈 已提交
2459 2460 2461 2462 2463 2464 2465 2466 2467
### 设计模式的六大原则

* 单一职责原则(SRP,Single Responsibility Principle)
* 里氏替换原则(LSP,Liskov Substitution Principle)
* 依赖倒置原则(DIP,Dependence Inversion Principle)
* 接口隔离原则(ISP,Interface Segregation Principle)
* 迪米特法则(LoD,Law of Demeter)
* 开放封闭原则(OCP,Open Close Principle)

辉哈's avatar
辉哈 已提交
2468 2469
## 链接装载库

辉哈's avatar
辉哈 已提交
2470 2471 2472 2473 2474 2475 2476 2477
### 各平台文件格式

平台 | 可执行文件 | 目标文件 | 动态库/共享对象 | 静态库
---|---|---|---|---
Windows|exe|obj|dll|lib
Unix/Linux|ELF、out|o|so|a
Mac|Mach-O|o|dylib、tbd、framework|a、framework

辉哈's avatar
辉哈 已提交
2478 2479 2480 2481
### 内存、栈、堆

一般应用程序内存空间有如下区域:

辉哈's avatar
辉哈 已提交
2482 2483
* 栈:由操作系统自动分配释放,存放函数的参数值、局部变量等的值,用于维护函数调用的上下文
* 堆:一般由程序员分配释放,若程序员不释放,程序结束时可能由操作系统回收,用来容纳应用程序动态分配的内存区域
辉哈's avatar
辉哈 已提交
2484
* 可执行文件映像:存储着可执行文件在内存中的映像,由装载器装载是将可执行文件的内存读取或映射到这里
2485
* 保留区:保留区并不是一个单一的内存区域,而是对内存中受到保护而禁止访问的内存区域的总称,如通常 C 语言讲无效指针赋值为 0(NULL),因此 0 地址正常情况下不可能有效的访问数据
辉哈's avatar
辉哈 已提交
2486 2487 2488 2489 2490 2491 2492 2493 2494 2495 2496 2497 2498 2499 2500 2501 2502

#### 栈

栈保存了一个函数调用所需要的维护信息,常被称为堆栈帧(Stack Frame)或活动记录(Activate Record),一般包含以下几方面:

* 函数的返回地址和参数
* 临时变量:包括函数的非静态局部变量以及编译器自动生成的其他临时变量
* 保存上下文:包括函数调用前后需要保持不变的寄存器

#### 堆

堆分配算法:

* 空闲链表(Free List)
* 位图(Bitmap)
* 对象池

2503
#### “段错误(segment fault)” 或 “非法操作,该内存地址不能 read/write”
辉哈's avatar
辉哈 已提交
2504 2505 2506 2507 2508

典型的非法指针解引用造成的错误。当指针指向一个不允许读写的内存地址,而程序却试图利用指针来读或写该地址时,会出现这个错误。

普遍原因:

2509
* 将指针初始化为 NULL,之后没有给它一个合理的值就开始使用指针
辉哈's avatar
辉哈 已提交
2510 2511 2512 2513 2514 2515
* 没用初始化栈中的指针,指针的值一般会是随机数,之后就直接开始使用指针

### 编译链接

#### 编译链接过程

2516 2517 2518 2519
1. 预编译(预编译器处理如 `#include``#define` 等预编译指令,生成 `.i``.ii` 文件)
2. 编译(编译器进行词法分析、语法分析、语义分析、中间代码生成、目标代码生成、优化,生成 `.s` 文件)
3. 汇编(汇编器把汇编码翻译成机器码,生成 `.o` 文件)
4. 链接(连接器进行地址和空间分配、符号决议、重定位,生成 `.out` 文件)
辉哈's avatar
辉哈 已提交
2520

2521
> 现在版本 GCC 把预编译和编译合成一步,预编译编译程序 cc1、汇编器 as、连接器 ld
辉哈's avatar
辉哈 已提交
2522

2523
> MSVC 编译环境,编译器 cl、连接器 link、可执行文件查看器 dumpbin
辉哈's avatar
辉哈 已提交
2524 2525 2526 2527 2528

#### 目标文件

编译器编译源代码后生成的文件叫做目标文件。目标文件从结构上讲,它是已经编译后的可执行文件格式,只是还没有经过链接的过程,其中可能有些符号或有些地址还没有被调整。

2529
> 可执行文件(Windows 的 `.exe` 和 Linux 的 `ELF`)、动态链接库(Windows 的 `.dll` 和 Linux 的 `.so`)、静态链接库(Windows 的 `.lib` 和 Linux 的 `.a`)都是按照可执行文件格式存储(Windows 按照 PE-COFF,Linux 按照 ELF)
辉哈's avatar
辉哈 已提交
2530 2531 2532

##### 目标文件格式

2533 2534 2535 2536 2537
* Windows 的 PE(Portable Executable),或称为 PE-COFF,`.obj` 格式
* Linux 的 ELF(Executable Linkable Format),`.o` 格式
* Intel/Microsoft 的 OMF(Object Module Format)
* Unix 的 `a.out` 格式
* MS-DOS 的 `.COM` 格式
辉哈's avatar
辉哈 已提交
2538

2539
> PE 和 ELF 都是 COFF(Common File Format)的变种
辉哈's avatar
辉哈 已提交
2540 2541 2542 2543 2544 2545 2546 2547

##### 目标文件存储结构

段 | 功能
--- | ---
File Header | 文件头,描述整个文件的文件属性(包括文件是否可执行、是静态链接或动态连接及入口地址、目标硬件、目标操作系统等)
.text section | 代码段,执行语句编译成的机器代码 
.data section | 数据段,已初始化的全局变量和局部静态变量
2548 2549
.bss section | BSS 段(Block Started by Symbol),未初始化的全局变量和局部静态变量(因为默认值为 0,所以只是在此预留位置,不占空间)
.rodata section | 只读数据段,存放只读数据,一般是程序里面的只读变量(如 const 修饰的变量)和字符串常量
辉哈's avatar
辉哈 已提交
2550 2551 2552 2553 2554 2555 2556 2557 2558 2559 2560 2561 2562 2563 2564 2565 2566
.comment section | 注释信息段,存放编译器版本信息
.note.GNU-stack section | 堆栈提示段 

> 其他段略

#### 链接的接口————符号

在链接中,目标文件之间相互拼合实际上是目标文件之间对地址的引用,即对函数和变量的地址的引用。我们将函数和变量统称为符号(Symbol),函数名或变量名就是符号名(Symbol Name)。

如下符号表(Symbol Table):

Symbol(符号名) | Symbol Value (地址)
--- | ---
main| 0x100
Add | 0x123
... | ...

2567
### Linux 的共享库(Shared Library)
辉哈's avatar
辉哈 已提交
2568

2569
Linux 下的共享库就是普通的 ELF 共享对象。
辉哈's avatar
辉哈 已提交
2570

2571
共享库版本更新应该保证二进制接口 ABI(Application Binary Interface)的兼容
辉哈's avatar
辉哈 已提交
2572 2573 2574 2575 2576 2577 2578 2579 2580 2581 2582

#### 命名

`libname.so.x.y.z`

* x:主版本号,不同主版本号的库之间不兼容,需要重新编译
* y:次版本号,高版本号向后兼容低版本号
* z:发布版本号,不对接口进行更改,完全兼容

#### 路径

2583
大部分包括 Linux 在内的开源系统遵循 FHS(File Hierarchy Standard)的标准,这标准规定了系统文件如何存放,包括各个目录结构、组织和作用。
辉哈's avatar
辉哈 已提交
2584

2585
* `/lib`:存放系统最关键和最基础的共享库,如动态链接器、C 语言运行库、数学库等
辉哈's avatar
辉哈 已提交
2586 2587
* `/usr/lib`:存放非系统运行时所需要的关键性的库,主要是开发库
* `/usr/local/lib`:存放跟操作系统本身并不十分相关的库,主要是一些第三方应用程序的库
辉哈's avatar
辉哈 已提交
2588

2589
> 动态链接器会在 `/lib`、`/usr/lib` 和由 `/etc/ld.so.conf` 配置文件指定的,目录中查找共享库
辉哈's avatar
辉哈 已提交
2590 2591 2592

#### 环境变量

辉哈's avatar
辉哈 已提交
2593 2594 2595
* `LD_LIBRARY_PATH`:临时改变某个应用程序的共享库查找路径,而不会影响其他应用程序
* `LD_PRELOAD`:指定预先装载的一些共享库甚至是目标文件
* `LD_DEBUG`:打开动态链接器的调试功能
辉哈's avatar
辉哈 已提交
2596

2597
### Windows 的动态链接库(Dynamic-Link Library)
辉哈's avatar
辉哈 已提交
2598

2599 2600
<details><summary>Windows 动态链接库例子</summary>

2601
DLL 头文件
辉哈's avatar
辉哈 已提交
2602
```cpp
辉哈's avatar
辉哈 已提交
2603 2604 2605 2606 2607 2608 2609 2610 2611 2612 2613 2614 2615 2616 2617 2618 2619 2620 2621 2622 2623
#ifdef __cplusplus
extern "C" {
#endif

#ifdef _WIN32
#  ifdef MODULE_API_EXPORTS
#    define MODULE_API __declspec(dllexport)
#  else
#    define MODULE_API __declspec(dllimport)
#  endif
#else
#  define MODULE_API
#endif

MODULE_API int module_init();

#ifdef __cplusplus
}
#endif
```

2624
DLL 源文件
辉哈's avatar
辉哈 已提交
2625
```cpp
辉哈's avatar
辉哈 已提交
2626 2627 2628 2629 2630 2631 2632 2633 2634 2635
#define MODULE_API_EXPORTS
#include "module.h"

MODULE_API int module_init()
{
    /* do something useful */
    return 0;
}
```

2636 2637
</details>

辉哈's avatar
辉哈 已提交
2638 2639 2640 2641 2642 2643
### 运行库(Runtime Library)

#### 典型程序运行步骤

1. 操作系统创建进程,把控制权交给程序的入口(往往是运行库中的某个入口函数)
2. 入口函数对运行库和程序运行环境进行初始化(包括堆、I/O、线程、全局变量构造等等)。
2644 2645
3. 入口函数初始化后,调用 main 函数,正式开始执行程序主体部分。
4. main 函数执行完毕后,返回到入口函数进行清理工作(包括全局变量析构、堆销毁、关闭I/O等),然后进行系统调用结束进程。
辉哈's avatar
辉哈 已提交
2646

2647
> 一个程序的 I/O 指代程序与外界的交互,包括文件、管程、网络、命令行、信号等。更广义地讲,I/O 指代操作系统理解为 “文件” 的事物。
辉哈's avatar
辉哈 已提交
2648 2649 2650 2651 2652

#### glibc 入口

`_start -> __libc_start_main -> exit -> _exit`

2653
其中 `main(argc, argv, __environ)` 函数在 `__libc_start_main` 里执行。
辉哈's avatar
辉哈 已提交
2654 2655 2656 2657 2658 2659 2660

#### MSVC CRT 入口

`int mainCRTStartup(void)`

执行如下操作:

2661
1. 初始化和 OS 版本有关的全局变量。
辉哈's avatar
辉哈 已提交
2662
2. 初始化堆。
2663
3. 初始化 I/O。
辉哈's avatar
辉哈 已提交
2664
4. 获取命令行参数和环境变量。
2665 2666 2667
5. 初始化 C 库的一些数据。
6. 调用 main 并记录返回值。
7. 检查错误并将 main 的返回值返回。
辉哈's avatar
辉哈 已提交
2668

2669
#### C 语言运行库(CRT)
辉哈's avatar
辉哈 已提交
2670

辉哈's avatar
辉哈 已提交
2671
大致包含如下功能:
辉哈's avatar
辉哈 已提交
2672 2673

* 启动与退出:包括入口函数及入口函数所依赖的其他函数等。
2674 2675
* 标准函数:有 C 语言标准规定的C语言标准库所拥有的函数实现。
* I/O:I/O 功能的封装和实现。
辉哈's avatar
辉哈 已提交
2676 2677 2678 2679 2680 2681 2682 2683 2684 2685 2686 2687 2688 2689 2690 2691 2692 2693 2694 2695 2696
* 堆:堆的封装和实现。
* 语言实现:语言中一些特殊功能的实现。
* 调试:实现调试功能的代码。

#### C语言标准库(ANSI C)

包含:

* 标准输入输出(stdio.h)
* 文件操作(stdio.h)
* 字符操作(ctype.h)
* 字符串操作(string.h)
* 数学函数(math.h)
* 资源管理(stdlib.h)
* 格式转换(stdlib.h)
* 时间/日期(time.h)
* 断言(assert.h)
* 各种类型上的常数(limits.h & float.h)
* 变长参数(stdarg.h)
* 非局部跳转(setjmp.h)

辉哈's avatar
辉哈 已提交
2697 2698 2699 2700 2701
## 海量数据处理

* [ 海量数据处理面试题集锦](http://blog.csdn.net/v_july_v/article/details/6685962)
* [十道海量数据处理面试题与十个方法大总结](http://blog.csdn.net/v_JULY_v/article/details/6279498)

2702 2703 2704 2705 2706
## 音视频

* [最全实时音视频开发要用到的开源工程汇总](http://www.yunliaoim.com/im/1869.html)
* [18个实时音视频开发中会用到开源项目](http://webrtc.org.cn/18%E4%B8%AA%E5%AE%9E%E6%97%B6%E9%9F%B3%E8%A7%86%E9%A2%91%E5%BC%80%E5%8F%91%E4%B8%AD%E4%BC%9A%E7%94%A8%E5%88%B0%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE/)

辉哈's avatar
辉哈 已提交
2707 2708
## 其他

2709 2710
* [Bjarne Stroustrup 的常见问题](http://www.stroustrup.com/bs_faq.html)
* [Bjarne Stroustrup 的 C++ 风格和技巧常见问题](http://www.stroustrup.com/bs_faq2.html)
辉哈's avatar
辉哈 已提交
2711

辉哈's avatar
辉哈 已提交
2712 2713
## 书籍

辉哈's avatar
辉哈 已提交
2714 2715 2716
### 语言

* 《C++ Primer》
辉哈's avatar
辉哈 已提交
2717 2718
* 《Effective C++》
* 《More Effective C++》
辉哈's avatar
辉哈 已提交
2719
* 《深度探索 C++ 对象模型》
2720 2721
* 《深入理解 C++11》
* 《STL 源码剖析》
辉哈's avatar
辉哈 已提交
2722 2723 2724 2725 2726 2727 2728 2729 2730

### 算法

* 《剑指 Offer》
* 《编程珠玑》
* 《程序员面试宝典》

### 系统

辉哈's avatar
辉哈 已提交
2731
* 《深入理解计算机系统》
辉哈's avatar
辉哈 已提交
2732 2733 2734 2735 2736 2737 2738 2739 2740 2741
* 《Windows 核心编程》
* 《Unix 环境高级编程》

### 网络

* 《Unix 网络编程》
* 《TCP/IP 详解》

### 其他

辉哈's avatar
辉哈 已提交
2742 2743 2744 2745 2746 2747 2748 2749 2750
* 《程序员的自我修养》

## 复习刷题网站

* [leetcode](https://leetcode.com/)
* [牛客网](https://www.nowcoder.net/)
* [慕课网](https://www.imooc.com/)
* [菜鸟教程](http://www.runoob.com/)

辉哈's avatar
辉哈 已提交
2751 2752
## 招聘时间岗位

辉哈's avatar
加*  
辉哈 已提交
2753
* [牛客网 . 2018 IT名企校招指南](https://www.nowcoder.com/activity/campus2018)
辉哈's avatar
辉哈 已提交
2754

辉哈's avatar
辉哈 已提交
2755 2756
## 面试题目经验

2757 2758
### 牛客网

辉哈's avatar
辉哈 已提交
2759
* [牛客网 . 2017秋季校园招聘笔经面经专题汇总](https://www.nowcoder.com/discuss/12805)
2760 2761 2762 2763 2764
* [牛客网 . 史上最全2017春招面经大合集!!](https://www.nowcoder.com/discuss/25268)
* [牛客网 . 面试题干货在此](https://www.nowcoder.com/discuss/57978)

### 知乎

辉哈's avatar
辉哈 已提交
2765
* [知乎 . 互联网求职路上,你见过哪些写得很好、很用心的面经?最好能分享自己的面经、心路历程。](https://www.zhihu.com/question/29693016)
辉哈's avatar
辉哈 已提交
2766 2767
* [知乎 . 互联网公司最常见的面试算法题有哪些?](https://www.zhihu.com/question/24964987)
* [知乎 . 面试 C++ 程序员,什么样的问题是好问题?](https://www.zhihu.com/question/20184857)
2768 2769 2770

### CSDN

辉哈's avatar
辉哈 已提交
2771 2772 2773 2774
* [CSDN . 全面整理的C++面试题](http://blog.csdn.net/ljzcome/article/details/574158)
* [CSDN . 百度研发类面试题(C++方向)](http://blog.csdn.net/Xiongchao99/article/details/74524807?locationNum=6&fps=1)
* [CSDN . c++常见面试题30道](http://blog.csdn.net/fakine/article/details/51321544)
* [CSDN . 腾讯2016实习生面试经验(已经拿到offer)](http://blog.csdn.net/onever_say_love/article/details/51223886)
2775 2776 2777 2778 2779 2780 2781 2782 2783

### cnblogs

* [cnblogs . C++面试集锦( 面试被问到的问题 )](https://www.cnblogs.com/Y1Focus/p/6707121.html)
* [cnblogs . C/C++ 笔试、面试题目大汇总](https://www.cnblogs.com/fangyukuan/archive/2010/09/18/1829871.html)
* [cnblogs . 常见C++面试题及基本知识点总结(一)](https://www.cnblogs.com/LUO77/p/5771237.html)

### Segmentfault

辉哈's avatar
辉哈 已提交
2784
* [segmentfault . C++常见面试问题总结](https://segmentfault.com/a/1190000003745529)