作业1：计算机是如何工作的？20135115臧文君-白红宇

作业1：计算机是如何工作的？20135115臧文君

阅读量：6878 次

发布时间：2019-06-26

本文共 2517 字，大约阅读时间需要 8 分钟。

计算机是如何工作的？

注：作者：臧文君，原创作品转载请注明出处，《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

一、存储程序计算机工作模型

1、冯诺依曼体系结构：指存储程序计算机

（1）硬件的角度：分为CPU+内存+总线

CPU中的一个寄存器---IP：Instruction Pointer，指向内存的CS：Code Segment

16位的CPU上叫IP，32位叫EIP，64位叫IIP

CPU通过IP从内存中取一条指令执行，执行过后，IP自加1，再取下一条指令执行

（2）程序员的角度：内存保存指令和数据，CPU负责解释和执行指令，两者通过总线连接

2、API：程序员与计算机的接口界面 Application Program Interface

ABI：程序与CPU的接口界面，二进制的接口，主要是指令编码 Application Binary Interface

二、X86汇编基础

1、X86 CPU的寄存器

（1）通用寄存器

16-bit：AX,BX,CX,DX.BP,SI,DI,SP

32-bit：EAX,EBX,ECX,EDX.EBP,ESI,EDI,ESP

*注*：堆栈是计算机中非常基础性的东西

（2）段寄存器：CS,DS,ES,SS,FS,GS

代码段和堆栈段寄存器使用最多

CPU在实际取指令时根据cs:eip来准确定位一个指令

（3）标识寄存器：EFLAGS register

用于标识当前的状态

*注*：X86_64 Registers寄存器，与32位的在核心机制上差别不大，其通用寄存器扩展成64位，前面标R。

2、X86汇编指令一（mov指令及几种内存寻址方式）

b--8位，w--16位，l--32位，q--64位

（1）寄存器寻址register mode

以%开头的寄存器标示符，与内存无关

例：movl %eax,%edx edx=eax;

（2）立即寻址immediate

立即数是以$开头的数值，与内存无关

例：movl $0x123,%edx edx=0x123; 0x：16进制

（3）直接寻址direct

直接访问一个指定的内存地址的数据

例：movl 0x123,%edx edx=*(int32_t*)0x123;

这里的0x123指内存地址为16进制数123，将该地址中的数据放到edx中

（4）间接寻址indirect

将寄存器的值作为一个内存地址来访问内存

例：movl (%ebx),%edx edx=*(int32_t*)ebx;

ebx这个寄存器存的值是一个内存地址，加（）表示之歌内存地址存储的数据

（5）变址寻址displaced

变址寻址在间接寻址之时改变寄存器的数值

例：movl 4(%ebx),%edx edx=*(int32_t*)(ebx+4);

注：AT&T汇编格式与Intel汇编格式略有不同

Linux内核使用的是AT&T汇编格式

3、X86汇编指令二（push,pop,call,ret）

ebp--栈底，esp--栈底，栈是向下增长

push压栈，pop弹栈

call函数调用堆栈，是理解C代码在CPU上执行的关键

将当前的eip压栈，再将其附一个新值

ret将call时保存的eip值再还原到eip寄存器中

注：*代表这些指令不能被程序员直接使用，属于伪指令，因为eip寄存器不能被直接修改，只能通过特殊指令间接修改

4、分析几个汇编指令片段

（1）

分析：

（2）

分析：

（3）

分析：

三、汇编一个简单的C程序分析其汇编指令执行过程

编译语句：gcc -S -o -main.s main.c -m32

在编译好的文件中，所有以.开头的内容都是用于链接时的辅助信息，在实际中不会被执行，因此可以删除，留下纯汇编代码。

enter将栈置为空

leave撤销函数堆栈

函数调用堆栈是由逻辑上多个堆栈叠加起来的

函数的返回值默认使用eax寄存器存储返回给上一级函数

四、实验部分

在学习过了孟老师的视频教学之后，实验做起来相对容易一些。

1、我使用ls命令查看了当前目录下的文件，进入Code/shiyanlou_cs195目录下进行代码编写。

2、创建main.c文件，编写代码，我将所给的示例程序中的数值进行了修改。

3、保存之后，使用gcc -S -o main.s main.c -m32命令生成汇编语言文件。

4、打开main.s文件，里面是C程序对应的汇编语言。

5、为了分析方便，将所有以.开头的语句都删除，我查了一下Linux环境下的命令，可以用dd直接删除一行代码，剩下的就是纯汇编代码。

6、分析

通过这次实验，使我对如何反汇编一个C程序有了一定了解，使用gcc -S -o main.s main.c -m32命令，-m32主要是指生成32位的格式。另外，调用其它函数时，将指令指针入栈保存，以便函数执行结束能返回来继续下一条指令的执行，相当于push eip。函数参数入栈，参数入栈顺序是从右到左进栈。函数退出时，将esp赋值给ebp，从而释放当前函数所使用的栈空间。

五、总结

这次课程学习的内容主要围绕计算机是如何工作的，学习了计算机的冯诺依曼体系结构、X86 CPU寄存器、寄存器的寻址方式和一些汇编指令，并通过实验巩固对知识的理解。

我觉得计算机的工作依靠的就是一条条汇编语句的执行，CPU通过IP从内存中取一条指令执行，在堆栈中根据指令找到相应地址，将其内容返回到内存中，然后IP自加1，再取下一条指令执行。汇编语言是计算机可以识别的语言，因此我们理解起来没有C语言那样简洁明了。所以我觉得在分析一段汇编代码的时候，需要自己动手画出堆栈的变化，从而准确清晰的了解每一步堆栈的变化。再如call、ret、enter、leave指令，我们要熟记他们对应的ip/bp/sp的操作变化，从而加快我们对代码的分析。