博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
作业1:计算机是如何工作的?20135115臧文君
阅读量:6878 次
发布时间:2019-06-26

本文共 2517 字,大约阅读时间需要 8 分钟。

计算机是如何工作的?

 

注:作者:臧文君,原创作品转载请注明出处,《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

 

一、存储程序计算机工作模型

1冯诺依曼体系结构:指存储程序计算机

(1)硬件的角度:分为CPU+内存+总线

CPU中的一个寄存器---IPInstruction Pointer,指向内存的CSCode Segment

16位的CPU上叫IP32位叫EIP64位叫IIP

CPU通过IP从内存中取一条指令执行,执行过后,IP自加1,再取下一条指令执行

2)程序员的角度:内存保存指令和数据,CPU负责解释和执行指令,两者通过总线连接

 

 

2API:程序员与计算机的接口界面  Application Program Interface

ABI:程序与CPU的接口界面,二进制的接口,主要是指令编码  Application Binary Interface

 

二、X86汇编基础

1X86 CPU的寄存器

1)通用寄存器

 

16-bitAX,BX,CX,DX.BP,SI,DI,SP

32-bitEAX,EBX,ECX,EDX.EBP,ESI,EDI,ESP

**:堆栈是计算机中非常基础性的东西

2)段寄存器:CS,DS,ES,SS,FS,GS

 

代码段和堆栈段寄存器使用最多

CPU在实际取指令时根据cs:eip来准确定位一个指令

3)标识寄存器:EFLAGS register

用于标识当前的状态

**X86_64 Registers寄存器,与32位的在核心机制上差别不大,其通用寄存器扩展成64位,前面标R

 

 

2X86汇编指令一(mov指令及几种内存寻址方式)

b--8位,w--16位,l--32位,q--64

 

1)寄存器寻址register mode

%开头的寄存器标示符,与内存无关

例:movl %eax,%edx    edx=eax;

2)立即寻址immediate

立即数是以$开头的数值,与内存无关

例:movl $0x123,%edx    edx=0x123;   0x16进制

3)直接寻址direct

直接访问一个指定的内存地址的数据

例:movl 0x123,%edx    edx=*(int32_t*)0x123;

这里的0x123指内存地址为16进制数123,将该地址中的数据放到edx

4)间接寻址indirect

将寄存器的值作为一个内存地址来访问内存

例:movl (%ebx),%edx    edx=*(int32_t*)ebx;

ebx这个寄存器存的值是一个内存地址,加()表示之歌内存地址存储的数据

5)变址寻址displaced

变址寻址在间接寻址之时改变寄存器的数值

例:movl 4(%ebx),%edx    edx=*(int32_t*)(ebx+4);

 

注:AT&T汇编格式与Intel汇编格式略有不同

Linux内核使用的是AT&T汇编格式

 

3X86汇编指令二(push,pop,call,ret

 

ebp--栈底,esp--栈底,栈是向下增长

push压栈,pop弹栈

 call函数调用堆栈,是理解C代码在CPU上执行的关键

将当前的eip压栈,再将其附一个新值

retcall时保存的eip值再还原到eip寄存器中

注:*代表这些指令不能被程序员直接使用,属于伪指令,因为eip寄存器不能被直接修改,只能通过特殊指令间接修改

 

4、分析几个汇编指令片段

1

 

分析:

 

2

 

分析:

3

 

分析:

 

 

三、汇编一个简单的C程序分析其汇编指令执行过程

编译语句:gcc -S -o -main.s main.c -m32

在编译好的文件中,所有以.开头的内容都是用于链接时的辅助信息,在实际中不会被执行,因此可以删除,留下纯汇编代码。

 

enter将栈置为空

leave撤销函数堆栈

函数调用堆栈是由逻辑上多个堆栈叠加起来的

函数的返回值默认使用eax寄存器存储返回给上一级函数

 

四、实验部分

在学习过了孟老师的视频教学之后,实验做起来相对容易一些。 

1、我使用ls命令查看了当前目录下的文件,进入Code/shiyanlou_cs195目录下进行代码编写。

 

2、创建main.c文件,编写代码,我将所给的示例程序中的数值进行了修改。

 

3、保存之后,使用gcc -S -o main.s main.c -m32命令生成汇编语言文件。

 

4、打开main.s文件,里面是C程序对应的汇编语言。

 

5、为了分析方便,将所有以.开头的语句都删除,我查了一下Linux环境下的命令,可以用dd直接删除一行代码,剩下的就是纯汇编代码。

 

6、分析

 

    通过这次实验,使我对如何反汇编一个C程序有了一定了解,使用gcc -S -o main.s main.c -m32命令,-m32主要是指生成32位的格式。另外,调用其它函数时,将指令指针入栈保存,以便函数执行结束能返回来继续下一条指令的执行,相当于push eip。函数参数入栈,参数入栈顺序是从右到左进栈。函数退出时,将esp赋值给ebp,从而释放当前函数所使用的栈空间。

 

五、总结

      这次课程学习的内容主要围绕计算机是如何工作的,学习了计算机的冯诺依曼体系结构、X86 CPU寄存器、寄存器的寻址方式和一些汇编指令,并通过实验巩固对知识的理解。

      我觉得计算机的工作依靠的就是一条条汇编语句的执行,CPU通过IP从内存中取一条指令执行,在堆栈中根据指令找到相应地址,将其内容返回到内存中,然后IP自加1,再取下一条指令执行。汇编语言是计算机可以识别的语言,因此我们理解起来没有C语言那样简洁明了。所以我觉得在分析一段汇编代码的时候,需要自己动手画出堆栈的变化,从而准确清晰的了解每一步堆栈的变化。再如callretenterleave指令,我们要熟记他们对应的ip/bp/sp的操作变化,从而加快我们对代码的分析。

 

转载于:https://www.cnblogs.com/CatherineZang/p/5218570.html

你可能感兴趣的文章
安卓开发中个人能力的进阶进程
查看>>
人工智能10年将有颠覆性改变
查看>>
探秘AOP实现原理
查看>>
单点登录(SSO)简介
查看>>
2018最新大数据学习路线分享
查看>>
利用SVG制作不规矩背景的链接导航
查看>>
Linux - 一次运行多个命令
查看>>
10.C# -- 函数参数,参数数组,值传递函数,引用传递函数,输出函数,无参函数...
查看>>
BT5设置ip地址
查看>>
转载/验证码
查看>>
Surface、SurfaceView、SurfaceHolder和SurfaceHolder.Callback之间的联系
查看>>
什么是Data Store and Data Collector?
查看>>
我的友情链接
查看>>
php培训11.30
查看>>
Effective Java读后感
查看>>
windows下两个无线网卡 一个内网 一个外网
查看>>
tcp nat 负载均衡
查看>>
起点,游戏开发的梦想与技能点
查看>>
MPLS 流量工程的配置与各大属性调整详解
查看>>
107个常用Javascript语句
查看>>