逆向基础笔记二十一汇编指针（二）

lyl610abc 发表于 2021-3-10 01:11

本帖最后由 lyl610abc 于 2021-3-12 16:30 编辑

继续更新个人的学习笔记，
其它笔记传送门
逆向基础笔记一进制篇
逆向基础笔记二数据宽度和逻辑运算
逆向基础笔记三通用寄存器和内存读写
逆向基础笔记四堆栈篇
逆向基础笔记五标志寄存器
逆向基础笔记六汇编跳转和比较指令
逆向基础笔记七堆栈图（重点）
逆向基础笔记八反汇编分析C语言
逆向基础笔记九 C语言内联汇编和调用协定
逆向基础笔记十汇编寻找C程序入口
逆向基础笔记十一汇编C语言基本类型
逆向基础笔记十二汇编全局和局部变量
逆向基础笔记十三汇编C语言类型转换
逆向基础笔记十四汇编嵌套if else
逆向基础笔记十五汇编比较三种循环
逆向基础笔记十六汇编一维数组
逆向基础笔记十七汇编二维数组位移乘法
逆向基础笔记十八汇编结构体和内存对齐
逆向基础笔记十九汇编switch比较if else
逆向基础笔记二十汇编指针（一）
逆向基础笔记二十二汇编指针（三）
逆向基础笔记二十三汇编指针（四）
逆向基础笔记二十四汇编指针（五）系列完结
# 指针二

先前介绍了指针的一些基本的知识，但都没有提到地址的概念，下面承接之前的笔记，继续学习指针

下面要介绍三个相关的内容：**获取变量的数据类型** 、 **取变量地址**和**取地址中存储的数据**

## 获取变量的数据类型

在C语言中可以使用下面的方法获取一个变量的数据类型：

### 代码

```c
#include "stdafx.h"
#include <typeinfo>
void function(){
   char**** a;
   printf("%s\n",typeid(a).name());
}
int main(int argc, char* argv[])
{
   function();
   return 0;
}
```

### 运行结果

!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210309223919194.png)

### 使用方式

通过上面的例子可以知道使用方式首先要包含一个相关的**头文件**typeinfo

然后使用该头文件的方法typeid(变量).name()即可获得变量对应的数据类型

------

## 取变量地址

在C语言中可以在变量前加上&符号来获取一个变量的地址

首先看看取回来地址的类型

### 取地址的返回类型

```c
#include "stdafx.h"
#include <typeinfo>
void function(){
   char a;
   short b;
   int c;
   char* d;
   printf("%s\n",typeid(&a).name());
   printf("%s\n",typeid(&b).name());
   printf("%s\n",typeid(&c).name());
   printf("%s\n",typeid(&d).name());
}

int main(int argc, char* argv[])
{
   function();
   return 0;
}
```

#### 运行结果

!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210309224811959.png)

------

#### 分析结果

不难发现，所有取地址返回的类型都为原本变量的类型后加个\*，也契合了本笔记的主题——指针

### 取地址的内容

通过前面的分析得出了取出的地址类型是一个指针类型，现在要观察其存储的内容

#### 代码

```c
#include "stdafx.h"
#include <typeinfo>
//为了方便观察地址先声明为全局变量
int a;
void function(){
a=610;
   int* b=&a;
printf("%x\n",b);
}

int main(int argc, char* argv[])
{
   function();
   return 0;
}
```

#### 运行结果

!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210309231812753.png)

#### 反汇编代码

```assembly
11:    a=610;
00401038 mov       dword ptr ,262h
12:    int* b=&a;
00401042 mov       dword ptr ,offset a (00427c48)
13:    printf("%x\n",b);
```

通过a的赋值语句可以看到a存储在00427c48这个内存地址中

```assembly
11:    a=610;
00401038 mov       dword ptr ,262h
```

------

再看下面的指针赋值语句

```assembly
12:    int* b=&a;
00401042 mov       dword ptr ,offset a (00427c48)
```

这里的offset a是vc6.0为了方便使用者查看生成的，实际上的语句为：

```assembly
mov dword ptr ss:,0x427C48
```

也就是直接将全局变量a的地址00427c48赋给b

------

#### 代码二

前面声明的变量为全局变量，现在来看看局部变量的情况：

```c
#include "stdafx.h"
#include <typeinfo>
void function(){
//这里a声明为局部变量
   int a=610;
   int* b=&a;
   printf("%x\n",b);
}

int main(int argc, char* argv[])
{
   function();
   return 0;
}
```

------

#### 运行结果二

!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210309235502045.png)

此时的地址显然就是一个堆栈中的地址，对应了变量存储在堆栈中

#### 反汇编代码二

```assembly
11:    int a=610;
00401038 mov       dword ptr ,262h
12:    int* b=&a;
0040103F lea       eax,
00401042 mov       dword ptr ,eax
13:    printf("%x\n",b);
```

可以看到此时是通过lea指令将变量a的地址ebp-4传给eax，然后再将eax赋值给b

------

## 取地址中存储数据

前面讲了如何获取一个变量的地址，那么在获取完地址后，再说说如何获取这地址中存储的数据

在C语言中，在一个**指针类型**的变量前面加上\*符号，即可取出该地址里所存储的内容

### 取地址数据的返回类型

如法炮制，观察取地址数据的返回类型

#### 代码

```c
#include "stdafx.h"
#include <typeinfo>
void function(){
   int***a=(int***) 610;
   printf("%s\n",typeid(*a).name());
   printf("%s\n",typeid(**a).name());
   printf("%s\n",typeid(***a).name());
}
int main(int argc, char* argv[])
{
   function();
   return 0;
}
```

#### 运行结果

!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310000600529.png)

------

#### 分析结果

不难发现，所有取地址数据返回的类型都为原本变量的类型后减个\*，可以说是和&取地址正好相反

不同的是对于多级指针，可以一次使用多个\*来多次取地址中存储的数据

### 取地址数据的内容

前面了解了\*符号的使用，现在来看个稍微复杂点的例子

#### 代码

```c
#include "stdafx.h"
#include <typeinfo>
int a;
void function(){
   a=610;
   int* b=&a;
   int** c=&b;
   int*** d=&c;
   c=*d;
   b=*c;
   a=*b;

b=**d;
a=**c;

a=***d;
}
int main(int argc, char* argv[])
{
   function();
   return 0;
}
```

#### 反汇编代码

```assembly
11:    a=610;
00401038 mov       dword ptr ,262h
12:    int* b=&a;
00401042 mov       dword ptr ,offset a (00427c50)
13:    int** c=&b;
00401049 lea       eax,
0040104C mov       dword ptr ,eax
14:    int*** d=&c;
0040104F lea       ecx,
00401052 mov       dword ptr ,ecx
15:    c=*d;
00401055 mov       edx,dword ptr
00401058 mov       eax,dword ptr
0040105A mov       dword ptr ,eax
16:    b=*c;
0040105D mov       ecx,dword ptr
00401060 mov       edx,dword ptr
00401062 mov       dword ptr ,edx
17:    a=*b;
00401065 mov       eax,dword ptr
00401068 mov       ecx,dword ptr
0040106A mov       dword ptr ,ecx
18:
19:    b=**d;
00401070 mov       edx,dword ptr
00401073 mov       eax,dword ptr
00401075 mov       ecx,dword ptr
00401077 mov       dword ptr ,ecx
20:    a=**c;
0040107A mov       edx,dword ptr
0040107D mov       eax,dword ptr
0040107F mov       ecx,dword ptr
00401081 mov       dword ptr ,ecx
21:
22:    a=***d;
00401087 mov       edx,dword ptr
0040108A mov       eax,dword ptr
0040108C mov       ecx,dword ptr
0040108E mov       edx,dword ptr
00401090 mov       dword ptr ,edx
```

#### 分析反汇编

首先将各变量信息整理出来，方便后面分析：

| 变量 | 变量地址       | 变量内容/地址的值（十六进制） |
| ---- | ------------------ | ----------------------------- |
| a | 00427c50       | 262（对应十进制为610）    |
| b | ebp-4 = 0012FF28 | 00427C50                   |
| c | ebp-8 = 0012FF24 | 0012FF28                   |
| d | ebp-0Ch = 0012FF20 | 0012FF24                   |

------

代码中涉及的变量较多，这里只拿最复杂的 a=***d来作分析，其它留作样例

```assembly
22:    a=***d;
00401087 mov       edx,dword ptr
0040108A mov       eax,dword ptr
0040108C mov       ecx,dword ptr
0040108E mov       edx,dword ptr
00401090 mov       dword ptr ,edx
```

------

1.这里的ebp-0Ch对应的是d的地址，此时就是将d赋值给edx

```assembly
00401087 mov       edx,dword ptr
```

!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310002638753.png)

结合内存里的数据可以得到：d的地址=ebp-0Ch=0012FF20，d==0012FF24

这里的代码相当于

```assembly
00401087 mov       edx,0012FF24h(d)
```

------

2.将前面edx地址里存储的数据赋值给eax，此时的存储的其实就是c

```assembly
0040108A mov       eax,dword ptr
```

!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310002914650.png)

结合内存里的数据可以得到：d=edx=0012FF24，=0012FF28=c

这里的代码相当于

```assembly
0040108A mov       eax,0012FF28(c)
```

------

3.将前面eax地址里存储的数据赋值给ecx，此时的存储的其实就是b

```assembly
0040108C mov       ecx,dword ptr
```

!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310003238462.png)

结合内存里的数据可以得到：c=eax=0012FF28，b==00427C50

这里的代码相当于

```assembly
0040108C mov       ecx,00427C50(b)
```

------

4.将前面ecx地址里存储的数据赋值给edx，此时的存储的其实就是a

```assembly
0040108E mov       edx,dword ptr
```

!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310004636277.png)

结合内存里的数据可以得到：b=ecx=00427C50，a==262h=610

这里的代码相当于

```assembly
0040108E mov       edx,262h
```

------

5.最后将edx赋值给a

```assembly
00401090 mov       dword ptr ,edx
```

#### 小总结

可以看到，被赋值变量 = \* 赋值变量在汇编中的形式为：mov 被赋值变量，[赋值变量]

如果有多个\*，则多执行几次来取值

# 总结

- 可以在变量前加上&符号来**获取变量地址**
- 取地址返回的类型都为原本变量的类型后加个\*，也就是个**指针类型**
- 在一个**指针类型**的变量前面加上\*符号，即可**取出该地址里所存储的内容**
- 取地址数据返回的类型都为原本变量的类型后减个\*，可以说是**和&取地址正好相反**
- 对于多级指针，可以**一次使用多个**\*来多次**取地址中存储的数据**

PrincessSnow 发表于 2021-3-10 03:26

谢谢大佬收藏了

sniper9527 发表于 2021-3-10 08:34

感谢分享。

ytdzjun 发表于 2021-3-10 08:56

开卷有益，谢谢分享

love514415 发表于 2021-3-10 09:09

大佬慢点... 昨天的还没学完~

geniusjoy 发表于 2021-3-10 09:50

学习，学习。谢谢分享！！！！！！！！！

565266718 发表于 2021-3-10 10:59

感谢分享。。。

zpy532 发表于 2021-3-10 12:09

感谢分享

cptw 发表于 2021-3-10 13:03

感谢分享

psxz 发表于 2021-3-10 14:37

感谢楼主，学习啦

页: [1] 2 3

吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn's Archiver

逆向基础笔记二十一 汇编 指针（二）

逆向基础笔记二十一汇编指针（二）