逆向基础笔记二十一 汇编 指针(二)
本帖最后由 lyl610abc 于 2021-3-12 16:30 编辑继续更新个人的学习笔记,
其它笔记传送门
逆向基础笔记一 进制篇
逆向基础笔记二 数据宽度和逻辑运算
逆向基础笔记三 通用寄存器和内存读写
逆向基础笔记四 堆栈篇
逆向基础笔记五 标志寄存器
逆向基础笔记六 汇编跳转和比较指令
逆向基础笔记七 堆栈图(重点)
逆向基础笔记八 反汇编分析C语言
逆向基础笔记九 C语言内联汇编和调用协定
逆向基础笔记十 汇编寻找C程序入口
逆向基础笔记十一 汇编C语言基本类型
逆向基础笔记十二 汇编 全局和局部 变量
逆向基础笔记十三 汇编C语言类型转换
逆向基础笔记十四 汇编嵌套if else
逆向基础笔记十五 汇编比较三种循环
逆向基础笔记十六 汇编一维数组
逆向基础笔记十七 汇编二维数组 位移 乘法
逆向基础笔记十八 汇编 结构体和内存对齐
逆向基础笔记十九 汇编switch比较if else
逆向基础笔记二十 汇编 指针(一)
逆向基础笔记二十二 汇编 指针(三)
逆向基础笔记二十三 汇编 指针(四)
逆向基础笔记二十四 汇编 指针(五) 系列完结
# 指针二
先前介绍了指针的一些基本的知识,但都没有提到地址的概念,下面承接之前的笔记,继续学习指针
下面要介绍三个相关的内容:**获取变量的数据类型** 、 **取变量地址**和**取地址中存储的数据**
## 获取变量的数据类型
在C语言中可以使用下面的方法获取一个变量的数据类型:
### 代码
```c
#include "stdafx.h"
#include <typeinfo>
void function(){
char**** a;
printf("%s\n",typeid(a).name());
}
int main(int argc, char* argv[])
{
function();
return 0;
}
```
### 运行结果
!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210309223919194.png)
### 使用方式
通过上面的例子可以知道使用方式首先要包含一个相关的**头文件**typeinfo
然后使用该头文件的方法typeid(变量).name()即可获得变量对应的数据类型
------
## 取变量地址
在C语言中可以在变量前加上&符号来获取一个变量的地址
首先看看取回来地址的类型
### 取地址的返回类型
```c
#include "stdafx.h"
#include <typeinfo>
void function(){
char a;
short b;
int c;
char* d;
printf("%s\n",typeid(&a).name());
printf("%s\n",typeid(&b).name());
printf("%s\n",typeid(&c).name());
printf("%s\n",typeid(&d).name());
}
int main(int argc, char* argv[])
{
function();
return 0;
}
```
#### 运行结果
!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210309224811959.png)
------
#### 分析结果
不难发现,所有取地址返回的类型都为原本变量的类型后加个\*,也契合了本笔记的主题——指针
### 取地址的内容
通过前面的分析得出了取出的地址类型是一个指针类型,现在要观察其存储的内容
#### 代码
```c
#include "stdafx.h"
#include <typeinfo>
//为了方便观察地址 先声明为全局变量
int a;
void function(){
a=610;
int* b=&a;
printf("%x\n",b);
}
int main(int argc, char* argv[])
{
function();
return 0;
}
```
#### 运行结果
!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210309231812753.png)
#### 反汇编代码
```assembly
11: a=610;
00401038 mov dword ptr ,262h
12: int* b=&a;
00401042 mov dword ptr ,offset a (00427c48)
13: printf("%x\n",b);
```
通过a的赋值语句可以看到a存储在00427c48这个内存地址中
```assembly
11: a=610;
00401038 mov dword ptr ,262h
```
------
再看下面的指针赋值语句
```assembly
12: int* b=&a;
00401042 mov dword ptr ,offset a (00427c48)
```
这里的offset a是vc6.0为了方便使用者查看生成的,实际上的语句为:
```assembly
mov dword ptr ss:,0x427C48
```
也就是直接将全局变量a的地址00427c48赋给b
------
#### 代码二
前面声明的变量为全局变量,现在来看看局部变量的情况:
```c
#include "stdafx.h"
#include <typeinfo>
void function(){
//这里a声明为局部变量
int a=610;
int* b=&a;
printf("%x\n",b);
}
int main(int argc, char* argv[])
{
function();
return 0;
}
```
------
#### 运行结果二
!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210309235502045.png)
此时的地址显然就是一个堆栈中的地址,对应了变量存储在堆栈中
#### 反汇编代码二
```assembly
11: int a=610;
00401038 mov dword ptr ,262h
12: int* b=&a;
0040103F lea eax,
00401042 mov dword ptr ,eax
13: printf("%x\n",b);
```
可以看到此时是通过lea指令将变量a的地址ebp-4传给eax,然后再将eax赋值给b
------
## 取地址中存储数据
前面讲了如何获取一个变量的地址,那么在获取完地址后,再说说如何获取这地址中存储的数据
在C语言中,在一个**指针类型**的变量前面加上\*符号,即可取出该地址里所存储的内容
### 取地址数据的返回类型
如法炮制,观察取地址数据的返回类型
#### 代码
```c
#include "stdafx.h"
#include <typeinfo>
void function(){
int***a=(int***) 610;
printf("%s\n",typeid(*a).name());
printf("%s\n",typeid(**a).name());
printf("%s\n",typeid(***a).name());
}
int main(int argc, char* argv[])
{
function();
return 0;
}
```
#### 运行结果
!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310000600529.png)
------
#### 分析结果
不难发现,所有取地址数据返回的类型都为原本变量的类型后减个\*,可以说是和&取地址正好相反
不同的是对于多级指针,可以一次使用多个\*来多次取地址中存储的数据
### 取地址数据的内容
前面了解了\*符号的使用,现在来看个稍微复杂点的例子
#### 代码
```c
#include "stdafx.h"
#include <typeinfo>
int a;
void function(){
a=610;
int* b=&a;
int** c=&b;
int*** d=&c;
c=*d;
b=*c;
a=*b;
b=**d;
a=**c;
a=***d;
}
int main(int argc, char* argv[])
{
function();
return 0;
}
```
#### 反汇编代码
```assembly
11: a=610;
00401038 mov dword ptr ,262h
12: int* b=&a;
00401042 mov dword ptr ,offset a (00427c50)
13: int** c=&b;
00401049 lea eax,
0040104C mov dword ptr ,eax
14: int*** d=&c;
0040104F lea ecx,
00401052 mov dword ptr ,ecx
15: c=*d;
00401055 mov edx,dword ptr
00401058 mov eax,dword ptr
0040105A mov dword ptr ,eax
16: b=*c;
0040105D mov ecx,dword ptr
00401060 mov edx,dword ptr
00401062 mov dword ptr ,edx
17: a=*b;
00401065 mov eax,dword ptr
00401068 mov ecx,dword ptr
0040106A mov dword ptr ,ecx
18:
19: b=**d;
00401070 mov edx,dword ptr
00401073 mov eax,dword ptr
00401075 mov ecx,dword ptr
00401077 mov dword ptr ,ecx
20: a=**c;
0040107A mov edx,dword ptr
0040107D mov eax,dword ptr
0040107F mov ecx,dword ptr
00401081 mov dword ptr ,ecx
21:
22: a=***d;
00401087 mov edx,dword ptr
0040108A mov eax,dword ptr
0040108C mov ecx,dword ptr
0040108E mov edx,dword ptr
00401090 mov dword ptr ,edx
```
#### 分析反汇编
首先将各变量信息整理出来,方便后面分析:
| 变量 | 变量地址 | 变量内容/地址的值(十六进制) |
| ---- | ------------------ | ----------------------------- |
| a | 00427c50 | 262(对应十进制为610) |
| b | ebp-4 = 0012FF28 | 00427C50 |
| c | ebp-8 = 0012FF24 | 0012FF28 |
| d | ebp-0Ch = 0012FF20 | 0012FF24 |
------
代码中涉及的变量较多,这里只拿最复杂的 a=***d来作分析,其它留作样例
```assembly
22: a=***d;
00401087 mov edx,dword ptr
0040108A mov eax,dword ptr
0040108C mov ecx,dword ptr
0040108E mov edx,dword ptr
00401090 mov dword ptr ,edx
```
------
1.这里的ebp-0Ch对应的是d的地址,此时就是将d赋值给edx
```assembly
00401087 mov edx,dword ptr
```
!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310002638753.png)
结合内存里的数据可以得到:d的地址=ebp-0Ch=0012FF20,d==0012FF24
这里的代码相当于
```assembly
00401087 mov edx,0012FF24h(d)
```
------
2.将前面edx地址里存储的数据赋值给eax,此时的存储的其实就是c
```assembly
0040108A mov eax,dword ptr
```
!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310002914650.png)
结合内存里的数据可以得到:d=edx=0012FF24,=0012FF28=c
这里的代码相当于
```assembly
0040108A mov eax,0012FF28(c)
```
------
3.将前面eax地址里存储的数据赋值给ecx,此时的存储的其实就是b
```assembly
0040108C mov ecx,dword ptr
```
!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310003238462.png)
结合内存里的数据可以得到:c=eax=0012FF28,b==00427C50
这里的代码相当于
```assembly
0040108C mov ecx,00427C50(b)
```
------
4.将前面ecx地址里存储的数据赋值给edx,此时的存储的其实就是a
```assembly
0040108E mov edx,dword ptr
```
!(https://610-pic-bed.oss-cn-shenzhen.aliyuncs.com/image-20210310004636277.png)
结合内存里的数据可以得到:b=ecx=00427C50,a==262h=610
这里的代码相当于
```assembly
0040108E mov edx,262h
```
------
5.最后将edx赋值给a
```assembly
00401090 mov dword ptr ,edx
```
#### 小总结
可以看到,被赋值变量 = \* 赋值变量 在汇编中的形式为:mov 被赋值变量,[赋值变量]
如果有多个\*,则多执行几次来取值
# 总结
- 可以在变量前加上&符号来**获取变量地址**
- 取地址返回的类型都为原本变量的类型后加个\*,也就是个**指针类型**
- 在一个**指针类型**的变量前面加上\*符号,即可**取出该地址里所存储的内容**
- 取地址数据返回的类型都为原本变量的类型后减个\*,可以说是**和&取地址正好相反**
- 对于多级指针,可以**一次使用多个**\*来多次**取地址中存储的数据** 谢谢大佬 收藏了 感谢分享。 开卷有益, 谢谢分享 大佬慢点... 昨天的还没学完~ 学习,学习。谢谢分享!!!!!!!!! 感谢分享。。。 感谢分享
感谢分享 感谢楼主,学习啦