吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 7437|回复: 18
收起左侧

[调试逆向] 逆向基础笔记八 反汇编分析C语言

  [复制链接]
lyl610abc 发表于 2021-3-1 15:42
本帖最后由 lyl610abc 于 2021-3-12 16:34 编辑

继续更新个人的学习笔记,
其它笔记传送门
逆向基础笔记一 进制篇
逆向基础笔记二 数据宽度和逻辑运算
逆向基础笔记三 通用寄存器和内存读写
逆向基础笔记四 堆栈篇
逆向基础笔记五 标志寄存器
逆向基础笔记六 汇编跳转和比较指令
逆向基础笔记七 堆栈图(重点)
逆向基础笔记九 C语言内联汇编和调用协定
逆向基础笔记十 汇编寻找C程序入口
逆向基础笔记十一 汇编C语言基本类型
逆向基础笔记十二 汇编 全局和局部 变量
逆向基础笔记十三 汇编C语言类型转换
逆向基础笔记十四 汇编嵌套if else
逆向基础笔记十五 汇编比较三种循环
逆向基础笔记十六 汇编一维数组
逆向基础笔记十七 汇编二维数组 位移 乘法
逆向基础笔记十八 汇编 结构体和内存对齐
逆向基础笔记十九 汇编switch比较if else
逆向基础笔记二十 汇编 指针(一)
逆向基础笔记二十一 汇编 指针(二)
逆向基础笔记二十二 汇编 指针(三)
逆向基础笔记二十三 汇编 指针(四)
逆向基础笔记二十四 汇编 指针(五) 系列完结

反汇编分析C语言

环境:VC6.0

为什么不使用Visual Studio?

Visual Studio的反汇编代码更复杂一些,如下为VS2019的空函数反汇编代码

image-20210301142247121

可以看到有CheckForDebuggerJustMyCode等一些额外的函数

为了便于理解和学习,便采用VC6.0来进行学习

空函数反汇编

image-20210301142016703

#include "stdafx.h"

//空函数        
void function(){

}

int main(int argc, char* argv[])
{
    //调用空函数
        function();
        return 0;
}

我们通过反汇编来分析这段空函数

函数外部

image-20210301142602934

12:       function();
00401048   call        @ILT+5(function) (0040100a)
13:       return 0;
0040104D   xor         eax,eax
14:   }
0040104F   pop         edi
00401050   pop         esi
00401051   pop         ebx
00401052   add         esp,40h
00401055   cmp         ebp,esp
00401057   call        __chkesp (004010e0)
0040105C   mov         esp,ebp
0040105E   pop         ebp
0040105F   ret

函数内部

image-20210301142636911

6:    void function(){
00401010   push        ebp
00401011   mov         ebp,esp
00401013   sub         esp,40h
00401016   push        ebx
00401017   push        esi
00401018   push        edi
00401019   lea         edi,[ebp-40h]
0040101C   mov         ecx,10h
00401021   mov         eax,0CCCCCCCCh
00401026   rep stos    dword ptr [edi]
7:
8:    }
00401028   pop         edi
00401029   pop         esi
0040102A   pop         ebx
0040102B   mov         esp,ebp
0040102D   pop         ebp
0040102E   ret

分析函数

函数调用

00401048   call        @ILT+5(function) (0040100a)

首先就是通过call来调用我们的function函数


函数内部

接着进到函数的内部

有了之前画堆栈图的经验,我们不难看出,尽管我们的函数是个空函数,但其汇编代码依然完成了以下流程:

  1. 提升堆栈
  2. 保护现场
  3. 初始化提升的堆栈
  4. 恢复现场
  5. 返回
提升堆栈
00401010   push        ebp
00401011   mov         ebp,esp
00401013   sub         esp,40h
保护现场
00401016   push        ebx
00401017   push        esi
00401018   push        edi

PS:前面的push        ebp也是保护现场

初始化提升的堆栈
00401019   lea         edi,[ebp-40h]
0040101C   mov         ecx,10h
00401021   mov         eax,0CCCCCCCCh
00401026   rep stos    dword ptr [edi]
恢复现场
00401028   pop         edi
00401029   pop         esi
0040102A   pop         ebx
0040102B   mov         esp,ebp
0040102D   pop         ebp

PS:这里的mov         esp,ebp就是降低堆栈,与前面的提升堆栈相对应,所以也属于恢复现场的一部分

返回
0040102E   ret

函数返回后

image-20210301144204096

函数返回后不出意料地返回到了调用CALL地下一行语句,我们接着看

0040104D   xor         eax,eax

这里是将eax清零,注意到我们的语句为return 0        这里就是将eax作为返回值来传递

一般来说eax都是作为函数的返回值,但不绝对,有的函数返回值是存在内存里或其它情况,要具体情况具体分析


接着看下面的代码:

0040104F   pop         edi
00401050   pop         esi
00401051   pop         ebx

很明显,这里是在还原现场,别忘了我们的主程序main本身也是个函数,这是在还原调用main前保护的现场


接着往下走

00401052   add         esp,40h
00401055   cmp         ebp,esp
00401057   call        __chkesp (004010e0)

这里首先是将esp减少了40h,然后比较ebp和esp,最后再调用一个chkesp函数

从名称就不难看出chkesp = check esp ,检查esp,这个函数就是用来检查堆栈是否平衡


继续

0040105C   mov         esp,ebp
0040105E   pop         ebp

依旧是恢复现场


最后就是返回

0040105F   ret

总结空函数分析

我们可以看到,即便一个空函数什么都没有做,但调用一个空函数所产生的汇编代码却不少

保护现场、恢复现场以及堆栈平衡的检查等等都没少,可谓麻雀虽小五脏俱全

简单加法函数反汇编

有了前面分析空函数的经验,我们再来分析分析一个简单的加法函数

image-20210301150840779

#include "stdafx.h"
int Plus(int x,int y){
        return x+y;
}

int main(int argc, char* argv[])
{
        //调用加法函数
        Plus(1,2);
        return 0;
}

函数外部

image-20210301151114978

16:       Plus(1,2);
004010A8   push        2
004010AA   push        1
004010AC   call        @ILT+0(Plus) (00401005)
004010B1   add         esp,8
17:       return 0;
004010B4   xor         eax,eax
18:   }
004010B6   pop         edi
004010B7   pop         esi
004010B8   pop         ebx
004010B9   add         esp,40h
004010BC   cmp         ebp,esp
004010BE   call        __chkesp (004010e0)
004010C3   mov         esp,ebp
004010C5   pop         ebp
004010C6   ret

函数内部

image-20210301151215130

10:   int Plus(int x,int y){
00401060   push        ebp
00401061   mov         ebp,esp
00401063   sub         esp,40h
00401066   push        ebx
00401067   push        esi
00401068   push        edi
00401069   lea         edi,[ebp-40h]
0040106C   mov         ecx,10h
00401071   mov         eax,0CCCCCCCCh
00401076   rep stos    dword ptr [edi]
11:       return x+y;
00401078   mov         eax,dword ptr [ebp+8]
0040107B   add         eax,dword ptr [ebp+0Ch]
12:   }
0040107E   pop         edi
0040107F   pop         esi
00401080   pop         ebx
00401081   mov         esp,ebp
00401083   pop         ebp
00401084   ret

分析函数

函数调用

004010A8   push        2
004010AA   push        1
004010AC   call        @ILT+0(Plus) (00401005)

结合前面的空函数分析,我们可以明显发现这里的函数调用环节,多了两个push

就是将函数所需的参数压入堆栈,这里的参数为 2 和 1,注意压入的顺序是反着的(由调用协定决定,下篇笔记会详细说明)

函数内部

提升堆栈保护现场初始化

提升堆栈、保护现场、初始化部分和空函数如出一辙,这里就不再赘述

00401060   push        ebp
00401061   mov         ebp,esp
00401063   sub         esp,40h
00401066   push        ebx
00401067   push        esi
00401068   push        edi
00401069   lea         edi,[ebp-40h]
0040106C   mov         ecx,10h
00401071   mov         eax,0CCCCCCCCh
00401076   rep stos    dword ptr [edi]

实际执行
00401078   mov         eax,dword ptr [ebp+8]
0040107B   add         eax,dword ptr [ebp+0Ch]

这里的[ebp+8]就是我们前面压入的参数1,[ebp+c]就是前面压入的参数2

于是这两条语句其实就是

00401078   mov         eax,1
0040107B   add         eax,2

将1+2的结果保存到eax中(此时eax又作为函数返回值的载体)


恢复现场和返回

接下来的内容就和空函数一样了,恢复现场和返回,也不再赘述

0040107E   pop         edi
0040107F   pop         esi
00401080   pop         ebx
00401081   mov         esp,ebp
00401083   pop         ebp
00401084   ret

函数返回后

image-20210301152919224

004010B1   add         esp,8
17:       return 0;
004010B4   xor         eax,eax
18:   }
004010B6   pop         edi
004010B7   pop         esi
004010B8   pop         ebx
004010B9   add         esp,40h
004010BC   cmp         ebp,esp
004010BE   call        __chkesp (004010e0)
004010C3   mov         esp,ebp
004010C5   pop         ebp
004010C6   ret

函数返回后我们会发现与先前的空函数相比多了这一行代码:

004010B1   add         esp,8

这里是对应我们前面压入的两个参数1和2,压入参数后esp减少了8,这里我们函数调用结束后,就不再需要之前压入的两个参数了,于是将esp恢复到压入参数前,这其实也算在恢复现场里,用来平衡堆栈

我们可以发现,这条语句是在我们call调用完毕返回后执行的平衡堆栈操作,所以这种操作也被称为堆栈外平衡

与之相对就是堆栈内平衡:即在call里面就把堆栈平衡好了


之后的代码就和空函数无异了,也不再赘述,简单的加法函数分析到这也就告一段落了

免费评分

参与人数 10吾爱币 +10 热心值 +9 收起 理由
luoxiao + 1 + 1 谢谢@Thanks!
bailemenmlbj + 1 + 1 谢谢@Thanks!
杨辣子 + 1 + 1 用心讨论,共获提升!
z_more + 1 + 1 热心回复!
猫爷 + 1 谢谢@Thanks!
yanti123 + 1 + 1 谢谢@Thanks!
zpzwz + 1 + 1 谢谢@Thanks!
luochunyan + 1 + 1 谢谢@Thanks!
JMCSec + 1 + 1 谢谢@Thanks!
THH-3013 + 1 + 1 用心讨论,共获提升!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

jkj 发表于 2021-3-2 11:36
aswcy815174418 发表于 2021-3-1 17:30
在最后即将要结束call,pop ebp为啥能直接跳到之前位置,跳了好多个

因为进入函数时,有push ebp, mov ebp, esp,把这时的堆栈保存到ebp中了,函数快离开时,有mov esp, ebp, pop ebp,把堆栈恢复到进入函数时的状态,然后ret就返回到调用函数的地方了。
 楼主| lyl610abc 发表于 2021-3-1 17:38
aswcy815174418 发表于 2021-3-1 17:30
在最后即将要结束call,pop ebp为啥能直接跳到之前位置,跳了好多个

pop ebp指令是将堆栈顶部的值弹出到ebp,具体可以去看看我之前的逆向基础笔记四 堆栈篇的内容
aswcy815174418 发表于 2021-3-1 17:30
在最后即将要结束call,pop ebp为啥能直接跳到之前位置,跳了好多个
NET666 发表于 2021-3-1 21:01
厉害,学习下
finderwj 发表于 2021-3-1 23:50
感谢,收藏学习下!
nd2306 发表于 2021-3-2 06:53
厉害啊,先看一下
taotianc 发表于 2021-3-2 09:15
温故而知新,C语言入门小学徒
yanqiu6 发表于 2021-3-2 10:12
感谢,收藏学习下!
玛里狗斯 发表于 2021-3-3 16:03
学习学习
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-24 11:40

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表