吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 4503|回复: 13
收起左侧

[Web逆向] 《JavaScript AST其实很简单》二、Step1-函数调用还原

  [复制链接]
漁滒 发表于 2020-12-22 18:14
本帖最后由 漁滒 于 2020-12-25 22:01 编辑

前言

本系列所有反混淆内容都是基于开源项目JavaScript Obfuscator Tool进行的。
打开网站后,使用如下配置对js源码进行混淆
在这里插入图片描述
下载混淆后的js文件,进行格式化后大概是这样的
在这里插入图片描述
备注:源文件见最下方附件内的ob.txt

可以看到第一个节点定义了一个大数组_0x101c,第二和第三是一个立即执行函数和一个函数,这两个顺序不一定。从上图中可以看到,被混淆后的js代码中,存在非常多的相同的函数调用,那么第一步就是要将这个函数调用的结果还原回去。

1.语法分析

要反混淆第一步就是对现有的代码做分析,找到其加密的规律,然后按照这个规律进行还原
首先将混淆后的代码复制到AST explorer,其中使用的解析器是esprima,我用用node的模块也是这个
在这里插入图片描述
可以看到很快就可以将源代码转换成抽象语法树,然后随便点击一个_0x166e函数调用的地方
在这里插入图片描述
可以看到,其中的类型为CallExpression,那么现在就可以找所有的CallExpression了,但是并不是所有的函数调用都是需要还原的,只有名称为_0x166e的才需要。

但是并不能将这个函数名写死,因为这个函数名是随机的,所以要先确定函数名。由前面可知,函数的定义一定会出现在第二或者第三个节点,那么只要查找第二和第三个节点,看看哪个是函数定义,就可以知道函数名了。只知道函数名还不够,还需要里面的参数。

在这里插入图片描述
在CallExpression的子节点在有一个arguments的节点,里面就有函数调用的参数了。此时就已经获取了函数名和所有调用的参数

2.函数调用计算

我们首先编写一个node的命令行文件,用于将js代码转换为json,保存为文件:js2jsonyuge.js

const fs = require('fs');
const esprima = require('esprima')
const escodegen = require('escodegen')

var inputtext = process.argv[2];
var outputtext = process.argv[3];

var data = fs.readFileSync(inputtext);
var ast = esprima.parseScript(data.toString());
var ast_to_json = JSON.stringify(ast);
fs.writeFileSync(outputtext, ast_to_json);

再编写一个相反的,将json转换为js代码,保存为文件:json2jsyuge.js

const fs = require('fs');
const esprima = require('esprima')
const escodegen = require('escodegen')

var inputtext = process.argv[2];
var outputtext = process.argv[3];

var data = fs.readFileSync(inputtext);
var ast = JSON.parse(data.toString());
var code = escodegen.generate(ast, {
    format: {
        compact: true,
        escapeless: true
    }
});
fs.writeFileSync(outputtext, code);

先读取转换的json,并将前3个节点输出,用于后面计算结果

    inputfile = 'ob'
    os.system('node js2jsonyuge '+inputfile+'.js '+inputfile+'.json')
    with open(inputfile+'.json', 'r', encoding='utf-8') as f:
        data = f.read()

    # 删除缓存
    os.remove(inputfile+'.json')
    data = json.loads(data)

    # 定义替换函数的json
    tempstep1 = {
        'type': 'Program',
        'body': data['body'][:3],
        'sourceType': 'script'
    }

    # 写出第一步替换的函数体
    with open(inputfile+'_step1.json', 'w', encoding='utf-8') as f:
        f.write(json.dumps(tempstep1, ensure_ascii=False, separators=(',', ':')))
    os.system('node json2jsyuge '+inputfile+'_step1.json '+inputfile+'_step1.js')

运行后会得到一个ob_step1.json和ob_step1.js,打开ob_step1.js并在第二行输入

console.log(_0x166e('0x305'));

保存后在命令行中运行

node ob_step1.js

如果可以显示【return (function()】,说明正常计算。
而在python中需要用到execjs模块

with open('ob_step1.js', 'r', encoding='utf-8') as f:
    ctx = execjs.compile(f.read())
resul = ctx.call('_0x166e', '0x305', '')
print(resul)

此时一样可以得到【return (function()】

3.递归还原

此时就可以递归获取所有名称为_0x166e的CallExpression节点,然后计算结果,基本的递归格式我是如下编写的。
填写核心逻辑后,就可以递归获取所有参数,并进行调用还原,还原的结果要怎么塞回去呢?继续进行分析,可以看到所有的返回值都是字符串,那么字符串的类型就是Literal,那么就可以自己构建一个Literal节点,然后将源节点替换掉即可

def diguiyangli(node, Functionname, ctx):
    if type(node) == list:
        if node:
            for i in range(len(node)):
                diguiyangli(node[i], Functionname, ctx)
    elif type(node) == dict:
        for key in node.keys():
            if node[key]:
                if not type(node[key]) in [str, bool, int]:
                    for eachkey in node[key].keys():
                        if type(node[key][eachkey]) == dict:
                            if 'type' in node[key][eachkey].keys():
                                if node[key][eachkey]['type'] == 'CallExpression':  # 获取类型为CallExpression的节点
                                    if 'name' in node[key][eachkey]['callee'].keys():
                                        if node[key][eachkey]['callee']['name'] == Functionname:  # 获取指定函数调用名的节点
                                            if len(node[key][eachkey]['arguments']) == 2:  # 获取函数调用的参数
                                                arg1, arg2 = node[key][eachkey]['arguments']
                                                arg1 = arg1['value']
                                                arg2 = arg2['value']
                                            else:
                                                arg1 = node[key][eachkey]['arguments'][0]['value']
                                                arg2 = ''
                                            value = ctx.call(Functionname, arg1, arg2)
                                            # 创建一个Literal节点
                                            returnobject = {'type': 'Literal', 'value': value}
                                            # 替换原来节点
                                            node[key][eachkey] = returnobject
                    diguiyangli(node[key], Functionname, ctx)

经过一系列的调用还原后,输出js代码,并将其格式化如下图
在这里插入图片描述
可以看到,原来的

'VlwGE': _0x166e('0x305')

已经被替换为

'VlwGE': 'return (function() '

此时第一步已经完成,那么前三个节点已经没有用了,将前三个节点删除后,就是第一步反混淆的最终结果.
备注:源文件见最下方附件内的ob_step1.txt

附件地址:https://www.lanzoux.com/b0101ok4b

免费评分

参与人数 5吾爱币 +20 热心值 +5 收起 理由
shaoyiwei + 1 + 1 用心讨论,共获提升!
360chrome + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
萋小磊 + 3 + 1 热心回复!
苏紫方璇 + 15 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
p348643 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

jason903 发表于 2020-12-23 18:40
本帖最后由 jason903 于 2020-12-23 18:43 编辑

给作者提点建议:
做为一篇教程,很难学习;
做为代码展示,没有最关键代码

1. 不利于新手动手实践
"我们首先编写一个node的命令行文件,用于将js代码转换为json"
修改为
"我们首先编写一个node的命令行文件,用于将js代码转换为json,保存为文件:js2jsonyuge.js"

2. 不利于新手动手实践
"在编译一个相反的,将json转换为js代码"
修改为
"再编写一个相反的,将json转换为js代码,保存为文件:json2jsyuge.js"

3. 不利于新手动手实践
最关键代码没给出,做为读者,完全不知道 diguiyangli 函数、returnobject怎么用?

回去修改下文章吧!!!

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
漁滒 + 1 + 1 我很赞同!

查看全部评分

 楼主| 漁滒 发表于 2020-12-23 18:53
jason903 发表于 2020-12-23 18:40
给作者提点建议:
做为一篇教程,很难学习;
做为代码展示,没有最关键代码

前两点我修改一下,第三点的话因为无法给出源码,我尽量修改
枫叶零渡 发表于 2020-12-22 18:38
p348643 发表于 2020-12-22 18:49
66666666

免费评分

参与人数 1吾爱币 -10 收起 理由
涛之雨 -10 请勿灌水,提高回帖质量是每位会员应尽的义务!

查看全部评分

晓森大人 发表于 2020-12-22 18:57
谢谢楼主学习一下
雾都孤尔 发表于 2020-12-22 19:28
认真看看,理解最重要。
miqi1314 发表于 2020-12-22 19:33
太厉害,学习了
MOEYU_VANILLA 发表于 2020-12-22 21:10
感谢分享
xixicoco 发表于 2020-12-23 22:09
渔歌牛逼,顶你
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-8 22:46

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表