OLLVM CFF 去平坦化原理

lyl610abc · 发表于 2025-8-27 22:19

本帖最后由 lyl610abc 于 2025-8-30 21:57 编辑

作用

控制流平坦化（control flow flattening）是作用于控制流图的代码混淆技术

其基本思想是重新组织函数的控制流图中的基本块关系，通过插入一个 “主分发器” 来控制基本块的执行流程

简而言之，就是基于 基本块，将 if else 跳转改成 switch case

平坦化前（竖向）

平坦化后（竖向）

平坦化前（横向）

平坦化后（横向）

识别

控制流平坦化（Control Flow Flattening）是一种常见的混淆技术，它会导致 IDA 反编译器将原本结构化的控制流识别为一个大的 while 循环

IDA 反编译器看到这种结构时，会将其识别为一个无限循环（while (1)），因为：

所有逻辑块都通过一个统一入口跳转
没有明显的结构化分支
跳转目标是动态计算的（如通过寄存器或跳转表）

平坦化前

void __fastcall sub_7C74C4(void **a1)
{
  void *v1; // [xsp+8h] [xbp-8h]

  v1 = *a1;
  *a1 = 0LL;
  if ( v1 )
    sub_584190(v1);
}

平坦化后

void __fastcall sub_7C74C4(void **a1)
{
  int v1; // w8
  int v2; // w26
  int i; // w8
  void *v4; // [xsp+8h] [xbp-8h]

  v4 = *a1;
  *a1 = 0LL;
  v1 = -877419764;
  while ( v1 != -2045315170 )
  {
    if ( v1 == 1787132795 )
    {
      if ( v4 )
        v2 = -1592215583;
      else
        v2 = 297951760;
      for ( i = 1271350888; ; i = 297951760 )
      {
        while ( i == 1271350888 )
          i = v2;
        if ( i == 297951760 )
          break;
        sub_184190(v4);
      }
      v1 = -2045315170;
    }
    else if ( v4 )
    {
      v1 = 1787132795;
    }
    else
    {
      v1 = -2045315170;
    }
  }
}

反平坦化

基本概念

反平坦化需要引入几个基本的概念：

基本块
分发器
状态变量
真实块
函数入口

基本块

在 IDA 中，一个基本块（Basic Block）最多可以有两个后继，这是因为基本块的定义和控制流结构决定了它的后继数量通常不会超过两个。

原因如下：

基本块的定义：
- 一个基本块是指一段没有分支的连续指令序列，只有一个入口和一个出口。
- 控制流只能在基本块的末尾发生改变，比如通过跳转指令（jmp、call、ret、conditional jump 等）。 [这里给的是 x86 的指令, 对应到 arm 则是 b.eq 、b.ne、 tbnz 等]
后继的来源：
- 如果基本块以条件跳转结束，则有两个可能的后继：
  - 跳转目标地址。
  - 跳转不成立时的下一条指令。
- 如果是无条件跳转（如 jmp），则只有一个后继。
- 如果是函数返回（如 ret），则没有后继。
- 如果是调用指令（如 call），IDA 通常不会将调用目标视为后继，而是将其视为一个单独的函数流程。

基本块之间的连接方式

基本块之间的连接主要通过以下方式实现：

顺序执行：一个基本块执行完后，直接进入下一个基本块（没有跳转指令，隐式连接）。
条件跳转：如 JZ, JNZ, JE, JNE 等，通常会连接两个基本块：
- 一个是跳转目标；
- 一个是跳转失败时的顺序执行块。
无条件跳转：如 JMP，只连接一个目标基本块。
函数调用/返回：如 CALL 和 RET，这些指令会影响控制流，但不一定在基本块图中直接体现为边。

分发器

分发器 dispatcher 通常也可以被称作循环头 loophead

在控制流平坦化中，分发器通常具有以下特征：

多个逻辑块跳回分发器 → 形成回边
分发器被多次访问 → 在路径中重复出现
分发器是循环调度的核心 → 是循环头

因此，识别循环头是识别分发器的一个有效策略，尤其在平坦化结构中，分发器往往就是那个“被回跳最多”的块

注意！！！！！！！！！！！！！！！！！！！

循环头并不一定是分发器

普通的 while 或 for 循环也会有回边，但它们不是分发器
某些状态机或异常处理逻辑也可能有回边

分发器根据状态变量的值引导程序执行真实的基本块。控制流平坦化中，分发器可能有一个或多个

状态变量

状态变量用于串联代码的真实代码块之间的逻辑关系，分发器根据状态变量的值选择执行对应的真实代码块，真实代码块执行后，需要更新状态变量以衔接下一个要执行的真实代码块

相当于 switch(状态变量) case

真实块

原始的基本块

函数入口

平坦化的最小单位是函数，与之对应，反平坦化的最小单位也是一个函数

函数入口就是这个函数的起始地址

核心

反平坦化的核心在于去掉分发器，修复每个真实块的后继

真实块也是基本块，因此至多只有 2 个后继，但前驱无上限（可以回顾前面的基本块定义）

所以修复真实块的关系核心是在找到真实块的后继上

对于每一个真实块，确定它的后继就能实现反平坦化了

以前面后继最多的条件判断块为例

平坦化前

平坦化后

查找后继

于是问题被转换为了：给定一个真实块的地址，确定该真实块的后继

这里就需要模拟执行了，从给定的真实块地址开始模拟执行，执行直到遇到其它真实块

需要进行 2 次模拟执行：

对于模拟执行过程中的分支跳转，固定选择 True 进行跳转
对于模拟执行过程中的分支跳转，固定选择 False 不跳转

模拟执行的结果会有 3 种，对下面这 3 种情况有疑惑的可以结合前面 基本块之间的连接方式 来看

执行结果相同，且都是相同的真实块，说明真实块和真实块之间是顺序执行没有跳转指令，或者就是强制跳转
执行结果不同，但是不同的真实块，说明真实块和真实块之间是条件跳转，分别对应跳转和不跳转的情况
执行结果没有找到真实块（模拟执行需要限定最多执行多少指令，真实块和真实块之间的指令不会太长(因为真实块也是基本块，已经作为 "基本" 来分割了))，这种情况通常为真实块执行到函数的末尾返回了

现在大致清楚模拟执行需要的参数和返回值了

参数：1. 要分析的真实块地址 2. 其它真实块的列表，用来作为模拟执行的结束条件
返回值：两次模拟执行得到的真实块地址，对应前面提到的 3 种模拟执行结果：2 个相同的真实块地址，2 个不同的真实块地址，2 个空返回值(未找到真实块)

但这里需要注意，直接从给定的真实块地址开始模拟执行会有一个问题，缺少对应的上下文环境

如果从函数入口（平坦化的基本单位是函数）到真实块地址之间包含部分初始化的代码（比如对寄存器赋值，然后后面的代码要用到对应的寄存器），就会导致模拟执行出错

确定上下文

于是问题又被转换为了：给定一个真实块的地址，确定从函数地址到该真实块地址的上下文环境

直接上案例：

对于上面平坦化前后的函数，假如想要确定逻辑块3 的上下文，则需要确定从函数入口到逻辑块 3 的路径

这个路径被称为： 关键路径

对于逻辑块3，它的关键路径是：

入口块 → 分发器块 → 条件判断块 → 分发器块 → 逻辑块1 → 分发器块 → 逻辑块3

或

入口块 → 分发器块 → 条件判断块 → 分发器块 → 逻辑块2 → 分发器块 → 逻辑块3

可以发现关键路径可能有多个，只要取任意一个即可

有了关键路径，只要沿着关键路径一路执行下来，就可以得到真实块对应的上下文了

再举个例子，对于结束块，它的关键路径是：

入口块 → 分发器块 → 条件判断块 → 分发器块 → 逻辑块1 → 分发器块 → 逻辑块3 → 分发器块 → 结束块

或

入口块 → 分发器块 → 条件判断块 → 分发器块 → 逻辑块1 → 分发器块 → 逻辑块3 → 分发器块 → 结束块

一般情况下：

真实块之间（比如逻辑块1 → 逻辑块3）通常没有直接的上下文依赖，因为：
- 控制流被打散，每个逻辑块执行完后都会回到分发器；
- 分发器根据某个状态变量（如 switch_var 或 state) 决定下一个要执行的逻辑块；
- 所有逻辑块都通过分发器连接，而不是直接跳转。

但也有例外：

某些逻辑块可能会修改状态变量、寄存器或内存，这些修改会影响分发器的行为；
如果逻辑块之间有数据流（比如某个块设置了某个标志位，另一个块读取它），那么就存在上下文依赖；
某些混淆器可能会故意插入依赖，以增加分析难度。

在一般情况下（真实块不依赖其它真实块的逻辑，或者哪怕依赖也不影响模拟执行），可以直接模拟执行到分发器后直接强制指定执行地址为真实块继续模拟执行

这样能够将模拟执行的基本单位从真实块扩大为分发器，大大提升模拟执行的效率

对于前面真实块，不难发现：条件判断块，逻辑块1，逻辑块2，逻辑块3，结束块，它们的分发器都是同一个分发器块

如果以真实块为基本单位，则需要模拟执行 5 次来确定上下文

但以分发器为基本单位，则只需要模拟执行 1 次就可以确定上下文

以分发器为基本单位，确定真实块的上下文就变成：给定一个真实块，查找该真实块的分发器，然后获取从函数入口执行到分发器的上下文即可

流程为：真实块 → 分发器 → 分发器的关键路径 → 分发器的上下文

对于前面的案例就是，如果想要确定逻辑块3 的上下文

流程就是：逻辑块3 → 分发器块 → (入口块 → 分发器块) → 分发器块的上下文

查找真实块对应分发器

给定一个真实块的地址，如何确定该真实块的分发器？

从 真实块地址 开始，向前遍历其前驱基本块，寻找是否有一个基本块在 所有分发器的 集合中。如果找到了，就返回该分发器块的地址

从 real_bb 开始，使用广度优先搜索（BFS）向前遍历其所有前驱基本块。

每次访问一个基本块地址 cur_ea：

如果它已经访问过，则跳过（避免死循环）。
如果它在 dispatchers 集合中，说明找到了分发器块，立即返回。
否则，获取该基本块的所有前驱块，并将它们加入队列继续遍历。

def ida_get_bb(ea):
    f_blocks = idaapi.FlowChart(idaapi.get_func(ea), flags=idaapi.FC_PREDS)
    for block in f_blocks:
        if block.start_ea <= ea and ea < block.end_ea:
            return block
    return None

def get_real_bb_dispatcher(real_bb, dispatchers):
    visited = set()
    queue = deque()
    queue.append(real_bb)
    while queue:
        cur_ea = queue.popleft()
        if cur_ea in visited:
            continue
        visited.add(cur_ea)
        if cur_ea in dispatchers:
            print(f"[+] 找到分发器块: {hex(cur_ea)}")
            return cur_ea
        try:
            cur_bb = ida_get_bb(cur_ea)
            preds = list(cur_bb.preds())
            for pred in preds:
                queue.append(pred.start_ea)
        except Exception as e:
            print(f"[!] 获取基本块失败: {hex(cur_ea)} - {e}")
            continue
    print("[!] 未找到分发器块")
    return None

查找所有分发器

在前面分发器的基本概念中，有提到：分发器 dispatcher 通常也可以被称作循环头 loophead

因此可以简单地以查找循环头来替代分发器的查找

使用深度优先搜索（DFS）从入口块开始遍历

如果某个块已经在当前路径中访问过，说明存在循环：

增加该块的访问计数。
如果访问次数达到或超过 min_loop_count，将其加入 loop_heads。
每次递归时复制 visited 集合，确保路径独立。

# 查找循环头
def find_loop_heads(func_entry, min_loop_count=1):
    loop_heads = set()
    loop_counter = defaultdict(int)
    def dfs(block, visited):
        if block.start_ea in visited:
            loop_counter[block.start_ea] += 1
            if loop_counter[block.start_ea] >= min_loop_count:
                loop_heads.add(block.start_ea)
            return
        visited.add(block.start_ea)
        for succ in block.succs():
            dfs(succ, visited.copy())
    entry_block = ida_get_bb(func_entry)
    dfs(entry_block, set())
    return list(loop_heads)

# 查找分发器
def find_dispachers(func):
    # 通常循环头就是分发器
    return find_loop_heads(func, 1)

查找关键路径

利用深度优先搜索在控制流图中查找从起始基本块到目标基本块的一条路径，并返回路径上的所有基本块地址范围

使用递归方式进行 DFS 遍历

visited 集合用于避免重复访问

path 列表记录当前路径上的基本块地址

DFS 逻辑：

如果当前块已访问过，返回 False
将当前块加入路径
如果当前块是目标块，返回 True
否则，遍历所有后继块 succs()，递归调用 dfs
如果所有后继都无法到达目标块，则回溯（path.pop()）

# 查找关键路径
def find_key_path(start_bb_addr, end_bb_addr):
    start_bb = ida_get_bb(start_bb_addr)
    end_bb = ida_get_bb(end_bb_addr)
    visited = set()
    path = []
    def dfs(cur_block):
        if cur_block.start_ea in visited:
            return False
        visited.add(cur_block.start_ea)
        path.append(cur_block.start_ea)
        if cur_block.start_ea == end_bb.start_ea:
            return True
        for succ in cur_block.succs():
            if dfs(succ):
                return True
        path.pop()
        return False
    if dfs(start_bb):
        path = [ida_get_bb(b) for b in path]
        path = [(b.start_ea, b.end_ea) for b in path]
        return path
    else:
        return None

分发器块上下文

这一步需要进行模拟执行，具体逻辑和对应的模拟执行框架有关，比如常用的 angr, unicorn 等

因此只给出具体的思路，从函数入口开始，沿着关键路径执行到结束，最后返回结束时的上下文状态

查找所有真实块

真实块 通常指的是：

在控制流中实际会被执行的基本块
通常是条件跳转的目标块或跳转失败后的执行路径

使用 idaapi.FlowChart 获取函数的控制流图
遍历每个基本块：使用 Capstone 反汇编该块，识别条件跳转，根据条件跳转的具体指令特点判定对应的跳转或不跳转地址是否为真实块

这里的条件跳转指令又和对应的架构有关系了

以 arm64 为例，通常来说

B.EQ / TBNZ / CBZ

条件成立时跳转，条件不成立时顺序执行
在某些混淆或调度器场景中，跳转目标才是“真实块”，而顺序路径可能是调度器或中转块
所以只记录跳转目标

B.NE

条件不成立时跳转，条件成立时顺序执行
在某些场景中，顺序路径才是“真实块”，而跳转目标可能是调度器或控制逻辑
所以记录的是跳转失败路径（即顺序执行的那个）

会发现对于不同的条件跳转，需要进一步确定真实块是跳转地址还是不跳转地址，这个需要观察 IDA 的控制流图来具体确定

因此真实块的识别对于不同的案例并不一定能完全适用，需要具体情况具体分析，手动确定真实块以后，再去看对应的条件跳转判定

小结

结合前面的所有流程，可以总结出反平坦化的流程

def de_cff(func_entry):
    # 根据分发器索引对应的上下文环境，避免反复模拟执行来获取分发器上下文
    context_states = {}
    # IDA 获取函数控制流图后，遍历所有基本块识别条件跳转，根据条件跳转的特点，确定跳转还是不跳转时对应的是真实块
    # 需要具体情况具体分析，因此未提供代码
    real_bbs = get_all_real_basic_blocks(func_entry)
    # 查找所有分发器，通常可以直接用查找循环头来替代
    # 从函数入口开始使用 DFS 遍历查找形成回环的基本块
    dispachers = find_dispachers(func)
    # 遍历所有真实块
    for real_bb in real_bbs:
        # 从真实块开始用 BFS 向前驱遍历查找分发器
        dispacher = get_real_bb_dispatcher(real_bb, dispachers)
        if dispatcher is None:
                continue
        # 如果还没有该分发器对应的上下文环境，则进行获取
             if dispatcher not in context_states.keys():
            # 使用 DFS 从函数入口开始查找分发器对应的关键路径
            key_path = find_key_path(func_entry, dispatcher)
            # 模拟执行获取分发器上下文，从函数入口沿关键路径执行返回执行结束的上下文状态
            # 这里需要根据不同的模拟执行框架进行处理，因此未提供代码
            context_state = simu_exec_path(key_path)
            # 保存分发器上下文
            context_states[dispatcher] = context_state
        # 设置上下文下一次执行从真实块开始
        set_pc(context_state, real_bb)
        # 模拟执行 True, 从分发器上下文和真实块地址开始执行，中间遇到条件跳转一律改为强制跳转，直到遇见其它真实块才停止
        succ_state1 = simu_run(context_state, True, real_bbs)
        # 模拟执行 False, 从分发器上下文和真实块地址开始执行，中间遇到条件跳转一律改为不跳转，直到遇见其它真实块才停止
        succ_state2 = simu_run(context_state, False, real_bbs)

修补

前面通过模拟执行，可以得到任意一个真实块模拟执行到其它真实块的状态

反平坦化的核心在于确定真实块的后继，要修补自然就是让真实块跳过分发器，"直达" 其它真实块

所谓的 "直达" 就是修改真实块的执行逻辑，让它跳转到其它真实块

要进行跳转，就绕不开 3 个问题

跳转起点（从哪里开始跳转）
跳转目标（要跳转到哪里）
跳转条件（什么情况下要跳转）

跳转起点

根据前面的分析可以知道，真实块和真实块之间的桥梁是分发器

修补要做的就是跳过分发器，因此可以将原本跳转到分发器的逻辑直接作为跳转的起点

通常来说真实块的结尾那部分逻辑可以直接作为跳转起点

需要注意的点就是，不要破坏原有的真实块的真实逻辑(非平坦化引入的混淆代码)

跳转目标

跳转目标自然就是其它真实块

跳转条件

在前面反平坦化的核心里有提到，模拟执行的结果可能有 3 个，这 3 个结果分别对应 3 种跳转条件

执行结果相同，且都是相同的真实块

直接跳转到这一个真实块即可
执行结果不同，但是不同的真实块

需要根据 True 和 False 时的条件，跳转到对应的真实块
执行结果没有找到真实块

没有跳转

修补参数

结合前面的分析，可以得到修补所需的内容

	说明
跳转起点	真实块结尾(注意别覆盖原有的真实逻辑)
跳转目标	其它真实块，最多有 2 个
跳转条件	模拟执行到其它真实块时，对应 True 和 False 的 CC（Condition Code）跳转条件码

对于跳转条件，再补充一下，以 arm64 为例，条件跳转通常由 CSEL 引导
下面给出一段常见的跳转汇编

CMP             W9, #0x23                  ; 判断 W9 是否不等于 0x23
CSEL            W8, W9, W8, NE             ; 如果不等，则将 W9 赋值给 W8，否则 W8 保持原值
CMP             W8, W10                    ; 然后比较 W8 与 W10；
B.GT            loc_400610                 ; 如果 W8 > W10，则跳转

这里的 CC (状态码) 就是 NE (not equal) 不等

对于模拟执行来说，强制 True 和 False，就对应着将

CSEL            W8, W9, W8, NE

强制改为

MOV W8, W9

MOV W8, W8

如果修复这个跳转则是将代码改为

BNE 0x40120c    ; 模拟执行结果 1     BCC True
B 0x400f2c      ; 模拟执行结果 2     BCC False

前面提到的注意别覆盖原有的真实逻辑，指的就是，需要注意 CSEL 到 B.GT 中间是否掺杂了真实逻辑 (通常没有)

其实就是确保你修补的这个地址到该真实块的结尾不包含真实逻辑

真实案例

限于篇幅，这篇就不具体展开手撕真实案例的细节了

贴出真实案例的混淆前后的对比

混淆前

源代码

extern "C" int my_encrypt(char * input, char* output, unsigned long long key) {
    for (int i = 0 ; i < strlen(input); i ++) {
        output[i] = input[i] ^ key;
    }
    return 123;
}

反编译伪代码

__int64 __fastcall my_encrypt(unsigned __int8 *input, unsigned __int8 *output, unsigned __int64 key)
{
  int i; // [xsp+14h] [xbp-3Ch]
  char v5; // [xsp+18h] [xbp-38h]

  v5 = key;
  for ( i = 0; i < strlen((const char *)input); ++i )
    output[i] = input[i] ^ v5;
  return 123LL;
}

IDA 流图

混淆后

反编译伪代码

__int64 __fastcall my_encrypt(unsigned __int8 *input, unsigned __int8 *output, unsigned __int64 key)
{
  int v3; // w9
  int i; // [xsp+20h] [xbp-50h]
  int v6; // [xsp+24h] [xbp-4Ch]
  char v7; // [xsp+28h] [xbp-48h]
  int j; // [xsp+44h] [xbp-2Ch]
  size_t v11; // [xsp+60h] [xbp-10h]

  v7 = key;
  v6 = 0;
  for ( i = -1989582250; ; i = -1989582250 )
  {
    while ( 1 )
    {
      while ( i == -1989582250 )
      {
        for ( j = -679261423; ; j = 1729285113 )
        {
          while ( j == -679261423 )
            j = -570756383;
          if ( j != -570756383 )
            break;
          v11 = strlen((const char *)input);
        }
        if ( v6 >= v11 )
          v3 = -393415853;
        else
          v3 = -743271856;
        i = v3;
      }
      if ( i != -743271856 )
        break;
      output[v6] = (~input[v6] & 0xC2 | input[v6] & 0x3D) ^ (~v7 & 0xC2 | v7 & 0x3D);
      i = 1740375649;
    }
    if ( i == -393415853 )
      break;
    ++v6;
  }
  return 123LL;
}

IDA 流图

如图所示，红色标记为真实块，紫色箭头所指为分发器

总结

反平坦化的流程总结如下

查找所有真实块（对于不同的条件跳转，需要进一步确定真实块是跳转地址还是不跳转地址）

查找所有分发器（通常来说可以用查找循环头(有回边)来替代查找分发器）

遍历真实块，对于每个真实块进行：

查找引导该真实块的分发器(查找前驱)
查找函数入口到分发器的关键路径
根据关键路径，模拟执行获得分发器上下文
从分发器上下文跳转到真实块地址，模拟执行直到遇到其它真实块

根据模拟执行结果，得到每个真实块要进行修补的参数（跳转起点，跳转目标，跳转条件）

致谢

本文的思路绝大多数都来自 ARM64 OLLVM反混淆中 无名侠 大佬的指导，为个人学习总结

当然也参考了很多其它优秀文章：

利用符号执行去除控制流平坦化

ollvm三种混淆模式的反混淆思路

lyl610abc · 发表于 2025-8-27 22:24

本帖最后由 lyl610abc 于 2025-8-27 22:26 编辑

附上真实案例的下载链接，有兴趣的可以去玩玩：平坦化样本(点我下载)

正己 · 发表于 2025-8-27 22:29

没有手把手教学，我可不学

DeemoSaika1 · 发表于 2025-8-28 01:48

牛的牛的给我整一个

ansen8d · 发表于 2025-8-28 09:02

学习学习

mornstar52 · 发表于 2025-8-28 09:40

need for this, most wanted, write more if you can

yechao007 · 发表于 2025-8-28 16:47

这还要再学习才能看懂

scz · 发表于 2025-9-3 16:20

用楼主的样本测试IDA D810插件，可以正常反混淆。

https://gitlab.com/eshard/d810

lovemoney · 发表于 2025-9-7 08:35

scz 发表于 2025-9-3 16:20
用楼主的样本测试IDA D810插件，可以正常反混淆。

https://gitlab.com/eshard/d810

看来没有什么技术是永远能防住的？漏洞的存在也是IT工作不会消失原因的一部分

90KLi · 发表于 2025-9-29 20:03

学习学习

帐号		自动登录	找回密码
密码			注册[Register]

[Android 原创] OLLVM CFF 去平坦化原理

作用

平坦化前（竖向）

平坦化后（竖向）

平坦化前（横向）

平坦化后（横向）

识别

平坦化前

平坦化后

反平坦化

基本概念

基本块

基本块之间的连接方式

分发器

状态变量

真实块

函数入口

核心

查找后继

确定上下文

查找真实块对应分发器

查找所有分发器

查找关键路径

分发器块上下文

查找所有真实块

小结

修补

跳转起点

跳转目标

跳转条件

修补参数

真实案例

混淆前

源代码

反编译伪代码

IDA 流图

混淆后

反编译伪代码

IDA 流图

总结

致谢

免费评分

浏览过的版块