吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 12641|回复: 12
收起左侧

[调试逆向] WinDbg -- 调试关键区(CriticalSection)死锁

  [复制链接]
jiangxueqiao 发表于 2018-9-30 10:02
本帖最后由 jiangxueqiao 于 2018-9-30 10:11 编辑

如果图片显示太小,可以放大浏览器页面查看。

一. 演示示例

这里一个有关键区锁死问题的程序,运行之后依次点击“CS锁死”按钮、右上角退出按钮,程序就会卡死。(图1)

对于眼下的这个问题,界面完全失去响应,这说明负责消息处理的UI线程阻塞了。对于几乎所有的windows GUI程序,编号为0的初始线程就是UI线程,windows发现该界面一段时间没有消息响应之后就会在标题后面加上“(未响应)”。

二. WinDbg调试

启动Windbg,附加到执行进程(F6)。

~*knv3查看各个线程的调用堆栈(图3),数字3表示显示的堆栈深度,省略即显示完整堆栈。

#0号线的栈帧0表示线程程阻塞在NtWaitForSingleObject函数,MSDN得知该函数原型为:

NTSTATUS WINAPI NtWaitForSingleObject(
 _In_ HANDLE         Handle, 
  _In_ BOOLEAN        Alertable,
  _In_ PLARGE_INTEGER Timeout
);

第一个参数Handle为其等待的句柄,第三个参数TimeOut为超时时间。
同样从栈帧0得知NtWaitForSingleObject正在等待句柄000000c4,超时时间为0(即没信号就一直等待)。

!handle 000000c4 f 命令查看000000c4句柄的信息(图4):

现在我们知道c4句柄就是线程ID:20d0的句柄,主线程在退出的时候等待该线程退出,而该线程一直没有退出,所以主线程卡死了。

根据图3得知20d0线程就是#1线程,~1kvn查看该线程完整堆栈(图5):

栈帧00 NtWaitForSingleObject表示线程在等待000000c0句柄。

!handle

!handle 000000c0 f查看句柄信息,得知c0句柄为事件句柄:

0:002> !handle c0 f
Handle c0
  Type                 Event
  Attributes           0
  GrantedAccess        0x100003:
         Synch
         QueryState,ModifyState
  HandleCount          2
  PointerCount         4
  Name                 <none>
  Object Specific Information
    Event Type Auto Reset
    Event is Waiting

!locks

!locks查看进程中哪些锁处于锁定状态(图6):

从第一行结果可以得知是gcsName临界区(需要有pdb才会显示具体变量名)处于锁定状态。

其实,我们从栈帧02 RtlEnterCriticalSection也可以很快的知道该线程一直在等待进入关键区。

经过分析,知道程序无法退出的原因了:线程#1中的关键区gcsName处于锁定状态(也就是一直等待进入关键区),导致线程#1阻塞无法执行。又因主线程在退出的时候执行了WaitForSingleObject等待#1线程,从而导致主线程卡死。

RTL_CRITICAL_SECTION结构

关键区机制主要是通过下面这样的RTL_CRITICAL_SECTION结构来实现的,可以通过dt命令查看该结构定义:

0:002> dt RTL_CRITICAL_SECTION
Test1!RTL_CRITICAL_SECTION
   +0x000 DebugInfo        : Ptr32 _RTL_CRITICAL_SECTION_DEBUG
   +0x004 LockCount        : Int4B
   +0x008 RecursionCount   : Int4B
   +0x00c OwningThread     : Ptr32 Void
   +0x010 LockSemaphore    : Ptr32 Void
   +0x014 SpinCount        : Uint4B

其中,LockCount字段用来标识关键区的锁状态,RecursionCount字段用来记录递归次数,用来支持同一个线程多次进入关键区,OwningThread字段用来记录进入(拥有)关键区的线程ID,LockSemaphore用来记录这个关键区对应的事件对象,当有线程需要等待这个关键区时,便是通过等待这个事件来做到的,这个事件对象是按需创建的,如果LockSemaphore为NULL表示这个关键区从来没有线程在此等待过。

通过图6中的OwningThread=738得知,关键区被线程ID为738的线程所拥有,即Enter之后一直没有Leave。

知道了是哪个线程获取了关键区但没有释放,就可以很容易的在代码中定位问题了。

!cs -l

!locks没有显示LockSemaphore字段,我们可以通过!cs -l命令获取更为全面的关键区信息:

从上图可以看到LockSemaphore=0xC0,正好是#1线程NtWaitForSingleObject的事件对象。

6.png
5.png
4.png
3.png
2.png
1.png

免费评分

参与人数 4威望 +1 吾爱币 +10 热心值 +4 收起 理由
Sound + 1 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
zhczf + 1 + 1 我很赞同!
sumile + 1 + 1 我很赞同!
a5606495 + 1 + 1 热心回复!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

头像被屏蔽
yyspawn 发表于 2018-11-7 07:50
提示: 作者被禁止或删除 内容自动屏蔽
iWorm 发表于 2021-6-24 16:59
挺不错的问题排查思路。看问题是0#线程等待1#号线程退出,但是1#号线程发生死锁,无法退出。最后导致0#线程卡死(即UI线程)
但是有个问题,1#线程是和谁死锁了呢? 0xc0有被其他线程持有?导致资源没有释放?
T_T 发表于 2018-9-30 16:29
klise 发表于 2018-9-30 20:29
唉,微软的东西 …… 能用别的就用别的吧。
头像被屏蔽
freemoredoom1 发表于 2018-9-30 22:12
提示: 作者被禁止或删除 内容自动屏蔽
52896009 发表于 2018-10-5 10:37
这个有点意思~~~先回帖插个眼再仔细看看~~
52896009 发表于 2018-10-8 23:36
好东西。。
52896009 发表于 2018-10-9 14:12
这个不错,要支持...
greenmor 发表于 2018-10-14 21:43
如果能给出解决办法就好了,希望楼主再写详细一点
jiliJL425 发表于 2018-12-27 23:42
难度有点大,还是感谢
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-23 23:26

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表