이번 덤프는 문자열 처리 중 유효하지 않은 메모리 영역에 접근하여 발생한 BSOD다.
0x50은 BugCheck 코드명을 의미하며 BSOD 유형을 분류한 것이라고 생각하면 된다. 이 코드는 주로 접근할 수 없는 메모리 주소 영역을 접근했을 때 발생한다.
분석이 크게 어렵지는 않으니 가볍게 읽을 수 있을 것이다.
항상 분석의 시작은 !analyze -v 로 시작하는 것이 정석이다.
kd> !analyze -v
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************
PAGE_FAULT_IN_NONPAGED_AREA (50)
Invalid system memory was referenced. This cannot be protected by try-except.
Typically the address is just plain bad or it is pointing at freed memory.
Arguments:
Arg1: a0f6c000, memory referenced.
Arg2: 00000000, value 0 = read operation, 1 = write operation.
Arg3: 92140037, If non-zero, the instruction address which referenced the bad memory
address.
Arg4: 00000000, (reserved)
Debugging Details:
------------------
DUMP_CLASS: 1
DUMP_QUALIFIER: 401
BUILD_VERSION_STRING: 7601.17514.x86fre.win7sp1_rtm.101119-1850
SYSTEM_MANUFACTURER: VMware, Inc.
VIRTUAL_MACHINE: VMware
SYSTEM_PRODUCT_NAME: VMware Virtual Platform
SYSTEM_VERSION: None
BIOS_VENDOR: Phoenix Technologies LTD
BIOS_VERSION: 6.00
BIOS_DATE: 07/31/2013
BASEBOARD_MANUFACTURER: Intel Corporation
BASEBOARD_PRODUCT: 440BX Desktop Reference Platform
BASEBOARD_VERSION: None
DUMP_TYPE: 1
BUGCHECK_P1: ffffffffa0f6c000
BUGCHECK_P2: 0
BUGCHECK_P3: ffffffff92140037
BUGCHECK_P4: 0
READ_ADDRESS: a0f6c000 Paged pool
FAULTING_IP:
MyDrv+1037
92140037 0fb708 movzx ecx,word ptr [eax]
MM_INTERNAL_CODE: 0
IMAGE_NAME: MyDrv.sys
DEBUG_FLR_IMAGE_TIMESTAMP: 5a1cdd5a
MODULE_NAME: MyDrv
FAULTING_MODULE: 9213f000 MyDrv
CPU_COUNT: 1
CPU_MHZ: e07
CPU_VENDOR: GenuineIntel
CPU_FAMILY: 6
CPU_MODEL: 3c
CPU_STEPPING: 3
CPU_MICROCODE: 6,3c,3,0 (F,M,S,R) SIG: 19'00000000 (cache) 19'00000000 (init)
DEFAULT_BUCKET_ID: WIN7_DRIVER_FAULT
BUGCHECK_STR: 0x50
PROCESS_NAME: explorer.exe
CURRENT_IRQL: 2
ANALYSIS_SESSION_HOST: PAUL-PC
ANALYSIS_SESSION_TIME: 11-28-2017 14:40:07.0617
ANALYSIS_VERSION: 10.0.10575.567 amd64fre
TRAP_FRAME: 8b4a8a90 -- (.trap 0xffffffff8b4a8a90)
ErrCode = 00000000
eax=a0f6c000 ebx=a0e78680 ecx=0000006c edx=a0f6c000 esi=846c5838 edi=8b4a8b5c
eip=92140037 esp=8b4a8b04 ebp=8b4a8b0c iopl=0 nv up ei pl nz ac po nc
cs=0008 ss=0010 ds=0023 es=0023 fs=0030 gs=0000 efl=00010212
MyDrv+0x1037:
92140037 0fb708 movzx ecx,word ptr [eax] ds:0023:a0f6c000=????
Resetting default scope
LAST_CONTROL_TRANSFER: from 82a783d8 to 82ac541b
STACK_TEXT:
8b4a8a78 82a783d8 00000000 a0f6c000 00000000 nt!MmAccessFault+0x106
8b4a8a78 92140037 00000000 a0f6c000 00000000 nt!KiTrap0E+0xdc
8b4a8b0c 82ca639c 84653218 00000564 8b4a8b5c MyDrv+0x1037
8b4a8b34 82c8e27f 84653218 00000564 82b79b84 nt!PsCallImageNotifyRoutines+0x62
8b4a8be8 82c7ed4a 84664d80 85eb6030 8b4a8ce4 nt!MiMapViewOfImageSection+0x670
8b4a8c58 82c7ee3a 85eb6030 8b4a8ce4 00000000 nt!MiMapViewOfSection+0x22e
8b4a8c88 82c7f599 9fcdb1e8 85eb6030 8b4a8ce4 nt!MmMapViewOfSection+0x2a
8b4a8d04 82a751ea 00001458 ffffffff 0cccee94 nt!NtMapViewOfSection+0x204
8b4a8d04 771d70b4 00001458 ffffffff 0cccee94 nt!KiFastCallEntry+0x12a
0cccefa0 00000000 00000000 00000000 00000000 0x771d70b4
STACK_COMMAND: kb
THREAD_SHA1_HASH_MOD_FUNC: 53ccc111e8062d929cc0fad19df6ef4e0edf76dd
THREAD_SHA1_HASH_MOD_FUNC_OFFSET: 23675873345d32020fde61dc27c04558a8fd2339
THREAD_SHA1_HASH_MOD: 4e5c1c39aac5cd40526a2d8509134f551a034639
FOLLOWUP_IP:
MyDrv+1037
92140037 0fb708 movzx ecx,word ptr [eax]
FAULT_INSTR_CODE: 8508b70f
SYMBOL_STACK_INDEX: 2
SYMBOL_NAME: MyDrv+1037
FOLLOWUP_NAME: MachineOwner
FAILURE_BUCKET_ID: 0x50_MyDrv+1037
BUCKET_ID: 0x50_MyDrv+1037
PRIMARY_PROBLEM_CLASS: 0x50_MyDrv+1037
TARGET_TIME: 2017-11-28T05:34:28.000Z
OSBUILD: 7601
OSSERVICEPACK: 1000
SERVICEPACK_NUMBER: 0
OS_REVISION: 0
SUITE_MASK: 272
PRODUCT_TYPE: 1
OSPLATFORM_TYPE: x86
OSNAME: Windows 7
OSEDITION: Windows 7 WinNt (Service Pack 1) TerminalServer SingleUserTS
OS_LOCALE:
USER_LCID: 0
OSBUILD_TIMESTAMP: 2010-11-20 17:42:49
BUILDDATESTAMP_STR: 101119-1850
BUILDLAB_STR: win7sp1_rtm
BUILDOSVER_STR: 6.1.7601.17514.x86fre.win7sp1_rtm.101119-1850
ANALYSIS_SESSION_ELAPSED_TIME: 766
ANALYSIS_SOURCE: KM
FAILURE_ID_HASH_STRING: km:0x50_mydrv+1037
FAILURE_ID_HASH: {348be9c7-8048-f84c-6228-bb7942eb0452}
Followup: MachineOwner
---------
.trap 명령을 사용해서 문제가 발생한 부분으로 컨텍스트 정보를 설정해보자.
kd> .trap 0xffffffff8b4a8a90
ErrCode = 00000000
eax=a0f6c000 ebx=a0e78680 ecx=0000006c edx=a0f6c000 esi=846c5838 edi=8b4a8b5c
eip=92140037 esp=8b4a8b04 ebp=8b4a8b0c iopl=0 nv up ei pl nz ac po nc
cs=0008 ss=0010 ds=0023 es=0023 fs=0030 gs=0000 efl=00010212
MyDrv+0x1037:
92140037 0fb708 movzx ecx,word ptr [eax] ds:0023:a0f6c000=????
eax가 가리키는 a0f6c000 메모리 영역이 접근할 수 없는 영역이라 BSOD가 발생했다.
kv 명령어로 파라미터를 포함한 콜 스택을 확인해보자.
kd> kv
*** Stack trace for last set context - .thread/.cxr resets it
# ChildEBP RetAddr Args to Child
00 8b4a8b0c 82ca639c 84653218 00000564 8b4a8b5c MyDrv+0x1037
01 8b4a8b34 82c8e27f 84653218 00000564 82b79b84 nt!PsCallImageNotifyRoutines+0x62
02 8b4a8be8 82c7ed4a 84664d80 85eb6030 8b4a8ce4 nt!MiMapViewOfImageSection+0x670
03 8b4a8c58 82c7ee3a 85eb6030 8b4a8ce4 00000000 nt!MiMapViewOfSection+0x22e
04 8b4a8c88 82c7f599 9fcdb1e8 85eb6030 8b4a8ce4 nt!MmMapViewOfSection+0x2a
05 8b4a8d04 82a751ea 00001458 ffffffff 0cccee94 nt!NtMapViewOfSection+0x204
06 8b4a8d04 771d70b4 00001458 ffffffff 0cccee94 nt!KiFastCallEntry+0x12a (FPO: [0,3] TrapFrame @ 8b4a8d34)
07 0cccefa0 00000000 00000000 00000000 00000000 0x771d70b4
nt 커널에서 콜백 함수로 호출해주는 MyDrv 모듈의 MyDrv+0x1037 함수에서 문제가 발생했다.
이 콜백은 PsSetLoadImageNotifyRoutine을 통해 미리 등록하면 exe나 dll 등의 파일이 로드될 때 해당 모듈의 정보를 받을 수 있는 함수다.
MyDrv 모듈 심볼은 없지만 콜 스택에서 PsSetLoadImageNotifyRoutine 함수 다음에 호출된 함수이므로 해당 콜백임을 알 수 있다.
나는 이 콜백을 편의상 LoadImageNotifyRoutine이라고 부른다.
다행히 BSOD가 발생한 위치도 명확하고 콜 스택도 단순한 편이라 마지막 MyDrv+0x1037 부분만 분석하면 답을 찾을 수 있겠다..
다음은 BSOD가 발생한 MyDrv+0x1037 부분이 포함되도록 함수 시작부터 디스어셈블링한 내용이다.
kd> u 92140010 L19
MyDrv+0x1010:
92140010 8bff mov edi,edi
92140012 55 push ebp
92140013 8bec mov ebp,esp
92140015 83ec08 sub esp,8
92140018 0fb60520201492 movzx eax,byte ptr [MyDrv+0x3020 (92142020)]
9214001f 83f801 cmp eax,1
92140022 752e jne MyDrv+0x1052 (92140052)
92140024 8b4d08 mov ecx,dword ptr [ebp+8] // 1) 첫 번째 파라미터 ecx에 저장(ecx = ebp + 8)
92140027 8b5104 mov edx,dword ptr [ecx+4] // 2) 첫 번째 파라미터의 +4 위치 edx에 저장(edx = ecx + 4)
9214002a 8955fc mov dword ptr [ebp-4],edx
9214002d c745f800000000 mov dword ptr [ebp-8],0
92140034 8b45fc mov eax,dword ptr [ebp-4] // 3) 루프 시작
92140037 0fb708 movzx ecx,word ptr [eax] // 4) 2바이트 읽음, BSOD 발생 위치
9214003a 85c9 test ecx,ecx // 5) 값이 NULL 이면 루프 종료
9214003c 7414 je MyDrv+0x1052 (92140052)
9214003e 8b55fc mov edx,dword ptr [ebp-4]
92140041 83c202 add edx,2 // 6) 다음 2바이트로 이동
92140044 8955fc mov dword ptr [ebp-4],edx
92140047 8b45f8 mov eax,dword ptr [ebp-8]
9214004a 83c001 add eax,1
9214004d 8945f8 mov dword ptr [ebp-8],eax
92140050 ebe2 jmp MyDrv+0x1034 (92140034) // 7) NULL 이 아니면 3)번으로 이동해서 다음 2바이트 읽기
92140052 8be5 mov esp,ebp
92140054 5d pop ebp
92140055 c20c00 ret 0Ch
MyDrv 모듈에서 nt 커널에서 전달 받은 첫 번째 파라미터로 뭔가 반복적인 처리를 하다 문제가 발생했다.
전달된 파라미터가 이상했거나 잘못된 방식으로 파라미터를 처리했을 가능성이 의심된다.
첫 번째 파라미터의 정체를 알기 위해 LoadImageNotifyRoutine 콜백(MyDrv+0x1037)의 함수 원형을 MSDN에서 찾아보자.
우선 콜백을 등록하는 PsSetLoadImageNotifyRoutine 함수를 먼저 살펴보자.
NTSTATUS PsSetLoadImageNotifyRoutine(
_In_ PLOAD_IMAGE_NOTIFY_ROUTINE NotifyRoutine
);
PLOAD_IMAGE_NOTIFY_ROUTINE 함수 포인터를 전달해주면 나중에 DLL 등의 파일이 커널로 로드될 때 이 함수 포인터가 콜백으로 불리는 방식이다.
이제 PLOAD_IMAGE_NOTIFY_ROUTINE을 살펴보자.
PLOAD_IMAGE_NOTIFY_ROUTINE SetLoadImageNotifyRoutine;
void SetLoadImageNotifyRoutine(
_In_opt_ PUNICODE_STRING FullImageName,
_In_ HANDLE ProcessId,
_In_ PIMAGE_INFO ImageInfo
);
아하, 첫 번째 파라미터는 커널과 드라이버에서 자주 사용하는 문자열 형식인 UNICODE_STRING 구조체의 포인터다. MSDN을 읽어보면 로드되는 이미지의 전체 경로를 UNICODE_STRING 형태로 알려준다.
이제 파라미터의 정체를 알았으니 dt 명령으로 UNICODE_STRING 구조체의 내용을 살펴보자.
kd> dt _UNICODE_STRING
nt!_UNICODE_STRING
+0x000 Length : Uint2B
+0x002 MaximumLength : Uint2B
+0x004 Buffer : Ptr32
Uint2B
앞 4바이트는 문자열의 크기와 문자열 버퍼의 최대 크기로 바이트 단위다. 다음 4바이트는 문자열 버퍼의 포인터다.
구조체를 보니 앞서 함수 앞 부분에서 수행했던 연산들의 의미를 알 것 같다. 2)번 이후의 연산들은 결국 UNICODE_STRING 구조체의 +4 위치에 있는 Buffer를 가지고 와서 NULL을 만날 때까지 2바이트 씩 읽는 동작이다.
2바이트 씩 읽은 이유는 UNICODE_STRING의 Buffer가 WCHAR의 포인터인 PWSTR 자료형이기 때문이다.
앞서 1)번에서 ebp+8이 첫 번째 파라미터인 것을 확인했으니 동일하게 dt 명령으로 확인해보자.
kd> dt nt!_UNICODE_STRING poi(ebp+8)
"\Windows\assembly\GAC_MSIL\Microsoft.Web.Delegation.resources\7.1.0.0_it_31bf3856ad364e35\Microsoft.Web.Delegation.resources.dll"
+0x000 Length : 0x100
+0x002 MaximumLength : 0x100
+0x004 Buffer : 0xa0f6bf00 "\Windows\assembly\GAC_MSIL\Microsoft.Web.Delegation.resources\7.1.0.0_it_31bf3856ad364e35\Microsoft.Web.Delegation.resources.dll"
ebp+8 위치의 값이 UNICODE_STRING 포인터이므로 입력된 주소의 값을 가져오는 poi 명령을 사용했다.
poi(x)는 x라는 메모리 주소의 내용을 읽는 구문이다.
C 언어에서 포인터의 값을 읽을 때
value = *x;
로 표현하는데
value = poi(x)
라고 생각하면 쉽다.
Buffer 필드에 "\Windows\assembly\GAC_MSIL\Microsoft.Web.Delegation.resources\7.1.0.0_it_31bf3856ad364e35\Microsoft.Web.Delegation.resources.dll" 문자열이 보이고, Length, MaximumLength는 0x100이다.
문자열을 직접 세보니 128자였다. Length가 0x100이고 바이트 크기니 0x100의 10진수인 256을 WCHAR 크기인 2로 나누면 정확하게 128이 나온다.
MaximumLength는 Buffer인 a0f6bf00의 최대 크기로 접근 가능한 영역을 의미한다. Length와 크거나 같으면 되므로 정상이다.
입력된 파라미터에는 이상한 부분이 보이지 않는데 왜 문제가 발생했을까?
MyDrv 모듈에서는 Buffer인 a0f6bf00 값을 직접 접근해서 NULL을 만날 때까지 2바이트 씩 증가하는 루프를 수행했다. 아무래도 이 동작에 문제가 있을 것 같다.
db 명령으로 a0f6bf00 내용을 확인해보자.
kd> db a0f6bf00 L110
a0f6bf00 5c 00 57 00 69 00 6e 00-64 00 6f 00 77 00 73 00 \.W.i.n.d.o.w.s.
a0f6bf10 5c 00 61 00 73 00 73 00-65 00 6d 00 62 00 6c 00 \.a.s.s.e.m.b.l.
a0f6bf20 79 00 5c 00 47 00 41 00-43 00 5f 00 4d 00 53 00 y.\.G.A.C._.M.S.
a0f6bf30 49 00 4c 00 5c 00 4d 00-69 00 63 00 72 00 6f 00 I.L.\.M.i.c.r.o.
a0f6bf40 73 00 6f 00 66 00 74 00-2e 00 57 00 65 00 62 00 s.o.f.t...W.e.b.
a0f6bf50 2e 00 44 00 65 00 6c 00-65 00 67 00 61 00 74 00 ..D.e.l.e.g.a.t.
a0f6bf60 69 00 6f 00 6e 00 2e 00-72 00 65 00 73 00 6f 00 i.o.n...r.e.s.o.
a0f6bf70 75 00 72 00 63 00 65 00-73 00 5c 00 37 00 2e 00 u.r.c.e.s.\.7...
a0f6bf80 31 00 2e 00 30 00 2e 00-30 00 5f 00 69 00 74 00 1...0...0._.i.t.
a0f6bf90 5f 00 33 00 31 00 62 00-66 00 33 00 38 00 35 00 _.3.1.b.f.3.8.5.
a0f6bfa0 36 00 61 00 64 00 33 00-36 00 34 00 65 00 33 00 6.a.d.3.6.4.e.3.
a0f6bfb0 35 00 5c 00 4d 00 69 00-63 00 72 00 6f 00 73 00 5.\.M.i.c.r.o.s.
a0f6bfc0 6f 00 66 00 74 00 2e 00-57 00 65 00 62 00 2e 00 o.f.t...W.e.b...
a0f6bfd0 44 00 65 00 6c 00 65 00-67 00 61 00 74 00 69 00 D.e.l.e.g.a.t.i.
a0f6bfe0 6f 00 6e 00 2e 00 72 00-65 00 73 00 6f 00 75 00 o.n...r.e.s.o.u.
a0f6bff0 72 00 63 00 65 00 73 00-2e 00 64 00 6c 00 6c 00 r.c.e.s...d.l.l.
이런! a0f6bf00 위치에 접근할 때 BSOD가 발생했는데 메모리 내용을 보니 문자열 끝에 NULL(0x00) 값이 존재하지 않는다. a0f6c000부터는 페이지 아웃되어 접근할 수 없는 영역이다.
문자열 버퍼인 a0f6bf00은 MaximumLength 크기인 a0f6bfff까지만 접근 가능한데, 이 영역을 넘어 a0f6c000까지 접근하다 BSOD가 발생한 것이다.
MyDrv에서 UNICODE_STRING의 특징을 잘 모르고 사용한 것이 문제의 원인이다.
MSDN을 찾아보면 만약 Buffer 필드의 문자열이 NULL 문자로 끝날 경우 Length 필드의 길이는 NULL 문자를 포함하지 않는다고 적혀있다. UNICODE_STRING의 Buffer 문자열이 NULL 로 끝나지 않을 수 있음을 암시하고 있는 것이다.
Remarks : If the string is null-terminated, Length does not include the trailing null character.
MyDrv는 아마 다음과 같은 함수를 구현해서 사용하다 BSOD를 발생시켰을 것이다.
다음에 소개하는 GetLength, TestFunc1, TestFunc2 함수는 이해를 돕기 위해 내가 작성해 본 의사 코드(Pseudo Code)다. GetLength 함수는 문자열의 길이를 구하는 함수고, TestFunc1, TestFunc2 함수는 GetLength 함수를 사용하는 함수를 의미한다.
ULONG
GetLength(PWSTR pImagePath)
{
ULONG ulLength = 0;
while (*pImagePath)
{
pImagePath ++;
ulLength ++;
}
return ulLength;
}
VOID
TestFunc1(PWSTR pImagePath)
{
ulCount = GetLength(pImagePath);
}
VOID
TestFunc2(PUNICODE_STRING pImagePath)
{
ulCount = GetLength(pImagePath->Buffer);
GetLength 함수는 단순하게 문자열 길이를 구하는 함수인데 입력된 문자열에서 NULL 값을 만날 때까지 포인터를 하나씩 증가시키며 문자열 길이를 센다. 얼핏 보기에는 문제가 없어 보이지만 이 함수에는 심각한 문제가 숨어 있다. 바로 문자열이 항상 NULL로 끝난다고 가정하는 것이다.
문제를 단순화하기 위해 TestFunc1, TestFunc2 함수에 전달되는 pImagePath 파라미터는 항상 유효하다고 가정해보자.
TestFunc1 함수는 언제나 잘 동작할 것이다. 하지만 TestFunc2 함수는 BSOD가 발생할 가능성이 있다.
왜냐하면 UNICODE_STRING의 Buffer 문자열은 NULL로 끝나지 않을 수 있기 때문이다!
절대로 UNICODE_STRING의 Buffer 를 pusImagePath->Buffer 형태로 직접 사용하면 안된다.
문자열 길이를 구하기 위함이라면 단순히 UNICODE_STRING의 Length를 사용하면 된다. Buffer의 값을 사용할 때는 반드시 Length 필드를 확인해서 유효한 메모리 영역만 접근해야 한다.
과거 코드 리뷰 중 다음과 같은 코드를 본 기억이 난다.
SomeFunc(…)
{
PWSTR pszImagePath;
// 절대로 안 된다!
pszImagePath = pusImagePath->Buffer;
이런 코드를 본다면 머릿속에서 경고음이 마구 울려야 한다.
다시 한 번 말하지만 절대로 UNICODE_STRING의 문자열 버퍼가 NULL로 끝날 것이라 가정하지 마라. 그리고 UNICODE_STRING은 가급적 가공하지 말고 그대로 사용하도록 하자.
RtlUnicodeStringxxx로 시작하는 API를 사용하는 편이 좋고, 만약 Buffer 필드를 직접 사용해야 한다면 반드시 Length 필드를 함께 확인하는 습관을 들이자.
안타깝게도 개발을 하다보면 이런 주의 사항을 알고도 잊어 버리는 경우가 종종 있다.
보통 문자열을 다룰 때 많은 버그가 발생하게 되는데 UNICODE_STRING을 다룰 때는 좀 더 긴장하는 편이 좋다.
가장 좋은 방법은 문자열을 다룰 때 RtlStringCbxxx, RtlStringCchxxx 계열의 안전한 문자열 API를 사용하는 것이다.
이런 API가 사용된 코드는 문자열 관련 버그나 버퍼 오버플로우 같은 문제가 쉽게 발생하지 않는다.
'Dump Analysis' 카테고리의 다른 글
[0xC5] 풀 헤더 손상 (0) | 2018.07.16 |
---|---|
[0x1A] 페이지 손상 (0) | 2018.07.12 |
[0x50] 해제된 핸들 (0) | 2018.07.09 |
[0x50] 숨겨진 콜 스택 (0) | 2018.07.07 |
필터매니저(fltmgr.sys) 버그? DRAINING ZOMBIED 와 DOE_UNLOAD_PENDING (0) | 2015.01.22 |
그동안 정말 많은 윈도우 커널 메모리 덤프를 분석한 것 같은데
분석한 내용을 어딘가에 남겨놓지 않으니 자꾸 잊어버리는 것 같다.
그래서 틈 나는 대로 관련 내용들을 Dump Analysis에 올려볼 생각이다.
물론 모든 분석 내용은 WinDbg라는 디버깅 툴로 진행한 것이다.
어쨌든 요즘 같은 시대에 관심있는 사람들이 얼마나 될까 싶기는 하지만,
계속 메모리 덤프를 분석할 일이 있는 것을 보면 도움이 될지도 모르겠다.
아마 윈도우가 없어지기 전까진 계속 메모리 덤프를 분석할 일이 있겠지 싶다.
'Life' 카테고리의 다른 글
Windows Debugging 책 출간 소식^^ (0) | 2018.12.02 |
---|