内核模式下的字符串操作
(2011-07-23 19:18:42)
标签:
it |
分类: windows核心开发 |
表3-7列出了用于处理Unicode和ANSI字符串的服务函数。我还对应列出了一些标准C运行时间库函数,这些函数在内核模式中也存在,它们可以处理常规的C样式串。虽然它们从来没有在DDK文档中公开过,但标准DDK头中有这些函数的声明,而且连接库中也包含了它们,所以没有理由不使用它们。
表3-7.
操作 | ANSI串函数 | Unicode串函数 |
---|---|---|
Length | strlen | wcslen |
Concatenate | strcat, strncat |
wcscat, wcsncat, RtlAppendUnicodeStringTo |
Copy | strcpy, strncpy, RtlCopyString | wcscpy, wcsncpy, RtlCopyUnicodeString |
Reverse | _strrev | _wcsrev |
Compare | strcmp, strncmp, _stricmp, _strnicmp, RtlCompareString, RtlEqualString | wcscmp, wcsncmp, _wcsicmp, _wcsnicmp, RtlCompareUnicodeString, RtlEqualUnicodeString, RtlPrefixUnicodeString |
Initialize | _strset, _strnset, RtlInitAnsiString, RtlInitString | _wcsnset, RtlInitUnicodeString |
Search | strchr, strrchr, strspn, strstr | wcschr, wcsrchr, wcsspn, wcsstr |
Upper/lowercase | _strlwr, _strupr, RtlUpperString | _wcslwr, _wcsupr, RtlUpcaseUnicodeString |
Character | isdigit, islower, isprint, isspace, isupper, isxdigit, tolower, toupper, RtlUpperChar | towlower, towupper, RtlUpcaseUnicodeChar |
Format | sprintf, vsprintf, _snprintf, _vsnprintf | swprintf, _snwprintf |
String conversion | atoi, atol, _itoa |
_itow, RtlIntegerToUnicodeStrin |
Type conversion |
RtlAnsiStringToUnicodeSi |
RtlUnicodeStringToAnsiSt |
Memory release | RtlFreeAnsiString |
RtlFreeUnicodeString |
Blob数据(大块数据)
我从数据库技术中借来术语“blob”来描述一块无结构定义的字节组合。表3-8列出了处理这种数据的函数(包括一些来自标准运行时间库中的函数),你可以在内核模式中调用它们。我假设你能从它们的名字上看出它们的用法。然而,我需要指出一些不明显的事实:
- 内存的“copy”和“move”操作之间的区别在于可否容忍源和目的相重叠。move操作不管源和目的是否重叠。而copy操作在源和目的有任何重叠时不工作。
- “byte”操作和“memory”操作的区别是操作的间隔尺寸。byte操作保证按字节为单位执行。而memory操作可以在内部使用更大的块,所有这些块的和等于指定的字节数。这个区别会根据平台的不同而改变,在32位Intel计算机上,byte操作实际上是对应memory操作的宏。但在Alpha平台上,RtlCopyBytes与RtlCopyMemory是完全不同的函数。
表3-8.
服务函数或宏 | 描述 |
---|---|
memchr | 在blob中寻找一个字节 |
memcpy, RtlCopyBytes, RtlCopyMemory | 复制字节,不允许重叠 |
memmove, RtlMoveMemory | 复制字节,允许重叠 |
memset, RtlFillBytes, RtlFillMemory | 用给定的值填充blob |
memcmp, RtlCompareMemory, RtlEqualMemory | 比较两个blob |
memset, RtlZeroBytes, RtlZeroMemory | blob清零 |
驱动程序中字符串操作涉及到ASCII字符串、宽字符串,还有DDK定义的ANSI_STRING数据结构和UNICODE_STRING数据结构。
1)ASCII字符串和宽字符串
在应用程序中使用两种字符:一是char型字符串,负责记录ANSI字符集,它是指向一个char数组的指针,每个char型变量大小是一个字节,字符串是以0标志字符串结束的;一是wchar_t型的宽字符串,负责描述unicode字符集,它是指向一个wchar_t数组的指针,wchar_t字符大小为两个字节,字符串以0标志字符串结束。
ANSI字符构造如下:
char
UNICODE字符构造如下:
wchar_t
(注:在构造字符串时使用关键字“L”,编译器会自动生成所需要的宽字符)
在驱动开发中,DDK将char和wchar_t替换成CHAR和WCHAR。驱动程序中使用KdPrint宏打印ASCII字符串和宽字符串:
CHAR *string1
=
KdPrint(("%s/n",
string1));
WCHAR *string2 = L"ASCE";
KdPrint(("%S/n",
string2));
2)ANSI_STRING字符串与UNICODE_STRING字符串
DDK不鼓励程序员使用C语言的字符串,主要是因为标准C字符串处理函数容易导致缓冲区溢出等错误。应该使用DDK自定义的字符串:
typedef
} ANSI_STRING, *PANSI_STRING;
这个结构对ASCII字符串进行封装。
和标准C字符串不同,STRING字符串不是以0标志字符结束的。标准C字符串中,如果缓冲区长度是N,则只能容纳N-1个字符的字符串,最后一个字节存储NULL;而在STRING字符串中,缓冲区大小是MaximumLength,最大字符串长度可以是MaximumLength,而不是MaximumLength-1。
与ANSI_STRING相对应,DDK将宽字符串封装成UNICODE_STRING数据结构:
typedef
} UNICODE_STRING, *PUNICODE_STRING;
与ANSI_STRING一样,UNICODE_STRING字符串不是以NULL为结束标志的。
打印这两种字符串方法如下:
ANSI_STRING ansiString;
//此处略去对ansiString的初始化
KdPrint(("%Z/n",
&ansiString));
UNICODE_STRING uniString;
//此处略去对uniString的初始化
KdPrint(("%wZ/n", &uniString));//注意是%wZ
3)字符的初始化和销毁
ANSI_STRING字符串和UNICODE_STRING字符串使用前需要进行初始化,有两种方法构造这个数据结构:
(1)使用DDK提供的函数:
初始化ANSI_STRING字符串:
VOID RtlInitAnsiString(
);
初始化UNICODE_STRING字符串:
VOID RtlInitUnicodeString(
);
这种初始化的优点是操作简单,用完后不用清理内存。但有一个问题,就是如果修改SourceString,同时会导致DestinationString字符发生变化:
ANSI_STRING ansiString;
CHAR *string
=
//初始化ANSI_STRING字符串
RtlInitAnsiString(&ansiString, string);
KdPrint(("ansiString: %Z/n", &ansiString));
//改变string
string[0]
=
string[1]
=
string[2]
=
string[3]
=
//改变string的同时ansiString也改变了
KdPrint(("ansiString: %Z/n", &ansiString));
(2)程序员自己申请内存,并初始化内存,当不用字符串时,需要回收字符串占用的内存:
#define
UNICODE_STRING UnicodeString = {0};
//设置缓冲区大小
UnicodeString.MaximumLength = BUFFER_SIZE;
//分配内存
UnicodeString.Buffer = (PWSTR)ExAllocatePool(PagedPool, BUFFER_SIZE);
WCHAR *wideString = L"ASCE";
//设置字符串长度,因为是宽字符,所以是字符长度的倍
UnicodeString.Length = 2*wcslen(wideString);
//保证缓冲区足够大,否则程序终止
ASSERT(UnicodeString.MaximumLength >= UnicodeString.Length);
//内存复制
RtlCopyString(UnicodeString.Buffer, wideString, UnicodeString.Length);
KdPrint(("UnicodeString: %wZ/n", &UnicodeString));
//清理内存
ExFreePool(UnicodeString.Buffer);
UnicodeString.Buffer = NULL;
UnicodeString.Length = UnicodeString.MaximumLength = 0;
对于最后一步清理内存,DDK给出了简化函数,分别是RtlFreeAnsiString和RtlFreeUnicodeString,这两个函数内部调用了ExFreePool去回收内存的。
4)字符串复制
DDK提供针对ANSI_STRING字符串和UNICODE_STRING字符串的复制字符串函数:
VOID RtlCopyString(
);
VOID RtlCopyUnicodeString(
);
下面代码说明了RtlCopyUnicodeString函数的使用:
#define
//初始化UnicodeString1
UNICODE_STRING UnicodeString1;
RtlInitUnicodeString(&UnicodeString1, L"ASCE");
//初始化UnicodeString2
UNICODE_STRING UnicodeString2 = {0};
UnicodeString2.Buffer = (PWSTR)ExAllocatePool(PagedPool, BUFFER_SIZE);
UnicodeString2.MaximumLength = BUFFER_SIZE;
//将初始化UnicodeString1复制到UnicodeString2
RtlCopyUnicodeString(&UnicodeString2, &UnicodeString1);
//分别显示UnicodeString1和UnicodeString2
KdPrint(("UnicodeString1: %wZ/n", &UnicodeString1));
KdPrint(("UnicodeString2: %wZ/n", &UnicodeString2));
//销毁UnicodeString2,注意:UnicodeString1不用销毁
RtlFreeUnicodeString(&UnicodeString2);
5)字符串比较
DDK提供了对ANSI_STRING字符串和UNICODE_STRING字符串的相关比较函数:
LONG RtlCompareString(
);
LONG RtlCompareUnicodeString(
);
DDK同时提供了RtlEqualString和RtlEqualUnicodeString函数,返回为非零代表相等,零代表不相等:
BOOLEAN RtlEqualString(
);
BOOLEAN RtlEqualUnicodeString(
);
函数实例:
//初始化UnicodeString1
UNICODE_STRING UnicodeString1;
RtlInitUnicodeString(&UnicodeString1, L"ASCE");
//初始化UnicodeString2
UNICODE_STRING UnicodeString2;
RtlnitUnicodeString(&UnicodeString2, L"ASCE BOY");
//判断字符串是否相等
if(RtlEqualUnicodeString(&UnicodeString1, &UnicodeString2, TRUE))
{
}
else
{
}
6)字符串转化成大写
DDK提供的将ANSI_STRING字符串和UNICODE_STRING字符串转换成大写的函数如下:
VOID RtlUpperString(
);
NTSTATUS RtlUpcaseUnicodeString(
//目的字符串和源字符串可以是同一个字符串
);
实例代码:
//初始化UnicodeString1
UNICODE_STRING UnicodeString;
RtlInitUnicodeString(&UnicodeString, L"ASCE BOY");
//变化前
KdPrint(("UnicodeString: %wZ/n", &UnicodeString));
//转化成大写
RtlUpcaseUnicodeString(&UnicodeString, &UnicodeString, FALSE);
//变化后
KdPrint(("UnicodeString: %wZ/n", &UnicodeString));
7)字符串与整型数字相互转换
将UNICODE_STRING字符串转换成整数:
NTSTATUS
RtlUnicodeStringToIntege
);
将整数转换成UNICODE_STRING字符串:
NTSTATUS
RtlIntegerToUnicodeStrin
);
实例代码如下:
#define
//字符串转换成数字
UNICODE_STRING UnicodeString;
RtlInitUnicodeString(&UnicodeString, L"-100");
ULONG lNumber;
NTSTATUS nStatus =
RtlUnicodeStringToIntege
if(NT_SUCCESS(nStatus))
{
}
else
{
}
//将数字转换成字符串
UNICODE_STRING UnicodeStringSec = {0};
UnicodeStringSec.Buffer = (PWSTR)ExAllocatePool(PagedPool, BUFFER_SIZE);
UnicodeStringSec.MaximumLength = BUFFER_SIZE;
nStatus = RtlIntegerToUnicodeStrin
if(NT_SUCCESS(nStatus))
{
}
else
{
}
//销毁UnicodeStringSec,注意:UnicodeString不用销毁
RtlFreeUnicodeString(&UnicodeStringSec);
8)ANSI_STRING字符串与UNICODE_STRING字符串的转换
将UNICODE_STRING字符串转换成ANSI_STRING字符串:
NTSTATUS
RtlUnicodeStringToAnsiSt
);
将ANSI_STRING字符串转换成UNICODE_STRING字符串:
NTSTATUS
RtlAnsiStringToUnicodeSt
);
实例代码如下:
//将UNICODE_STRING字符串转换成ANSI_STRING字符串
UNICODE_STRING UnicodeString;
RtlInitUnicodeString(&UnicodeString, L"ASCE BOY");
ANSI_STRING AnsiString;
NTSTATUS nStatus =
RtlUnicodeStringToAnsiSt
if(NT_SUCCESS(nStatus))
{
}
else
{
}
//销毁AnsiString
RtlFreeAnsiString(&AnsiString);
//将ANSI_STRING字符串转换成UNICODE_STRING字符串
ANSI_STRING AnsiStringSec;
RtlInitString(&AnsiStringSec,
UNICODE_STRING UnicodeStringSec;
nStatus =
RtlAnsiStringToUnicodeSt
if(NT_SUCCESS(nStatus))
{
}
else
{
}
//销毁UnicodeStringSec
RtlFreeUnicodeString(&UnicodeStringSec);