2009年5月31日星期日

避免sprintf目标缓冲区溢出

问:我怎样才知道对于任意的sprintf调用需要多大的目标缓冲区?怎样才能避免sprintf目标缓冲区溢出?

答:对这两个极好的问题(暂时还)没有什么好答案。而这也可能正是传统stdio库最大的弱点。

当用于sprintf的格式串已知且相对简单时,有时可以预测出缓冲区的大小。如果格式串中包含一个或两个%s,你可以数出固定字符的个数(或用sizeof计算)再加上对插入的字符串的strlen调用的返回值。对于整型,%d输出的字符数不会超过

((sizeof(int) * CHAR_BIT + 2) / 3 + 1) /* +1 for '-' */

CHAR_BIT在<limits.h>中定义,但是这个计算可能有些过于保守了。它计算的是数字以八进制存储需要的字节数,十进制的存储可以保证使用同样或更少的字节数。

当格式串更复杂或者在运行前未知的时候,预测缓冲区大小会变得跟重新实现sprintf一样困难,而且会很容易出错。有一种最后防线的技术,就是用fprintf向一块内存区或临时文件输出同样的内容,然后检查fprintf的返回值或临时文件的大小,但请参见问题19.13,并提防写文件错误。

如果不能确保缓冲区足够大,就不能调用sprintf,以防缓冲区溢出后改写其他的内存区。如果格式串已知,可以用%.Ns控制%s扩展的长度,或者使用%.*s。参见问题12.11。

要避免溢出问题,可以使用限制长度的sprintf版本,即snprintf。这样使用:

snprintf(buf, bufsize, "You typed \"%s\"", answer);

snprintf在几个stdio库中已经提供好几年了,包括GNU和4.4bsd。在C99中已经被标准化了。

还有一个好处是,C99的snprintf提供了预测任意sprintf调用所需的缓冲区大小的方法。C99的snprintf返回它可能放到缓冲区的字符数,而它又可以用空指针和缓冲区大小0进行调用。因此,

nch = snprintf(NULL, 0, fmtstring, /*other arguments*/);

这样的调用就可以预测出格式串扩展后所需要的字符数。

另一个(非标准的)选择是asprintf函数,在BSD和GNU的C库中都有提供,它调用malloc为格式串分配空间,并返回分配内存区的指针。这样使用:

char *buf;

asprintf(&buf, "%d=%s", 42, "forty-two");

/*now buf points to malloc'ed space containing formatted string*/

From: <<你必须知道的495个C语言问题>>

没有评论: