安全编程防止缓冲区溢出-简介

论坛元老

Rank: 8 Rank: 8

UID: 1066743

1^#

打印

字体大小: tT

look_w发表于 2018-4-19 12:14 | 只看该作者

安全编程防止缓冲区溢出-简介

1988 年 11 月，许多组织不得不因为“Morris 蠕虫”而切断 Internet 连接，“Morris 蠕虫”是 23 岁的程序员 Robert Tappan Morris 编写的用于攻击 VAX 和 Sun 机器的程序。据有关方面估计，这个程序大约使得整个 Internet 的 10% 崩溃。 2001 年 7 月，另一个名为“Code Red”的蠕虫病毒最终导致了全球运行微软的 IIS Web Server 的 300,000 多台计算机受到攻击。2003 年 1 月，“Slammer”（也称为“Sapphire”）蠕虫利用 Microsoft SQL Server 2000 中的一个缺陷，使得南韩和日本的部分 Internet 崩溃，中断了芬兰的电话服务，并且使得美国航空订票系统、信用卡网络和自动出纳机运行缓慢。所有这些攻击 ―― 以及其他许多攻击，都利用了一个称做为                      缓冲区溢出 的程序缺陷。
1999 年 Bugtraq（一个讨论安全缺陷的邮件列表）进行的一次非正式调查发现，三分之二的参与者认为第一号的缺陷就是缓冲区溢出（要了解相关背景，请参阅本文后面部分列出的“Buffer Overflows: Attacks and Defenses for the Vulnerability of the Decade”一文）。从 1997 年到 2002 年 3 月，CERT/CC 发出的半数安全警报都基于缓冲区缺陷。
如果希望自己的程序是安全的，您需要知道什么是缓冲区溢出，如何防止它们，可以采用哪些最新的自动化工具来防止它们（以及为什么这些工具还不足够），还有如何在您自己的程序中防止它们。
什么是缓冲区溢出？缓冲区以前可能被定义为“包含相同数据类型的实例的一个连续计算机内存块”。在 C 和 C++ 中，缓冲区通常是使用数组和诸如                      malloc()  和                      new 这样的内存分配例程来实现的。极其常见的缓冲区种类是简单的字符数组。                      溢出是指数据被添加到分配给该缓冲区的内存块之外。
如果攻击者能够导致缓冲区溢出，那么它就能控制程序中的其他值。虽然存在许多利用缓冲区溢出的方法，不过最常见的方法还是“stack-smashing”攻击。Elias Levy (又名为 Aleph One）的一篇经典文章“Smashing the Stack for Fun and Profit”解释了 stack-smashing 攻击，Elias Levy 是 Bugtraq 邮件列表（请参阅  以获得相关链接）的前任主持人。
为了理解 stack-smashing 攻击（或其他任何缓冲区攻击）是如何进行的，您需要了解一些关于计算机在机器语言级实际如何工作的知识。在类 UNIX 系统上，每个进程都可以划分为三个主要区域：文本、数据和堆栈。                      文本区域包括代码和只读数据，通常不能对它执行写入操作。                      数据区域同时包括静态分配的内存（比如全局和静态数据）和动态分配的内存（通常称为                      堆）。                      堆栈区域用于允许函数/方法调用；它用于记录函数完成之后的返回位置，存储函数中使用的本地变量，向函数传递参数，以及从函数返回值。每当调用一个函数，就会使用一个新的                      堆栈帧来支持该调用。了解这些之后，让我们来考察一个简单的程序。
清单 1. 一个简单的程序

1
2
3
4
5
6
7

void function1(int a, int b, int c) {
char buffer1[5];
gets(buffer1); /* DON'T DO THIS */
}
void main() {
function(1,2,3);
}

假设使用 gcc 来编译清单 1 中的简单程序，在 X86 上的 Linux 中运行，并且紧跟在对                         gets() 的调用之后中止。此时的内存内容看起来像什么样子呢？答案是它看起来类似图 1，其中展示了从左边的低位地址到右边的高位地址排序的内存布局。
图 1. 堆栈视图内存的底部

内存的顶部
buffer1sfpretabc
<--- 增长 ---[          ][    ][ ][ ][ ][ ]...堆栈的顶部

堆栈的底部
许多计算机处理器，包括所有 x86 处理器，都支持从高位地址向低位地址“倒”增长堆栈。因此，每当一个函数调用另一个函数，更多的数据将被添加到左边（低位地址），直至系统的堆栈空间耗尽。在这个例子中，当                      main() 调用                      function1() 时，它将 c 的值压入堆栈，然后压入 b 的值，最后压入 a 的值。之后它压入                      return (ret) 值，这个值在                      function1() 完成时告诉                      function1() 返回到                      main() 中的何处。它还把所谓的“已保存的帧指针（saved frame pointer，sfp）”记录到堆栈上；这并不是必须保存的内容，此处我们不需要理解它。在任何情况下，                      function1() 在启动以后，它会为                      buffer1() 预留空间，这在图 1 中显示为具有一个低地址位置。
现在假设攻击者发送了超过                      buffer1() 所能处理的数据。接下来会发生什么情况呢？当然，C 和 C++ 程序员不会自动检查这个问题，因此除非程序员明确地阻止它，否则下一个值将进入内存中的“下一个”位置。那意味着攻击者能够改写                      sfp （即已保存的帧指针），然后改写                         ret （返回地址）。之后，当                      function1() 完成时，它将“返回”―― 不过不是返回到                      main() ，而是返回到攻击者想要运行的任何代码。
通常攻击者会使用它想要运行的恶意代码来使缓冲区溢出，然后攻击者会更改返回值以指向它们已发送的恶意代码。这意味着攻击者本质上能够在一个操作中完成整个攻击！Aleph On 的文章（请参阅）详细介绍了这样的攻击代码是如何创建的。例如，将一个 ASCII 0 字符压入缓冲区通常是很困难的，而该文介绍了攻击者一般如何能够解决这个问题。
除了 smashing-stack 和更改返回地址外，还存在利用缓冲区溢出缺陷的其他途径。与改写返回地址不同，攻击者可以 smashing-stack（使堆栈上的缓冲区溢出），然后改写局部变量以利用缓冲区溢出缺陷。缓冲区根本就不必在堆栈上 ―― 它可以是堆中动态分配的内存（也称为“malloc”或“new”区域），或者在某些静态分配的内存中（比如“global”或“static”内存）。基本上，如果攻击者能够溢出缓冲区的边界，麻烦或许就会找上你了。然而，最危险的缓冲区溢出攻击就是 stack-smashing 攻击，因为如果程序对攻击者很脆弱，攻击者获得整个机器的控制权就特别容易。
为什么缓冲区溢出如此常见？在几乎所有计算机语言中，不管是新的语言还是旧的语言，使缓冲区溢出的任何尝试通常都会被该语言本身自动检测并阻止（比如通过引发一个异常或根据需要给缓冲区添加更多空间）。但是有两种语言不是这样：C 和 C++ 语言。C 和 C++ 语言通常只是让额外的数据乱写到其余内存的任何位置，而这种情况可能被利用从而导致恐怖的结果。更糟糕的是，用 C 和 C++ 编写正确的代码来始终如一地处理缓冲区溢出则更为困难；很容易就会意外地导致缓冲区溢出。除了 C 和 C++ 使用得                      非常广泛外，上述这些可能都是不相关的事实；例如，Red Hat Linux 7.1 中 86% 的代码行都是用 C 或 C ++ 编写的。因此，大量的代码对这个问题都是脆弱的，因为实现语言无法保护代码避免这个问题。
在 C 和 C++ 语言本身中，这个问题是不容易解决的。该问题基于 C 语言的根本设计决定（特别是 C 语言中指针和数组的处理方式）。由于 C++ 是最兼容的 C 语言超集，它也具有相同的问题。存在一些能防止这个问题的 C/C++ 兼容版本，但是它们存在极其严重的性能问题。而且一旦改变 C 语言来防止这个问题，它就不再是 C 语言了。许多语言（比如 Java 和 C#）在语法上类似 C，但它们实际上是不同的语言，将现有 C 或 C++ 程序改为使用那些语言是一项艰巨的任务。
然而，其他语言的用户也不应该沾沾自喜。有些语言存在允许缓冲区溢出发生的“转义”子句。Ada 一般会检测和防止缓冲区溢出（即针对这样的尝试引发一个异常），但是不同的程序可能会禁用这个特性。C# 一般会检测和防止缓冲区溢出，但是它允许程序员将某些例程定义为“不安全的”，而这样的代码                      可能会导致缓冲区溢出。因此如果您使用那些转义机制，就需要使用 C/C++ 程序所必须使用的相同种类的保护机制。许多语言都是用 C 语言来实现的（至少部分是用 C 语言来实现的），并且用任何语言编写的所有程序本质上都依赖用 C 或 C++ 编写的库。因此，所有程序都会继承那些问题，所以了解这些问题是很重要的。

收藏分享评分

回复引用

订阅 TOP

返回列表

安全编程 防止缓冲区溢出-简介

安全编程 防止缓冲区溢出-简介

安全编程防止缓冲区溢出-简介

安全编程防止缓冲区溢出-简介