超线程加快了 Linux 的速度单处理器上的多处理器性能-3

论坛元老

Rank: 8 Rank: 8

UID: 1066743

1^#

打印

字体大小: tT

look_w发表于 2018-4-16 21:19 | 只看该作者

超线程加快了 Linux 的速度单处理器上的多处理器性能-3

超线程对 Linux 多线程应用程序工作负载的影响为测量超线程对 Linux 多线程应用程序的影响，我们使用模仿聊天室的 chat 基准测试程序。该基准测试程序包括了客户机和服务器。该基准测试程序的客户机端将报告每秒钟所发送的消息数；聊天室和消息的数量将控制工作负载。该工作负载创建许多线程和 TCP／IP 连接，并发送和接收许多消息。它使用了以下缺省参数：

聊天室个数 = 10
消息数 = 100
消息大小 = 100 字节
用户数 = 20

缺省情况下，每个聊天室有 20 位用户。10 个聊天室一共有 20x10 = 200 位用户。客户机将为聊天室里的每位用户创建至服务器的连接。由于我们有 200 位用户，所以我们将有 200 个到服务器的连接。现在，为聊天室中的每个用户（或连接）都创建了一个“发送”线程和一个“接收”线程。因此，“10 个聊天室”方案将创建 10x20x2 = 400 个客户机线程和 400 个服务器线程，一共是 800 个线程。但事实上不止这些。
每个客户机“发送”线程将把指定数量的消息发送给服务器。对于 10 个聊天室和 100 条消息而言，客户机将发送 10x20x100 = 20,000 条消息。服务器“接收”线程将接收相应数量的消息。聊天室服务器将把每条消息传回给聊天室中的其他用户。因而，对于 10 个聊天室和 100 条消息而言，服务器“发送”线程将发送 10x20x100x19 = 380,000 条消息。客户机“接收”线程将接收相应数量的消息。
通过命令行会话启动聊天服务器，以另一个命令行会话启动客户机，来开始测试。客户机模拟工作负载，并且其结果表示由该客户机所发送的消息数。当客户机结束其测试时，服务器循环并接受来自该客户机的其它启动消息。在我们的测量中，我们用 20、30、40 和 50 个聊天室来运行该基准测试程序。相应的连接和线程数如表 3 所示。
表 3. 所测试的聊天室和线程的数量聊天室的数量连接的数量线程的数量所发送消息的数量所接收的消息的数量消息的总数204001,60040,000760,000800,000306002,40060,0001,140,0001,200,000408003,20080,0001,520,0001,600,0005010004,000100,0001,900,0002,000,000
表 4 显示了超线程对聊天工作负载性能的影响。每个数据点表示五次运行的几何平均数。数据集清楚地说明超线程根据聊天室的数量能将工作负载吞吐量提高 22% 到 28%。大体说来，基于 4 个聊天室样本的几何平均数，超线程将把聊天性能提高 24%。
表 4. 超线程对聊天吞吐量的影响聊天室的数量2419s-noht2419s-ht加速20164,071202,80924%30151,530184,80322%40140,301171,18722%50123,842158,54328%几何平均数144,167178,58924%注：数据是客户机所发送的消息数：越大越好。图 1. 超线程对聊天工作负载的影响

超线程对 Linux 多线程文件服务器工作负载的影响用 dbench 及其“同伴”测试 tbench 来测量超线程对文件服务器的影响。dbench 类似于 Ziff-Davis Media 基准程序中著名的 NetBench 基准测试程序，它让您在文件服务器处理来自客户机的网络文件请求时，测量其性能。但是，NetBench 要求精心设置实际的物理客户机，而 dbench 则模拟 90,000 个操作以产生相同的工作负载，这些操作通常由 NetBench 客户机通过嗅探称为 client.txt 的 4 MB 文件来运行。这个文件的内容是文件操作伪指令，例如 SMBopenx、SMBclose、SMBwritebraw 和 SMBgetatr 等。这些 I/O 调用符合服务器消息块（Server Message Block，SMB）协议，SAMBA 中的 SMBD 服务器在 netbench 运行中将产生该协议。SMB 协议被 Microsoft Windows 3.11、NT 和 95/98 用于共享磁盘和打印机。
在我们的测试中，一共使用了 18 种不同类型的 I/O 调用，包括打开文件、读、写、锁定、解锁、获取文件属性、设置文件属性、关闭、获取磁盘可用空间、获取文件时间、设置文件时间、“查找”打开、“查找”下一个、“查找”关闭、重命名文件、删除文件、创建新文件和清空文件缓冲区。
dbench 可以模拟任何数量的客户机，而不必进行物理设置。dbench 只产生文件系统负载，它没有联网调用。运行期间，每个客户机记录所移动的数据字节数并将该数除以移动该数据所需的时间量。然后累加所有的客户机吞吐量数以确定该服务器的总吞吐量。总的 I/O 吞吐量分数表示测试期间每秒钟所传送的兆字节数。这个测量说明该服务器对来自客户机的文件请求的处理质量。
dbench 非常适合于对超线程的测试，因为它对 CPU 和 I/O 调度程序创建了大量负载和活动。dbench 可以严格测试超线程支持多线程文件服务的能力，因为客户机同时创建和访问许多文件。每个客户机必须创建相当于大约 21 兆字节的测试数据文件。对于要运行 20 个客户机的测试，预计要大约 420 兆字节的数据。对于测量 Linux 文件系统所用的电梯算法性能，dbench 被认为是非常不错的测试方法。dbench 用于测试该算法的工作正确性，并测试电梯的反应是否足够快速。它还是很有趣的页面替换测试。
表 5 显示了 HT 对 dbench 工作负载的影响。每个数据点表示五次运行的几何平均数。数据说明了超线程将 dbench 的性能最少提高了 9%，最多提高了 29%。基于这五个测试方案的几何平均数，总体的提高幅度是 18%。
表 5. 超线程对 dbench 吞吐量的影响客户机的数量2419s-noht2419s-ht加速20132.82171.2329%30131.43169.5529%60119.95133.7712%90111.89121.819%12099.31114.9216%几何平均数118.4140.318%注：数据是用 MB/sec 表示的吞吐量：越大越好。图 2. 超线程对 dbench 工作负载的影响

收藏分享评分

回复引用

订阅 TOP

返回列表

超线程加快了 Linux 的速度 单处理器上的多处理器性能-3

超线程加快了 Linux 的速度 单处理器上的多处理器性能-3

超线程加快了 Linux 的速度单处理器上的多处理器性能-3

超线程加快了 Linux 的速度单处理器上的多处理器性能-3