首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

实战技巧,Mali GPU编程特性及二维浮点矩阵运算并行优化详解(3)

实战技巧,Mali GPU编程特性及二维浮点矩阵运算并行优化详解(3)

当计算量逐步增加的时候,Mali GPU的并行能力逐渐体现出其优势,加速比有显著提升,当计算量大到一定程度的时候,加速比趋于稳定,因为这时Mali GPU上有大量的线程切换,不仅隐蔽了访存的延迟,也使得Mali GPU上的计算单元满载,其计算效率已达到硬件能够承受的极限,此时Mali GPU可以提接近40倍的供惊人的加速比。

实际测试时,笔者使用top指令观察矩阵进程的CPU占用量,串行方案的CPU占用量在98%左右,而基于Mali GPU的并行方案对CPU几乎没有占用量,说明并行方案不仅可以提升计算效率,还降低了CPU的负担,大大提升了系统实时性。实验的实际测试结果和GPU异构运算特点吻合。

4.结语
本文针对Mali-T604 GPU论述了基于OpenCL的Linux平台上进行通用计算并行优化的方法,论述了Mali-T604 GPU的硬件特点,并基于OpenCL设计了二维矩阵乘法的并行方案,在Mali-T604上获得了惊人的加速比,结果表明Mali GPU对于庞大输入量的计算密集型高度可数据并行化通用计算问题有显著的加速能力,且并行优化结果正确可靠。
返回列表