首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

关于计算机架构的现状分析与未来展望

关于计算机架构的现状分析与未来展望

应用趋势、器件技术和系统结构的发展驱动了信息技术的进步。然而,这一进步的早期引擎——摩尔定律和登纳德缩放定律(Dennard scaling)——收益正在快速地变得越来越小。计算机界已经直接面临新的挑战:如何确保信息技术有一个坚实的未来。
在过去几年,计算机体系结构领域的学者进行了一些愿景规划的活动。五年前,计算社区联盟(Computing Community Consortium)发布了一篇《21世纪的计算机架构》白皮书,影响了学术界和工业界的项目资助计划。最近,《IEEE重启计算倡议》一文又从体系结构、器件和电路等方面探索计算系统的未来。
本文将努力延续这一话题的讨论,深入接触应用和器件/电路学界,了解他们的趋势和愿景。我们的目标是发现弥合应用领域和器件领域之间的鸿沟的机遇。
为什么现在要做这件事?因为近五年来发生了许多变化,尤其是以下五个方面:
1.硬件和应用的专用化鸿沟。现有的硬件性能与应用需求之间存在显著的专用化差距。一些应用,诸如虚拟现实和自治系统等,在没有专用硬件的支持下无法实现,但设计专用硬件仍然既昂贵又困难。
2.云计算。目前无处不在的云计算提供了一种清晰的“创新抽象”。云创造了巧妙且跨层次优化成本效益的规模经济。云经常是透明地提供这些创新,对最小的创业公司和新兴企业也是如此。
3.垂直化趋势。采用芯片叠加和整体制造的垂直化三维集成制造工艺,使硅基片变得更厚,显著降低了延迟,增加了带宽,提高了能效。
4.更接近物理层。器件与电路学者们正在努力探索新型材料,这些材料可以实现更加有效的信号转换、更加密集的布局方式及新的计算模型,例如,混合信号、碳纳米管、量子力学效应、生物聚合物等。
5.机器学习作为核心负载已经兴起。机器学习技术,诸如深度学习,让系统设计者惊喜地发现其可以用于许多方面,例如用户偏好预测、计算机视觉和自主导航等。
专用化的鸿沟:硬件设计大众化
为了延续计算机工业创新的光荣历史,开发硬件必须像开发软件一样简单、便宜和灵活。
广泛和新兴的看法一直认为,经典的CMOS工艺缩放路线——基于晶体管越来越小、集成度越来越高的摩尔定律的技术引擎——将在不到3代半导体工艺(6~9年)之后面临终结。而且,登纳德缩放——随着CMOS的集成度提高但能够使每个芯片的功耗保持不变的技术趋势——也将在21世纪中叶终结,这将导致处理器设计的巨大变革:运算能效已经取代面积效率或峰值逻辑门开关,成为最重要的一项限制峰值性能的设计约束。
从近期工业界的动向中可以窥见到经典工艺缩放路线即将到来的后果。例如,英特尔已经放弃了长期奉行的“工艺年-构架年(tick-tock)”开发模式,从原先每代工艺推出两款主要芯片设计,现已改为三款。这个改变意在通过维系“苟延残喘”的摩尔定律从而延长每代产品的市场寿命。更有甚者,美国半导体行业协会(Semiconductor Industry Association)也已放弃维持了数十年、每两年更新一次的国际半导体技术路线图(International Technology Roadmap for Semiconductors, ITRS)的老传统,这一技术文档为整个半导体产业界协调技术、制造与系统开发提供了指导。由于没有明确的方向维系缩放路线,ITRS的价值也在逐渐衰退。
然而,新应用的不断涌现,对计算能力的需求在日益增长。其中最突出的就是那些由大规模机器学习所驱动的、从前难以想象的应用:从图像和语音识别到无人驾驶汽车,再到击败围棋顶尖高手。同样可以看到对视觉数据处理和理解的需求的爆发式增长,有些前瞻性应用或许要求为世界上每个人提供每秒千兆像素级的运算能力。
过往计算技术的进步主要来源于对通用计算设计的巨大投入,而这些设计依赖于经典的缩放路线,并且完全由少数几家处理器制造商完成。得益于这些通用设计的计算机应用综合市场的庞大体量,足以分摊这些厂商的大量投入。
随着传统缩放路线的衰落,只通过改进少数通用计算平台将无法继续满足新兴应用对计算性能的需求。相反,在过去的5~10年里,在一些计算密集型应用领域,一种新的性能优化手段策略已经兴起——专用硬件设计。与在通用处理芯片上运行软件的方案相比,专用硬件方案(如专用集成电路)单位操作上可提高能效10000倍。此能效的提升对于新兴的物联网的丰富应用是至关重要的。专用化已经在图形渲染和视频播放等方面取得了巨大成功。机器学习应用也开始取得商业成功。实际上,计算机体系结构领域的科研人员已经认识到专用化的重要性并投身其研究:2016年体系结构领域三大顶级会议(ISCA、HPCA、MICRO)共收录论文175篇,其中38篇是关于图形处理器(GPU)和专用加速器设计的,还有17篇是关于机器学习专用化设计的
返回列表