在日前于计算器器学会(ACM)举办的国际实体设计会议(ISPD)上,一位专题演讲的主讲人表示,实时的机器学习(machine learning)典范正在改写芯片设计的决策架构,进一步为微芯片的实体设计减少许多人为因素。
IEEE暨英特尔(Intel)平行运算实验室院士Pradeep Dubey在ISPD专题演讲上发表「追求终极学习机器」(Quest for the Ultimate Learning Machine)时提到,认知计算机将取代许多人为因素。
Dubey说:「传统上,机器负责运算数字,而人类则在芯片的实体设计上做决定。 但是,机器现在可以同时做到这两部份,而使运算提升至一个全新的领域。 」
以往将决策工作交给计算机的任务——即基于规则而定的人工智能(AI),如今无法再持续进行了,因为每一位专家都有自己的风格,而无法达成一套最佳的原则。 然而,当今的认知计算机能够执行与人类决策行为有关的四个步骤,即感知、推理、行动、适应并重复,直到达成优化设计。
然而,当今基于神经网络的深度学习认知计算机能够执行这四个步骤中的每一步,尽管每一步骤中都存在延迟。 据Dubey表示,我们今天的任务是提高每个步骤的速度,直到实现实时作业,让认知计算机能接管微芯片实体设计中的人为因素。
根据Dubey的说法,最大的障碍在于感测和推理步骤期间的深度学习。 为了克服英特尔为其Xeon处理器系列添加新款Lake Crest的挑战,利用了去年收购Nervana Systems取得的硬件神经网络。 Dubey强调,Lake Crest将使深度学习能够实时呈现用于生产十亿闸芯片的巨量数据(Big Data)组合。
另一方面,赛灵思(Xilinx)资深副总裁兼技术长Ivo Bolsens表示,只需使用现场可编程门阵列(FPGA)就能达完成同样的任务。 (当然,英特尔也因为在2015年收购Altera而拥有FPGA技术)。 然而,Bolsens声称,FPGA可以加速深度学习的脚步,最终实现让SoC的每一部份都是硬件可配置的「全可编程平台」(all programmable platform)。
Bolsens表示:「FPGA的最大优势在于具有丰富的互连。 而且,FPGA还拥有大量的全局内存与数据流架构,可有效地搭配机器学习运作。 」
Bolsens还声称,截至目前为止,FPGA比起其他任何类型的芯片更能有效利用摩尔定律(Moore’s Law),FPGA目前可实现多达13层的可编程互连,因而能让任何闸之间彼此交流。 此外,28nm可说是FPGA的最佳选择,因为这一节点时的每闸成本(cost-per-gate)达到最小化——毕竟随着FPGA用于越来越小的几何尺寸,其成本也相对提高中。 在相同的封装中使用多个芯片,能够达到以每秒150Gbps的短距离互连,在系统级封装(SiP)中达到1Gbps。 |