新的英特尔加速器为巨大的新AI模型铺平了道路

导读英特尔揭开了第二代高迪加速器的面纱,这可以显着减少训练大规模人工智能模型所需的时间。Gaudi2处理器在达拉斯的IntelVision2022上发布,...

英特尔揭开了第二代高迪加速器的面纱,这可以显着减少训练大规模人工智能模型所需的时间。Gaudi2处理器在达拉斯的IntelVision2022上发布,采用7nm工艺制造,具有24个集成100GbERoCE端口,并拥有市场上所有加速器中最大的内存量(96GBHBM2e)。

新处理器是总部位于以色列的HabanaLabs的产品,该实验室早在2019年就被英特尔吸收,专为专用于深度学习工作负载的服务器而设计。

近年来,出现了许多大规模的自然语言处理(NLP)和计算机视觉模型,其性能远远优于各自学科以前的条目。

问题在于,训练这些数十亿参数模型的计算量非常大,因此既昂贵又耗时,是该技术发展的一个限制因素。

然而,英特尔表示,借助新的Gaudi2加速器,开发复杂的新AI模型所需的成本和时间都将大大降低。

Habana首席运营官EltanMedina表示,性价比是客户的关键因素,因此在第二代加速器的开发过程中被优先考虑。

在IntelVisions上展示的基准表明,与Nvidia的A100GPU相比,Gaudi2处理器在流行的NLP和视觉工作负载(BERT和Restnet-50)中提供大约2倍的训练吞吐量。

同时,与A100GPU相比,据说新的Gaudi芯片可以在两种工作负载类型中节省大约40%的成本。

“英特尔正在通过Habana加速器推进AI和数据中心客户的价值,这是专用于深度学习的服务器的最佳解决方案,”Medina说。“我们相信这个类别将非常重要。”

Gaudi2处理器立即可供客户使用,并且还可能支持AWS的云实例,与上一代一样。

版权声明:本文由用户上传,如有侵权请联系删除!