AMD苏妈为AI PC划重点

类别:名企新闻  出处:网络整理  发布于:2024-03-25 10:48:30 | 242 次阅读

  AMD AI PC创新峰会在北京举行。作为AI PC元年全球半导体圈首场以此为主题的活动,AMD展示了自己与合作伙伴在AI PC领域取得的进展:现有30款新的AI PC产品;首次将NPU芯片集成在了台式机处理器中,其算力达到39TOPS;十多种全球和中国开源LLM在设备上运行,超过20个LLM的参数规模在20亿以上,达到720亿……
  AMD董事会主席兼执行官苏姿丰现身峰会现场,并为面向下一代人工智能设备的计算引擎划定了战略重点。

  合适的计算引擎 

   在2个小时的活动上,不论是介绍企业战略的苏姿丰,还是介绍AMD技术路线的AMD GPU技术与工程研发副总裁David Wang(王启尚),都强调了一个词:合适。

  苏姿丰在演讲中提到,当你看到我们的人工智能硬件产品组合和软件功能时,我们会讨论很多,关键是要为每个市场提供合适的解决方案。
  “我们实际上更关注AI PC,这是一个全新的设备类别,我看到的是将PC转变为智能和个性化的设备的能力。”苏姿丰说道。
  对于适合AI PC的处理器,David Wang对其再做分类:Zen、RDNA 、XDNA。他介绍,Zen架构主要是用于通用处理和AI推理,RDNA主要是用于游戏和基于AI的内容开发,而XDNA用于低功耗的AI推理。
  在针对上述三种架构的介绍中,用于NPU的XDNA架构给记者留下的印象为深刻。David Wang介绍,XDNA的Adaptive dataflow(自适应数据流)架构解决了深层次AI面临的主要挑战:带宽有限、内存消耗大和高功耗。“我们通过自适应互联,将深度的神经网络映射到Custom dataflow(自定义数据流)上。这样就可以减少对于外部内存的访问,从而提高性能和能效。”David Wang介绍,“这就是XDNA能够在电池供应的AI PC上提供AI性能的原因。”
  David Wang还介绍了XDNA架构的另外一个主要的优势——special partitioning(空间分区架构)。他说,该架构能够支持多重任务处理,而不会影响服务的品质。他在现场展示了一个:设备上同时执行了深度的预测、眼睛注视的矫正、超分辨率和场景的检测四个AI工作负载。每个空间分区执行一个负载,上述四个应用程序可在互不影响性能的情况下保持服务质量。
  NPU的采用,还大大降低了CPU和GPU的工作负载。AMD现场展示了本地文生图、文生文、图生图几项生成式人工智能的应用。现场结果显示,上述几项应用执行过程中,CPU和GPU的负载极低,CPU负荷不超过8%。
  David Wang还介绍了Zen4和RDNA两个架构。Zen4采用了AVX-512指令集,以更节能的方式来加速AI推理。从而实现了Int8推理方面的性能提升85%。同时,Zen4还支持BF16,可提供两倍于FP32的性能,同时能够保持与FP32相同的动态范围 (BF16和FP32均为大模型的精度,分别为用16位二进制来表示的浮点数和用32位二进制来表示的浮点数)。这样让开发者能够很便捷地把FP32的模型转换成BF16的模型。
  RDNA架构更适用于高性能游戏场景。相较于RDNA2,RDNA3将AI加速器的数量增加了一倍,提供了高达2.3倍的峰值AI性能提升。相比于RDNA2,RDNA3提供了超过1.5倍的每瓦性能和1.8倍的光追性能,使整体的游戏性能提升了1.4倍。
关键词:AMD

全年征稿 / 资讯合作

稿件以电子文档的形式交稿,欢迎大家砸稿过来哦!

联系邮箱:3342987809@qq.com

版权与免责声明

凡本网注明“出处:维库电子市场网”的所有作品,版权均属于维库电子市场网,转载请必须注明维库电子市场网,https://www.dzsc.com,违反者本网将追究相关法律责任。

本网转载并注明自其它出处的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品出处,并自负版权等法律责任。

如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

热点排行

广告