当前位置:首页 > 财经聚焦 > 5.17世界电信日|高通万卫星:将AI理念贯穿整颗SoC设计

5.17世界电信日|高通万卫星:将AI理念贯穿整颗SoC设计

2024年05月17日57928

5.17世界电信日|高通万卫星:将AI理念贯穿整颗SoC设计
图片来源于网络,如有侵权,请联系删除

  新华网北京5月17日电(记者凌纪伟)随着AI向终端下沉,端侧AI让智能变得触手可及。怎样看待端侧AI发展趋势,端侧AI在“人人可享的AI未来”愿景中为何发挥关键作用?新华网就此专访高通公司AI产品技术中国区负责人万卫星。

5.17世界电信日|高通万卫星:将AI理念贯穿整颗SoC设计
图片来源于网络,如有侵权,请联系删除

  生成式AI的应用越来越多地在各种终端侧落地,AI端侧化的趋势得到从芯片厂商、OEM厂商、ODM厂商到上层应用厂商的认同。

5.17世界电信日|高通万卫星:将AI理念贯穿整颗SoC设计
图片来源于网络,如有侵权,请联系删除

  万卫星认为,与云端相比,端侧AI优势非常明显。除了成本优势,在隐私保护、更加个性化的用户体验以及随时享受AI等方面也独具优势。生成式AI在端侧部署给工作生活带来巨大变革,这是为什么只有让生成式AI部署在端侧,才能帮助生成式AI用例规模化扩展的重要原因所在。

  AI向边缘下沉,对终端侧芯片、软件提出非常大的挑战。看似简单的AI图像识别、语音唤醒、“计算摄影”等等这些用例,其实对芯片的算力、DDR带宽都有非常强的需求,很难设计一种硬件IP(处理器),能够满足所有的这些应用。

  “从我们的角度来讲,对于突发性的实时任务,我们会使用通用硬件加速单元,包括CPU和GPU,来对这种用例做加速;而对于持续型且需要高算力的应用,比如拍照、录像和生成式AI,我们会建议运行在我们的高算力、低功耗的NPU处理器上。如果大家对骁龙平台有所了解,我们还有一个超低功耗的传感器中枢,它特别适用于一些需要始终在线(always-on)的用例场景。”万卫星总结说,高通会利用在芯片上的优势,利用处理器的技术专长,设计出一个完整的异构计算系统,这个异构计算系统会把所有的处理器都囊括进去,针对不同的用例,采用不同的处理器组件做加速,从而提升用户体验。高通在设计的一开始就将AI的理念贯穿到整颗SoC。

  在2023年骁龙峰会上,高通展示了一个利用异构计算做加速的用例,这是一个非常典型的能够充分挖掘高通骁龙平台上异构计算算力的场景。

  “我们当时展示的用例,是一个与虚拟人进行采访或者对话的场景,其中就涉及了很多技术。首先,我们需要有一个语音处理模块,把语音信号转换成文本信号,这可以在CPU或者超低功耗的传感器中枢(Sensor Hub)上运行。接下来,我们需要利用大模型,生成对话输出文本,这可以在NPU上运行。然后,如果要完成语音对话的流程,我们还需要一个模块来把文字重新转换成语音,这可以用CPU或者GPU来做加速。最后,为了使双方互相看见对方,我们需要一个渲染引擎,将双方的形象在同一个场景里渲染出来,这个可以利用GPU进行加速。”万卫星介绍说。

  近期,高通发布了《通过NPU和异构计算开启终端侧生成式AI》白皮书。在这份白皮书中,高通介绍了他们如何利用NPU和异构计算,实现丰富的终端侧生成式AI用例。总的来看,利用多种处理器进行异构计算,特别是NPU的表现,对于实现生成式AI应用最佳性能和能效至关重要。

  万卫星认为,为了适配AI用例的多样性和终端的多样性,需要有这样一个异构计算系统,把各种处理器硬件加速单元,包括通用的CPU、GPU处理器,专用的NPU处理器,以及超低功耗的传感器中枢,都集成到白皮书提到的这个异构计算系统框架里。

  生成式AI对NPU以及整个终端侧硬件芯片及软件带来非常大的挑战,高通具体是如何通过芯片设计、软件等满足这些用例的多样性的?

  万卫星举例说,高通拥有一系列技术来应对大模型对DDR带宽的挑战,比如各种各样的量化技术、压缩技术,这些技术最主要的目的就是减少模型大小;针对大模型对算力的要求高,高通在NPU上做了非常专业的设计,比如专门针对底层的Transformer模块进行了加速,提出微切片技术专门针对DDR利用率做了优化,在架构上对硬件进行了升级。

  除了硬件之外,高通在软件方面也做了大量工作。“我们之前推出了高通AI Stack,即高通AI软件栈产品,会在软件层面上兼容、支持目前高通异构计算系统里面所有的处理器组件。也就是说,用户可以非常方便地根据他们用例的具体需求,利用AI Stack接口来调用底层不同的处理器进行加速。高通AI Stack在一个模型从研究到优化到最后真正完成端侧部署这个完整链条上的各个节点,都提供了对应的工具,方便开发者和合作伙伴能够通过AI Stack做模型的开发、优化、部署工作等等。”万卫星介绍说。

  在万卫星看来,相较于云端,端侧模型更倾向于专注于特定领域的小模型,旨在解决一些具体的问题,不需要特别强大的泛化能力或者通用能力。“未来,越来越多的用例和模型将向端侧迁移,从模型大小的角度来讲,迁往端侧的模型也将越来越大。”据万卫星介绍,高通去年成功支持了百亿参数(10B)的模型, 采用了INT4量化技术,从内存占用角度10B参数可以简单理解为相当于大概5G内存,未来,我们大概率能看到更大、更强的模型迁移到端侧。

  谈到未来的产品形态,万卫星认为,未来的端侧产品应支持多模态,以便让用户体验能够更贴近真实的物理世界。此外,未来的产品可能不是简单地用来处理一些专注于特定领域的场景任务,而应具备AGI功能,“只有成为AGI,才能够真正地让我们的生活、工作、娱乐发生革命性变化,而不仅仅是一个简单的助手。我愿意将其称为类似于‘分身’的产品。”

【责任编辑:周靖杰】
    阅读下一篇:

              扫描二维码推送至手机访问。

              版权声明:本文由发布,如需转载请注明出处。

              “5.17世界电信日|高通万卫星:将AI理念贯穿整颗SoC设计” 的相关文章

              2024中国餐饮加盟TOP100发布 新上榜品牌数增长超30%

              2024中国餐饮加盟TOP100发布 新上榜品牌数增长超30%

                4月8日,中国连锁经营协会(简称CCFA)联合美团于上海正式发布“2024中国餐饮加盟品牌TOP100”(下称“餐饮加盟TOP100”),榜单覆盖小吃快餐、休闲饮品、火锅烧烤等六大餐饮品类。图片来源于网络,如有侵权,请联系删除  2024年“餐饮加盟TOP100”在经营消费大数据的基础上,从品牌...

              美国将六家中企列入管制清单是典型经济胁迫单边主义霸凌

              美国将六家中企列入管制清单是典型经济胁迫单边主义霸凌

                针对美国近期将六家中国企业列入出口管制“实体清单”,商务部新闻发言人何亚东11日在例行新闻发布会上回应称,中方注意到有关情况。一段时间以来,美方以所谓涉俄、涉军等为由,接连将中国企业列入出口管制“实体清单”。美方泛化国家安全概念,滥用出口管制措施,对中国企业肆意实施单边制裁和“长臂管辖”。这是典...

              新研究首次直接“看见”维格纳晶体

              新研究首次直接“看见”维格纳晶体

                新华社北京4月18日电 维格纳晶体是一种完全由电子组成的奇特晶体。美国普林斯顿大学等机构的研究人员近日报告说,他们首次实现了对双层石墨烯薄片中的维格纳晶体的直接成像。这是迄今最清晰的维格纳晶体成像,对推动量子材料等领域的发展具有重要意义。图片来源于网络,如有侵权,请联系删除  美籍匈牙利裔物理学...

              美联储“鹰声鹤唳”:“鹰王”放话年内不降息 两大票委谈及加息!

              美联储“鹰声鹤唳”:“鹰王”放话年内不降息 两大票委谈及加息!

                鉴于美国降通胀进展缓慢且崎岖,且美国经济依然强劲,越来越多美联储官员开始对外释放类似的信号:现在还不急于降息。图片来源于网络,如有侵权,请联系删除   美东时间周四,多位美联储官员放出更为明确的信号,这也令市场越来越担忧未来降息前景。   美联储多位官员接连放鹰   美东时间周四,美联储“...

              北京加速突破人工智能算力数据瓶颈

              北京加速突破人工智能算力数据瓶颈

                新华社北京4月26日电(记者陈旭)多个千亿参数基座大模型发布,AIGC技术快速演进,全模拟光电智能计算芯片……在25日2024中关村论坛年会开幕式上,十项重大科技成果揭开面纱,其中人工智能相关成果数量占近一半。图片来源于网络,如有侵权,请联系删除  北京作为国内人工智能综合实力最强的城市,人工智...

              BOE(京东方)ADS Pro专场技术策源地论坛举办 聚焦行业领先技术共研显示新未来

              BOE(京东方)ADS Pro专场技术策源地论坛举办 聚焦行业领先技术共研显示新未来

                4月28日,作为中关村论坛系列活动之一,“BOE技术策源地系列活动│ADS Pro专题”举办。论坛以“引领ADS Pro技术创新,共创显示产业未来”为主题,邀请科技企业、科研机构产学研专家、生态合作伙伴及众多主流媒体齐聚一堂,不断深化合作、协同共建创新平台。这是继去年发布三大技术策源地,举办氧化...