您的位置 首页 新闻

英伟达挑战者?专访Graphcore总裁、大中华区总经理卢涛:IPU的稀疏性要强于GPU丨WAIC 2023

7月6日至7月8日,2023世界人工智能大会上海市区举行。7月6日在下午,Graphcore(中文名字“拟未”)首席总裁、大中华地区经理卢涛接受《每日经济新…

7月6日至7月8日,2023世界人工智能大会上海市区举行。7月6日在下午,Graphcore(中文名字“拟未”)首席总裁、大中华地区经理卢涛接受《每日经济新闻》记者专访。

这届交流会评出九大“镇馆之宝”,拟未“Graphcore C600 IPUCpuPCIe卡”就位列其中。据了解,Graphcore C600 IPUCpuPCIe卡主推逻辑推理,兼职做练习,能够支持各种各样热门的AI运用,在搜索和推荐等业务中具有一定优点。他在给予低延迟、高吞吐量的前提下不损害精密度,协助AI开发者处理“准确度与速率难两全”的难题。

Graphcore首席总裁、大中华地区经理卢涛

图片出处:被访者供图

值得一提的是,C600在提供强有力的算率、便捷性和协调能力的前提下,还完成了低延迟和低能耗,在运转典型性工作负载后的散热设计功能损耗为185瓦,可以为运维团队降低数据中心运营支出。

IPU与GPU有什么差别?

现阶段,业内广泛使用英伟达显卡的GPGPU做为算率处理芯片,拟未的IPU和英伟达显卡的GPGPU对比,有什么差别呢?

卢涛表明:“先从设计构思上,就跟(英伟达显卡)挺不一样的。一是测算架构设计不一样,二是存储架构不一样。我们都是结合了十分好几个核的Cpu,例如C600,每一个IPU具备1472个解决关键,可以串行运作8832个独立程序进程。而英伟达显卡GPU的SM Core(stream multiprocessor关键)应该是100好几个,不一样产品架构不一样。其所谓CUDA Core和Tensor Core其实就是放在SM上边的网络加速器、运算器。CUDA Core只是一个运算单元。”

图片出处:每经新闻记者 朱成祥 摄

存储架构层面,卢涛表明:“不论是英伟达显卡的GPU,或是谷歌的TPU,全是二级运行内存。一级是(表明)处理芯片里面有一个四五十兆的运行内存,外边挂在HBM或是显卡内存。大家IPU,在处理器里边就会有900兆的上面SRAM存放,而且是分布式的。以前我们说的1472个解决关键,跟片上SRAM存放是藕合在一起的。”

IPU这类架构设计有什么优势呢?卢涛称:“测算(关键)跟存放藕合,特别适合做稀疏化,及其做一些高维空间计算。跟GPU比照,如果对于稀疏性要求很高、高维空间层面要求很高,公司的优势会非常大。假如是矩阵计算,大家基本就可以或者优点小一些。”

软件生态:兼容问题CUDA,为用户提供更优解

从以上详细介绍来说,C600是主推逻辑推理,兼职做练习。那样拟未自身的芯片商品,广泛应用于练习端或是用以逻辑推理端呢?

卢涛表明:“我们都是练习、逻辑推理一体的,只不过是对于系统软件方面会有不一样的规定。例如练习,需做大规模拓展。如练习集群式,必须一千个或是好几千个Cpu连接在一起。逻辑推理不用那样大规模互连。练习和逻辑推理,大家Cpu本来就没有比较大的差别,大量是以系统软件方面反映。”

值得一提的是,英伟达显卡不但强在硬件,其软件生态CUDA更加是无法取代。那样,拟未的IPU能适配CUDA吗?

卢涛表明:“大家兼容问题CUDA,这是一个非常有意思的问题,归属于哲学思想方面的难题。假如你是顾客,了解是不是CUDA适配,实质是要不用一切时间,或是花极少的时间精力,把手机软件、把运用在Cpu上使用下去。”

他进一步分析称:“这里边就会有2个出题,一是CUDA适配,但CUDA是英伟达显卡自已的软件生态,就是针对英伟达显卡GPU架构设计达到的。API你可以看获得,但最底层各种各样提升,主要是针对其GPU系统架构改善的,压根就不知道怎样。二是CUDA兼容问题,这个时候就需要尽量避免顾客转移成本,让顾客在特殊情况下,不要做什么就可转移,或是花较少的任务量就可转移。”

封面图由来:被访者供图

</div


责编 梁枭

本文来自网络,不代表热点新闻立场,转载请注明出处:http://www.redianxinwen.cn/4454.html

作者: admin

为您推荐

发表评论

邮箱地址不会被公开。 必填项已用*标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: 2562541511@qq.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部