一系列接二连三的大事件,为英特尔,英伟达,AMD三大巨头围绕数字时代异构计算CPU+GPU+FPGA/DPU的竞争提供了更多想象空间,也成为未来划分的新注解。 ...
一系列接二连三的大事件,为英特尔,英伟达,AMD三大巨头围绕数字时代异构计算CPU+GPU+FPGA/DPU的竞争提供了更多想象空间,也成为未来划分的新注解。
英特尔在独立GPU领域卷土重来,在IPU领域也在不断创新伴随着硬件,软件,架构和工艺的创新,以及IDM2.0战略的实施,英特尔正全力以赴打造大后方
AMD收购Xilinx尘埃落定后,弥补了FPGA的短板不久前,AMD宣布以约19亿美元收购云服务提供商Pensando至此,AMD正式进入DPU领域,构成了其数据中心蓝图的关键一环英伟达虽然被迫放手收购Arm,但已经有了基于Arm的CPU作为重要供给,并通过收购补上了DPU,希望在异构时代大显身手
三巨头已经深入腹地,英特尔,英伟达,AMD之间的竞争呈现出全面开战的态势。
GPU争夺重启
在异构计算领域,GPU可以说是必须依赖的弹药。
作为异构时代和新兴应用驱动下的最大受益者之一,伴随着服务器,汽车,人工智能,边缘计算等领域对计算能力和AI性能的需求日益增加,GPU凭借其在并行处理和通用计算方面的优势取得长足发展,市场持续高速增长
根据验证市场研究的数据,2020年全球GPU市场价值254.1亿美元,预计2027年将达到1853.1亿美元,年均增长率为32.82%。
目前,GPU广泛应用于PC,游戏,数据中心,高性能计算,智能汽车等领域值得注意的是,游戏和PC是其传统主战场,而数据中心,高性能计算和智能汽车将成为GPU增长的新引擎,不同的应用对GPU有不同的需求
根据消息显示,该游戏主机的设计思路以提升体验为主,侧重于开发者对CPU,GPU等硬件的优化和底层API等软件的优化PC的GPU需要在性能,可扩展性和能效上取得平衡主要有集成GPU和独立GPU两种集成的GPU大多已经与CPU集成到SoC中,而独立的GPU大多使用PCIe总线与CPU进行实时通信从高性能计算和服务器的角度来看,GPU对大数据量的快速吞吐,超级稳定,长期运行等有着严格的要求汽车GPU需要满足AEC—Q100等车规认证的要求,支持专用的图形API,未来的趋势是汽车CPU和GPU组成SoC,从分布式向集中式发展
经过多年的厮杀,全球GPU处于寡头垄断状态,Nvidia是绝对霸主,AMD紧随其后,但在英特尔重返独立GPU战场后,原有的平衡将被打破。
通过技术创新,场景拓展,外延并购,以及基于CUDA软件栈对GPU通用计算能力的不断探索,Nvidia已经成为GPU领域的领导者,引领全球GPU发展2022财年,英伟达营收达到创纪录的269.1亿美元,同比增长61%
翻阅英伟达的营收结构可以发现,受益于对英伟达安培架构产品的强劲需求,游戏成为最大动力,数据中心市场增速最快,达到106.1亿美元的新高,汽车业务虽然有所下滑,但未来仍将持续盈利其接下来的布局也是火力全开:新一代桌面GPU和笔记本GPU已经上线,下一代GPU Hopper GH100芯片用于数据中心或超过1400亿个晶体管,并将采用TSMC的5nm节点多芯片模块设计而下一代自动驾驶芯片Orin计划在2022年量产,计算能力将达到254TOPS目前已拿下蔚来,理想,沃尔沃,奔驰等多个OEM项目
经过近几年的高速发展,AMD在CPU和GPU市场已经确立了第二的地位在GPU布局方面,AMD将在2022年以新的顶级,中端和入门级GPU进一步拓展显卡市场,同时搭载新的AMD软件支持在数据中心领域,AMD也很激进不久前,它发布了基于GPU架构的Instinct MI200加速卡,专门用于HPC和AI加速采用第二代CDNA架构,是首款多芯片,首款支持128GB HBM2E内存的GPU,首款ExascaleGPU同时,推出了一种面向数据中心的新型GPU,即下一代镭龙Pro V620,旨在满足云应用和3D工作负载对GPU加速不断增长的需求
在PC等集成GPU领域占据领先地位的英特尔,自几年前宣布重返独立GPU战场以来,动作犀利,精益求精2020年底,英特尔在其架构日首次推出Xe GPU架构Xe微体系结构可以满足从集成/入门级显卡到数据中心和高性能计算的各种需求同时,英特尔发布了旗下首款数据中心服务器GPU,完成了CPU+GPU+FPGA混合XPU架构的全面构建
2021年架构日,英特尔推出两款独立GPU在不久前举行的投资日上,英特尔发布了两款分别面向游戏领域和数据中心的GPU紧接着,英特尔宣布代号为ATS—M的数据中心GPU将于第三季度发布它集成了多个Xe内核,AV1硬件编码器,GDDR6存储器,光线跟踪单元等,并且每秒可以提供150万亿次运算再者,英特尔在传统PC领域志在必得,分别推出了面向笔记本电脑平台的Arc睿轩系列显卡和首款面向桌面的A3系列显卡——睿轩A380 GPU而且不仅仅是A380,英特尔性能更高的A5系列和A7系列也将在今年夏天上市
在硝烟弥漫的GPU领域,火力全开的英特尔将全方位挑战AMD和Nvidia。
异构计算近距离作战
直接导致英特尔,英伟达,AMD三大巨头的异构拼图已经成型。
在这三大巨头中,显然英特尔的异构组合更为深厚五年来,以数据为中心转型为目标的英特尔通过并购不断丰富在数据中心领域的布局,包括收购优质FPGA,eASIC和ASIC公司,以及研发独立的GPU,IPU,神经拟态芯片和量子计算芯片,以及统一编程软件工具oneAPI,为包括CPU,GPU,FPGA和其他加速器在内的异构计算提供统一简化的应用开发编程模型
此外,近期IDM2.0战略的扩张,以及高调开放x86,加入RISC—V阵营等一系列动作,让英特尔在异构时代握有诸多王牌,更加游刃有余。
从AMD的角度来看,其业务长期集中在CPU和GPU两个核心领域,FPGA是其最大的短板但AMD宣布通过全股份交易完成对Xilinx的收购后,凭借Xilinx在FPGA,可编程SoC,ACAP等领域的深厚积累,为AMD提供了水平云和边缘计算的实力,补充了营养AMD与Xilinx的合并,不仅能提高其整体数据中心业务竞争力,还能在数据中心异构时代获得更多筹码
Pensando被AMD攻占后,意味着AMD不仅正式切入DPU领域,而且使AMD的业务完全覆盖CPU,GPU,FPGA和DPU,构建了一个基本完整的计算能力拼图。
GPU一统江湖的英伟达,为了完成其GPU+CPU+DPU路线,先是高调宣布收购Arm,后又斥资69亿美元收购以色列网络设备供应商Mellanox,为DPU供货虽然最终不出意外收购了Arm halberd,但其在CPU开发方面已经投入巨资,并在2021年的GTC大会上正式推出了一款面向数据中心AI和高性能计算应用的自研CPU——基于Arm Neoverse架构的Grace芯片根据协议,英伟达获得了ARM近20年的架构授权未来可以通过ARM授权IP开发ARM架构CPU
对于英威达来说,Grace CPU的研发意义深远由于GPU需要配合CPU运算,此举将使其不再局限于CPU,而CPU的自力更生也将使其异构集成更加重要
面对全面较量,三大巨头也各有隐忧。
业内人士分析,AMD仍需时间消化整合GPU+CPU+DPU+FPGA,拓展为云,企业,边缘客户提供领先解决方案的能力,英伟达所依赖的GPU,未来在数据中心加速领域可能面临ASIC的蚕食,英特尔仍然是一家基因属于CPU的公司,对GPU的投入需要与CPU的增长相匹配,所以处理好CPU与GPU的发展冲突将是一个巨大的挑战此外,在IDM2.0的指挥棒下,投资的重心不可避免地向先进制造业倾斜,如何平衡各大xpu投入的创新和整合资源也需要仔细权衡
需要指出的是,伴随着小芯片UCIe协议的确定,设计规模可以增加数倍,比如CPU,GPU,DPU可以并行扩展n倍,或者实现垂直集成,CPU+GPU+DPU可以组合成一个超级异构的单芯片,或者成对组合。
因此,如何让不同的系统并行,如何高效,自适应地交互,将是巨头们面临的全新挑战谁能在这方面占得先机,未来就放大了胜方
影响模式的关键因素
重新换装之后,三大巨头的对决也将火力全开。
除了对xPU+的架构创新,生态构建,执行力的不断考验,不得不说,工艺和包装是将创意变成实用产品的关键。
我们来谈谈流程和相关的生产力因素。
CPU,GPU,DPU和FPGA是先进技术的先驱要想和所有高手一较高下,采用最先进的技术才是王道
最近,有报道称TSMC在3纳米工艺产量方面存在困难如果3nm良率问题持续存在,很多客户可能会延长5nm工艺节点的使用时间,从而影响AMD,Intel,Nvidia等客户的芯片出货量
这使得产能不足导致的供应瓶颈成为他们面临的障碍之一正如英伟达在发布财报时所说,鉴于全球芯片和晶圆产能的短缺,未来供应受限仍将是劣势据报道,英伟达已于2021年第三季度向TSMC预付了约16.4亿美元,并将于2022年第一季度支付17.9亿美元整个长期订单的预付款将达到69亿美元,远高于他们之前支付的价格
与英伟达和AMD相比,英特尔的优势在于其正在发展的OEM业务目前,虽然英特尔技术在代工方面还没有突破5nm,但根据其技术路线图,2025年将与TSMC代工水平接轨或许,到时候,英特尔完全可以支持其先进的工艺设计,在x86,Arm,RISC—V的异构集成中更加得心应手,在产能保障上优先供货其IDM 2.0战略背后的深意可能比想象的更深刻
另外,异构计算绕不过去的是异构集成和高级封装异构集成和先进封装技术的进步,使得在单一封装中构建复杂系统成为可能,可以快速满足异构计算系统中芯片对功耗,体积和性能的要求
在高级封装层面,似乎英特尔作为传统的IDM更有优势,而AMD本来就是IDM,后来剥离了芯片制造业务不过公司还是有制造工艺和包装的基因在过去的几年中,AMD因为其小芯片和互连技术率先推向市场而占据了领先地位在此基础上,该公司推出了新一代封装技术,即3D stacked V—Cache在这方面,Xilinx也可以帮助AMD,因为Xilinx为其自适应FPGA平台构建了一系列高性能封装和互连技术
对于NVIDIA来说,作为一家纯粹的无晶圆厂公司,在异构集成工艺和封装上略逊于Intel和AMD,不仅在高性能应用上更依赖合作伙伴,在工艺和封装上也是如此。
相比之下,英特尔在很多方面齐头并进,在Co—EMIB,UCIe,Foveros等方面不断进步特别是在3D封装部分,Intel推出了Foveros Direct,实现了向直接铜对铜键合的过渡通过使用HBI技术,可以实现10微米以下的凸点间距,不同芯片之间的互连密度可以提高10倍以上不久前,超级计算机开发的顶级加速卡Ponte Vecchio拥有超过1000亿个集成晶体管,使用五种不同的制造工艺在内部封装了多达47个不同的单元,成为3D堆叠封装技术和使用Foveros的Co—EMIB连接技术的大师
根据咨询公司Yole Developpement的数据,2021年半导体制造商在先进封装领域的资本支出约为119亿美元该机构称,2021年高级包装市场规模约为27.4亿美元,预计到2027年,该市场将实现19%的复合年增长率,届时高级包装市场规模将达到每年78.7亿美元
从这个角度来看,未来的竞争也将在架构创新,技术,包装等方面如火如荼在这些方面,三大巨头可能需要覆盖方方面面