最近,英特尔宣布将在今年年底推出Xe-LP GPU,正式进入独显GPU市场,并将交与台积电进行代工。在不久前举行的2020年WWDC上,苹果也透露有可能弃用AMD的GPU,转而使用自研基于ARM架构的解决方案,将于明年推出自研GPU。GPU市场到底怎么了?为什么巨头们要纷纷入局?
海量数据呼唤高性能GPU
为什么最近这几年GPU的需求增长得如此的快速?因为我们正在进入一个“一切需要可视化的时代”。阿依瓦(北京)技术有限公司合伙人代淑玉对《中国电子报》记者表示,可视化需要大量的图形、图像计算能力,无论是云端还是边缘侧都需要大量的高性能图像处理能力。
阿依瓦(北京)技术公司是一家提供工业AR软件解决方案的企业,其许多客户来自制造业。现在的智能工厂很多场景需要GPU,她举了工业互联网场景例子,智能工厂中一个典型的应用场景是利用AI进行产线质量检测,目前在汽车产线、家电产线等很多生产线上都要采用AI视觉进行检测。“实时检测的大量数据不可能都传输到云端,这就要在生产现场安装高性能计算机、台式机,要求计算机必须有很强的GPU处理能力。一条产线至少用一颗GPU,一颗中档的GPU价格是几万元,高端的是一颗十几万元。”代淑玉说,另外数字工厂的可视化,涉及到3D渲染、音视频流传输、动态数据传输与挖掘分析,都对算力提出了更高要求。
GPU影响着“效果”和“颜值”,而今天世界很多地方都靠 “颜值”吃饭。天数智芯是一家做通用GPU(GPGPU)的中国创业公司,天数智芯首席科学家郑金山对《中国电子报》记者说:“其实GPU不是现在才热起来,它一直在发展,计算机/手机、专用的游戏主机中都有广泛应用。GPU是个人机中仅次于CPU的关键单元,除了三维游戏外,图形界面的二维加速都是GPU来完成的。而现代操作系统的图形界面也大量运用了三维技术,没有GPU的界面观感很差。现在的手机里面也集成了GPU,有些界面的效果也是要用它来加速的。”
除了在图像、图形处理上,GPU还有很强劲的计算能力,由于图形处理器强大的并行处理能力和可编程流水线,因此流处理器可以处理非图形数据,特别在面对单指令流多数据流(SIMD)的时候。数据处理的运算量远大于数据调度和传输的需要时,通用图形处理器在性能上就大大超越了传统的中央处理器应用程序,所以被大量的用在高性能计算和AI训练与分析上,其被称为GPGPU(通用图形处理器)。
GPU市场蓬勃增长
我们正在进入一个“并行计算”无处不在的世界,GPU强大的并行处理能力越来越有用武之地。中科院计算机网络信息中心副主任迟学斌在接受《中国电子报》记者采访时表示,我们正进入异构计算时代,并行计算正变得无处不在。这届全球高性能计算机TOP500排名第一的计算系统就采用了GPU+CPU的架构,这预示着GPU+CPU会成为趋势。
从各个调研机构的数据预测来看,GPU在AI推理市场、服务器市场、数据中心市场等都呈现出蓬勃增长的态势。富途证券预测,随着AI推理市场需求持续增长, 2020年全球AI推理的市场规模为180亿美元,预计到2025年将达660亿美元。国富证券预测,服务器对GPU的需求呈现快速增长的趋势。2020年全球服务器GPU需求约为970万个,预计到2025年增长到2500万个,平均年复合增长率约为10%。IDC预测,全球数据中心市场对GPU的需求呈现快速增长的趋势。2020年全球数据中心GPU市场规模为1370亿美元,预计到2023年,全球数据中心GPU市场规模将达2290亿美元。
从GPU的供应商来看,英伟达和AMD占领着全球GPU市场第一、第二的位置。在最近的5年里,英伟达股价飙升2268%,在今年7月8日收盘后,英伟达市值首次超过英特尔,一度成为美国市值最高的芯片企业。AMD公司的市值也同样一路飙升,在最近其市值也逼近了千亿美元的大关。
无论是客户需求还是市场数据,或是供应商的市值变化,都在证明一个事实——GPU的火正越烧越旺。
众厂商纷纷入场
GPU市场的红火吸引着更多厂商入局。
英特尔是入局者之一,英伟达与AMD这几年的快速飙升,GPU市场的快速增长,英特尔不可能看不到,所以从去年开始英特尔就不再强调自己是CPU厂商,而是XPU厂商,XPU囊括了CPU、GPU、NPU、VPU以及FPGA等。
在此之前,英特尔是有GPU的,但是GPU功能是集成在CPU中的,做的是集成显卡。“而集成在CPU中的GPU无法将性能做得很强,要想做得更强,面积就会变大、功耗也会变大。”分析师李秧在接受《中国电子报》记者采访时表示。在高性能计算、AI训练与分析等都无法采用集成显卡,随着5G的普及,自动驾驶的推进,AI的快速发展,数据量爆发式增长,做独立显卡推出独立GPU就成为了英特尔的必选。
两年前,英特尔宣布要推出独显GPU芯片,制定了针对单个GPU架构Xe的计划,该架构由三个不同的微架构组成:Xe-LP,Xe-HP和Xe-HPC。分别针对从超级移动设备到游戏机台式机,再到工作站和数据中心。在最近举行的英特尔2020年年度架构日上,英特尔用了大量的时间谈论其GPU架构计划。从英特尔的Xe-LP GPU架构可以看出,其准备为从数据中心、HPC、高端游戏机到笔记本等所有产品提供独立GPU,这意味着几乎所有运用到独显的市场,英特尔一个都不放过。而英特尔GPU的制造将交给台积电进行代工的消息也于最近传出,所以英特尔独显GPU面市的脚步越来越近。
另外一个对GPU市场跃跃欲试的企业是苹果。苹果在不久前举行的2020年WWDC上,透露有可能弃用AMD的GPU,转而使用自研基于ARM架构的解决方案。业界有消息称,苹果将在2021半年下半年配合Apple Silicon推出自研GPU芯片,该芯片代号为lifuka,采用台积电5纳米工艺,并将搭载于明年推出的iMaC中。
苹果的GPU原是从Imagination公司购买的授权,现在苹果希望自己设计GPU拥有更强的能力实现差异化。种种信息流出,进一步做实了苹果要自研GPU的消息。
GPU市场格局恐生变
英特尔与苹果的入局,必将对GPU市场的江湖格局带来影响。苹果研发GPU主要是“自给自足”,形成差异化优势,不会给供应商阵营带来巨大影响,而英特尔能否搅动整个GPU市场的格局就成为了看点。目前独显GPU市场几乎被英伟达与AMD包揽,那么英特尔的入局会让GPU的市场供应格局“变二为三”吗?
郑金山认为,GPU的难度在于:三维渲染本身是一个比较难的问题,特别是光影的实时渲染算法,对应的硬件需要设计加速器,并满足多种算法以及软件接口。而且历史上还有很多API也必须兼容,还需在性能上匹配多种游戏,整个要求都比较高。GPU目前已进入到光线追踪算法的实现上了,游戏产业要求永不停息的渲染更逼真、分辨率更高的产品。VR的市场起来,算法/算力需求又需进一步发展。
从目前英特尔给出的信息看,其Xe-LP将满足用户现代游戏的各种需求,包括光纤追踪和4K发烧级性能。有分析称,其有望与英伟达的Ampere系列显卡和AMD今年推出的RDNA2显卡一争高下。最高级别的Xe-HPC目前已确认将采用在美国能源部的百亿亿次超算Aurora上。英伟达创始人黄仁勋对于英特尔的入局曾表示:“英特尔终于认识到GPU的重要性了,欢迎来到GPU世界。”当初的GPU概念就是由英伟达提出来的,所以英伟达也不是”吃干饭的”,从蓝图到技术实现,英特尔能否如期交出满意答卷,还要看产品真正出来才知怎么样。
“竞争焦点除了硬件部分,还有整个游戏业界的软件生态,即具有出色用户体验的软件产品。”郑金山说。
李秧表达了同样的观点,他认为英伟达不仅仅是在硬件层面强,这些年其在游戏、图形处理厂商、学术机构、开发者等方面积累了大量的生态伙伴资源,从硬件到开发平台到合作伙伴生态建立的壁垒,这才是英特尔短期内难以逾越的沟壑。
新入局者尚待市场检验
关于软件、开发者和应用生态这一点,准备进入独立显示GPU市场的英特尔不可能没有想到,所以在不久前举行的架构日上,英特尔首席架构师Raja Koduri强调,英特尔的Xe架构Xe的主要设计思路有三点——软件先行、兼顾扩展、全新应用。Xe并非孤立的产品,而是会结合英特尔完整的硬件产品组合,以及统一的软件开发环境而协同设计。Raja多次强调,希望使用相同的软件栈、相同的微架构设计,实现多个Xe产品的快速扩展。
目前来看,Xe的主体架构基于Slice实现,最多有6个subSlice,共计高达96个EU(Execution Unit),能提供每周期1536次浮点运算。和英特尔的前一代集显相比,Xe-LP重新设计了自身的微架构。Xe作为一个全新的GPU产品系列,它的一个主要优化重点就在于软件系统的设计。
在架构日上,大家提出了很多针对GPU的问题,英特尔并没有全部解答。但无论如何,英特尔进入独显市场,并带来重新设计的架构,给这个市场带来了更多的选择和想象。其产品能力到底如何,还需要等待市场的检验。那么英特尔来了,那些一个GPU板块卖到一辆轿车价格的高端GPU会降价吗?这是众多网友们关心的重要问题,答案等产品量产之后见吧。