来源:视觉中国
作者丨叶蓁
编辑丨康晓
出品丨深网·腾讯新闻小满工作室
“中国有很多GPU的初创公司,不要低估中国在芯片领域的追赶能力。”5月,在台北国际电脑展期间的一场媒体圆桌会议上,英伟达CEO黄仁勋表示。
自ChatGPT爆火之后,AI大模型的研发层出不穷,不同种类ChatGPT的AI大模型相继推出。目前,除了ChatGPT一骑绝尘,整个AI大模型赛道还看不出胜出者,反而是美国芯片公司NVIDIA(英伟达)赚得盆满钵满。
2023年年初至今,凭借GPU(图形处理器,也被称为显卡)领域的布局,英伟达股价已飙升170%,而在其发布Q1财报后短短一周,股价飙升超过 25%。5月底,英伟达股价一度创下419.38美元的历史新高,成为全球第一家市值超过万亿美元的芯片企业。
由于美国相关禁令,英伟达无法向国内企业销售部分高性能GPU产品,黄仁勋认为,无论有任何规定,英伟达都会绝对遵守,但是中国也会利用这一机会来培育本土企业。
云岫资本《2023中国半导体投资深度分析与展望》显示,国内GPU的市场在扩大,但国产化率仍不到10%。英伟达2023财年财报显示,英伟达收入为269.74亿美金,在中国市场实现营收57.85亿美元,在整体全球市场营收中的占比高达21.4%。
英伟达已封神,中国GPU初创企业面对差距,如何破局?
“目前还没有能和A100媲美的产品”
GPU从90年底起步,经历了早期的创业潮到现如今的寡头垄断——英伟达和AMD。英伟达在国内的市场占有率从2008年的不到50%上涨到2022年的90%以上。
“国内的一些大模型创业公司,训练的算力,市面上买不到英伟达A100或者H100,要么就是国外的算力卡。受禁令影响,英伟达又针对中国市场推出A800和H800,但非常难买到,市场上需求量也很大。”一位大模型创业公司人士告诉《深网》。
国产GPU公司主要有两大方向,一是面向图形处理的GPU芯片,包括芯动科技、摩尔线程、景嘉微等;另一类是面向通用计算的GPGPU(数据中心主要用 GPU 做 AI 计算和高性能计算,不需要图像能力)芯片,厂商包括壁仞科技、沐曦、燧原科技等。
一款GPU要经历设计、验证、流片、回片后的功能和性能测试、送往客户测试、根据反馈进行软硬件调优、获取订单并交付工厂大规模生产的流程。进入2020年,一些国产GPU公司正式流片。
芯动科技在2021年的11月和2022年的8月,先后发布了“风华1号”4K级多路服务器GPU和“风华2号”4K级四屏桌面GPU。其成立于2006年,在计算、存储、连接等三大核心领域都有深厚的技术积累,在高速接口IP和芯片定制领域属于有影响力的企业,连续十多年都实现了盈利,在2020 年转向 GPU领域。
2022年1月,沐曦集成首款采用7nm工艺的异构GPU产品已正式流片。2022年8,壁仞科技发布了首款通用GPU芯片BR100。摩尔线程在研发14个月后,于2022年3月末发布第一代产品,同年11月,摩尔线程推出了基于其自研MUSA架构的多功能GPU芯片MT-春晓,以及国潮显卡MTT S80、面向服务器的MTT S3000加速卡。
但流片对国产GPU公司来讲,只是万里长征走完了其中的一部分。
“目前国产GPU的性能还没有能和A100和H100、或者A800或者H800相媲美的产品。国产一些GPU公司也做出了在算力上达到了A100或者达到H100算力水平的产品,但纸面算力和实际应用中的有效算力是两码事。”芯动科技GPU资深架构师殷亚云告诉《深网》。
从市场的角度看,英伟达芯片的数量也很难支撑现在国内那么多的公司来做大模型。王小川在4月宣布创业时表示,北京已有20-30家大模型创业公司。紧接着,商汤、第四范式、科大讯飞等公司相继推出大模型。
大模型创业潮也直接带动了芯片价格的上涨。A100价格也从2022年12月开始上涨,目前每片芯片售价超过1.5万美元。据《深网》了解,英伟达针对中国市场推出的特供版GPU芯片——A800,其每秒数据传输速率只有A100的三分之二,但其价格也已经涨到10万元。
这些都为英伟达的硬件业务创造了海量订单。据5月24日英伟2023财年第一季度财报,其收入达到71.92亿美元,同比增长84%,净利润为27.13亿美元,同比增长109%。其中,数据中心业务收入为42.8亿美元,同比增长79%,环比增长18%,创下历史新高。
国产替代下国产GPU的机会
“我们做芯片投资比较早,早些年我们并不太看GPU、CPU这种比较大的数字芯片,因为那时还是一个全球化的市场,国内的产品很难去替代国外的产品。”芯片领域资深投资人Bob告诉《深网》。
在过去的十多年里,中国有过院校、国资主导的芯片投资和创业,多集中在蓝牙、WiFi 芯片、MP3 主控芯片等领域。而在GPU领域,分为传统国产GPU,代表是景嘉微、中船重工709所、中船重工716所等,二是以芯动科技、摩尔线程、壁仞科技、沐曦为代表的GPU新势力。
2020 年 5 月后,随着美国对华为禁令升级,本来最有希望的海思 GPU 尚未流片就陷入停滞。国产替代的大背景下,GPU领域的创业公司的创业机会变得明朗起来。
国产GPU公司感受到了资本的热情。从2020年开始,GPU便成为国内芯片领域“最吸金”的赛道之一,融资总额已超过200亿元。据统计,仅2020—2021年,通用GPU领域就有近20起融资事件发生。
2020 年 6 到 8 月,刚刚成立半年的壁仞科技密集披露了 3 轮大额融资,投资方包括启明创投、IDG、高瓴、华登国际、中芯聚源等。壁仞密集融资的那一时期,英伟达中国区前负责人张建中创立摩尔线程,AMD 中国前图形研发高级总监陈维良创立沐曦。
GPU新势力的融资速度堪称光速,摩尔成立不到 100 天,于 2021 年 2 月获得了数十亿元的 Pre-A 轮融资。截止2021年年底,这三家主要的 GPU 创业公司合计融资约 100 亿元人民币,其中壁仞融资超过 47 亿元;壁仞、摩尔的估值逼近 200 亿元。
一些成立更早的GPU公司也在这一时期获得了融资。2017 年成立的登临科技,在 2020 年宣布获得天使轮融资。
毋庸置疑,资本在GPU领域的热情与国产替代相关,毕竟有投资机构已经在半导体领域跑了出来。2018和2019年的中美贸易战,整个全球化的市场被撕裂,芯片领域的国产替代成为刚需,一些芯片投资人看到了机会。
“元禾璞华就做得很成功,当时元禾璞华出手投了一批有规模的上市公司。”芯片投资人Bob透露。
但同时,“部分GPU企业通过大量融资,催生了大量的泡沫,给投资人以极高的期待,疯狂烧投资人的钱,甚至用投资人的钱来补贴销售,形成负毛利的产品,制造巨大的财务风险,这是需要非常警惕。”一位芯片领域不愿具名的投资人告诉《深网》,“这种状况如果持续下去,如果不尊重GPU产品规律,不能实现产品的正向销售形成正向毛利,想要用击鼓传花的方式通过资本来催肥,这样的企业一定是会暴雷的。”
“赶上A100/H100或要五到十年”
“从芯片设计的角度,国内跟国外仍然有较大的差距,但差距没有想象中那么大。”芯动科技GPU资深架构师殷亚云告诉《深网》,包括图形显卡GPU和不带图形的GPGPU,并不存在特别大的技术门槛跨不过去的状况,难的是,应用生态和架构迭代,从而提升兼容性和有效算力。”
为什么国产GUP未来几年内很难赶上英伟达?
“英伟达的竞争力在CUDA架构,CUDA供应链在整个行业里面的渗透率都比较高。”云岫资本芯片投资人严家呈告诉《深网》。
2006年,英伟达推出了 CUDA(Compute Unified Device Architecture,一种并行计算统一计算架构),CUDA的出现,成就了现如今英伟达的市值巅峰。
目前,CUDA 拥有超过 400 万开发人员,超过 3000 个应用程序,历史上 CUDA 下载量达到 4000 万,仅在前一年就达到了2500 万。此外,已有 15000 家初创公司建立在英伟达的平台上,全球有 40000 家大型企业正在使用加速计算。
现如今,CUDA 已成为一种 AI 基础设施。对国内GPU公司来说,追赶英伟达难以逾越的是软件壁垒。
在CUDA之前,英伟达的GPU只在屏幕上负责图像渲染设计。而CUDA不仅可以调用GPU计算,还可以调用GPU硬件加速,让GPU拥有了解决复杂计算问题的能力;此外,CUDA不需要复杂的编程和调优,可以帮助客户为不同的任务对处理器进行编程。
CUDA降低了GPU的使用难度。除了常见的PC机,无人车、机器人和VR头盔等多种热门的设备都有GPU;而CUDA推出后很长一段时间内,只有英伟达的GPU能快速处理各种复杂的AI任务。
GPU 与 CUDA 相结合已经改变了 AI 行业的游戏规则。如今,许多深度学习框架,包括 Caffe2、Chainer、Keras、MATLAB、MXNet、PyTorch、Theano和 Torch,都依赖 CUDA 提供 GPU 支持。
CUDA是在英伟达的软硬件基础上诞生的,受很强的专利保护,对国内的GPU公司来说,显然短期内不可能建立起一个软件生态,有些GPU公司选择的路径是在编译器、数据库层与 CUDA 做兼容,但实际的兼容效果并不尽如人意。
“没有大量应用,国产GPU生态无从谈起。生态是应用出来的,国内有足够多的GPU场景应用,只要我们瞄准细分的应用领域,坚持商用路线,一个领域一个领域地去攻,我们一定可以产生国产GPU生态。”殷亚云认为。
“国产GPU公司要追赶上A100或者H100,未来5年内是比较难的,未来10年内肯定有机会,未来15年肯定追得上。”一位GPU从业者告诉《深网》,“至少国内的企业在奋起直追,也有一定的后发优势,只有踏踏实实去做,总会缩短和最先进水平的差距。”
“大模型需求创造市场机遇”
中国 GPU 市场,大客户是互联网大厂,然后是自动驾驶公司和三大运营商等。
市场上一份流传的“阿里AI专家交流纪要”显示:阿里云至少有上万片的A100,整体能达到10万片。阿里云今年芯片采购量约1万枚,其中6000枚是H800;百度年初下单3000台 8卡的A800服务器,共2.4万张卡,预计全年百度会有A800和H800共5万枚的需求。
“对互联网大厂来说,稳定性肯定是第一位的,他们也会少量采购国产GPU芯片。”一位芯片投资领域人士告诉《深网》。
据称,阿里云也会采购国产芯片,例如寒武纪MLU370,性能是A100的60-70%。今年阿里云对寒武纪MLU370的采购量大约在2000张,主要用于CV(计算机视觉)等领域小模型的训练或推理上。
此外,大部分企业采购GPU时更看重的是使用体验,市场仍需要国产GPU公司去开拓。
“我曾跟国内的一家比较大的手机厂商交流过,从品牌来讲,他们本身就不如苹果和华为,如果手机的芯片再换成国产芯片,就更拼不过其竞争对手了。”芯片领域的投资人李晨告诉《深网》。
“国产GPU在设计制造维度没问题,因为缺乏下游大客户的支持,导致进步非常缓慢。”投资人Bob告诉《深网》。对国产GPU新势力来讲,其成立之初,都是想对标英伟达的,现在看来路还比较漫长。
但这并不意味着国产GPU毫无机会。
“我们已经在在测试一款国产GPU,即使性能上稍微弱点,但价格比英伟达优惠太多了。”一家云游戏公司人士告诉《深网》。
GPU领域从业者张思远认为,目前国产GPU领域比较优秀的两家公司是芯动科技和摩尔线程,他们的策略略有不同。芯动科技更侧重在云端等相对固定的场景,去迭代技术和生态,产品成熟后再逐步扩大应用场景。而摩尔线程看起来更侧重游戏显卡场景。
“例如,已有17年历史的芯动科技拥有全套高速接口IP, 以及先进工艺SoC体系架构和GPU内核创新能力,目前全球有近百家客户,授权逾80亿颗高端SoC芯片进入规模量产,成功率100%。”张思远认为,做GPU, 芯动像英伟达一样具备全套自研IP和深厚积累,迭代GPU的成本优势明显。目前风华GPU已经进入批量商用。
“有一件事情是确定的,就是未来5-10年,我们国产GPU的增速相比于过去5-10年,增速一定是更快的。一是GPU这块已经有自己的产品了,二是训练AI大模型的A800和H800也缺货,国内的大模型训练缺基础设施,这个动力会一直驱动着。”投资人严家呈表示。
对于关键的GPU生态而言,国家的产业政策上可能会去做一些扶持,精英创业者都会想着在这个领域如何发力,这对国产GPU公司来说,去打造自己的生态会是一个非常有利的因素,而产业联动自然会带动国产GPU生态的发展。
中国是全球GPU第二大应用市场,正如黄仁勋在演讲中提到的,“在中国如今如果你想跨入芯片产业创业,你会选择进入哪个方向?GPU正是可能的选择”。对于国产GPU企业来说,需要长期的技术积累,通过不断地应用迭代,实现规模商用,坚持十年坐冷板凳的精神,才有实现突破的希望。
科技热搜 芯片 gpu usb-c techweb 长焦 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-10-08
科技热搜 华为 手机中国 雷蒙 芯片 社交平台 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-09-04
科技热搜 芯片 siri homepod 库克 神经网络 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-10-04
科技热搜 华为 芯片 余承东 华为mate 雷蒙 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-09-29
科技热搜 it之家 mipi 芯片 amd 锐龙7 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-07
热门新闻 2023-07-05
热门新闻 2023-06-14
国内新闻 2023-04-21
热门新闻 2023-07-23
热门新闻 2023-07-23
热门新闻 2023-07-23
热门新闻 2023-07-23
热门新闻 2023-07-23
热门新闻 2023-07-23
热门新闻 2023-07-23