英伟达的财报,再一次证明了其是这场 AI 浪潮中的 " 最大赢家 "。
北京时间 2 月 22 日,英伟达发布截至 2024 年 1 月 28 日的四季度业绩报告。公司季度营收创纪录,达到 221 亿美元,远超此前英伟达自己以及华尔街的预估,同比增长 265%。全年营收同样创下新高,达到 609 亿美元,同比增长 126%。对于未来,英伟达预计本季度营收将进一步走高至 240 亿美元。
有意思的是,在英伟达公布财报的同一天,英特尔首届 IFS 英特尔代工服务演讲活动也如期召开了,OpenAI CEO 山姆 · 奥特曼(Sam Altman)也出席了活动。英特尔 CEO 帕特 · 基辛格(Pat Gelsinger)宣布,Intel Foundry Services 改名 Intel Foundry,目标在 2030 年成为全球第二大半导体制造工厂。
OpenAI CEO 山姆 · 奥特曼(Sam Altman)
" 英伟达曾经是业界的邪恶博格人(《星际迷航》中半有机物半机械的生化人)," 追踪半导体产业的 Futurum 研究公司 CEO 丹尼尔 · 纽曼(Daniel Newman)对《美国媒体》表示," 如今公司们正在走到一起,以确保英伟达不会变得更加强大。"
奥特曼的芯片野心不再是都市传说,而这个野心标价 7 万亿美元,这个消息在本月被媒体披露,奥特曼本人也在社交媒体上表态。此外,本月还有另一则不同寻常的消息是,软银创始人孙正义正寻求高达 1000 亿美元资金,计划打造 AI 芯片巨头,与软银旗下芯片设计公司 Arm 形成互补,抗衡英伟达。Meta 的第二代自研 AI 芯片 Artemis 今年将投产,应用于数据中心的推理任务。
英特尔及 Arm、OpenAI、Meta恰代表着半导体行业、AI 初创企业、科技巨头三股势力。接二连三的 " 大计划 " 昭示着,各方在有朝一日终结英伟达 AI 领域 " 最强卖水人 " 地位上已经达成共识。或是分割蛋糕,或是摆脱依赖,三股势力研发 AI 芯片的心,前所未有的坚定,对英伟达与 " 皮衣教主 " 黄仁勋的围堵之势也正式形成。
英伟达是 ChatGPT 掀起的 AI 浪潮中最大的赢家,其 GPU 是目前应用最广的通用 AI 硬件计算平台。据富国银行的统计,英伟达在 AI 芯片领域占据了 98% 的市场份额。英伟达数据中心业务已经取代游戏业务,成为其核心支柱。
更直观的是英伟达飙升的市值。2022 年,英伟达本因 " 矿难 " 等因素股价连连下跌,市值一度跌至不足 3000 亿美元,但在年底 ChatGPT 上线后,其股价一路上升。目前,英伟达的市值高达 1.7 万亿美元,并在本月一度超越亚马逊、谷歌,短暂成为美股第三大公司。
但 " 最强卖水人 " 也忙不过来了。整个 2023 年,AI 领域深受芯片短缺之苦。去年 7 月底,微软甚至发出警告,称如果无法获得足够的 AI 芯片,数据中心服务可能会中断。同时,英伟达最新一代芯片 H100 一芯难求,在 eBay 上的价格甚至炒到了 4.5 万美元一张。
与此同时,AI 对算力的需求还在持续膨胀。2024 年一开年,OpenAI 再次放出王炸产品 Sora,谷歌则发布了多模态通用模型 Gemini1.5,突破 100 万个 tokens。算力,越发成为当前大模型领域的一大核心瓶颈。
那个卖水人的门前排起长长的队伍,有的顾客开始选择自己带水,有的对手已经起摊竞争。围堵黄仁勋成为一种必然,但能否成功尚不可知——不断推高的股价和飘红的业绩报告都在表明,英伟达更强了。
英伟达这次的业绩报告,几乎无懈可击。
除了 2024 财年第四季度营收创新纪录之外,以业务来看,其数据中心营收达到创纪录的 184 亿美元,同比增长 409%,去年同期该数字仅为 36 亿美元。游戏业务营收 28 亿美元,与上一季度持平,但同比增长 56%。此外,英伟达该季度净利润也表现亮眼,达到 123 亿美元,同比增长 769%。
以全年来看,2024 财年(对应 2023 年 1 月后的一年),全年营收 609 亿美元,同比增长 126%。
英伟达业绩好并不意外,实际上市场本就期待其 " 远超预期 "。高盛称其是目前 " 地球上最重要的股票 ",财经博主 Fanancial Berg 在社交媒体上开玩笑:" 如果英伟达今天没有超出盈利预期,地球会爆炸。" 公布财报前夕,英伟达甚至迎来了股价下跌,盘中跌幅一度达到 6.7%,收跌 4.35%。
黄仁勋
不过,英伟达顶住了压力。财报发布后,其股价盘后一度涨超 10%。
" 加速计算和生成式人工智能已经达到了引爆点," 黄仁勋说," 全球各地的企业、行业和国家需求都在激增。"
英伟达表示,用于大语言模型和生成式人工智能应用训练与推理的 Hopper GPU 出货量增加,有益于数据中心业绩上升,大型云计算供应商占本季度数据中心收入的一半以上。
尽管供应链在改善,但其仍然难以满足市场对英伟达芯片不断飙升的需求。黄仁勋在电话会议上对分析师表示,在提高产量的同时,该公司无法在短期内 " 合理地 " 满足市场需求。
" 增长面临的最大问题是,供应仍将受到多大限制,以及随着时间的推移,需求会是什么样子。" 咨询公司 Creative Strageties 的 CEO 本 · 巴贾林(Ben Bajarin)表示。
在英伟达飘红的业绩之外,各方对黄仁勋已经近乎形成 " 合围 "。
在半导体公司中,英特尔和 AMD 早已吹响进攻号角。
AMD 已经在去年推出 MI300 AI 加速器系列产品,并声称其推理性能优于英伟达 H100。到了 2024 年,AMD 进一步将 AI 处理器的销售预期提高 15 亿美元,达到 35 亿美元。一直在人工智能领域落后的英特尔也加快了脚步,去年举办 "AI 无处不在 " 发布会,宣布推出一系列新品,其中 Gaudi3 AI 加速器将在 2024 年上市。而最新的 " 英特尔代工服务 ",则是其作为上游企业深入 AI 芯片的新意图。
进攻姿态是不加掩饰的。AMD CEO 苏姿丰(Lisa Su)在去年 10 月接受采访时表示:" 在市场发展如此之快时,我不相信有护城河的存在。" 英特尔 CEO 基辛格说得更加直白:" 整个行业都在被推动来减少 CUDA(英伟达推出的运算平台)的市场。"
孙正义的加入则有特别的意义。美国媒体披露,孙正义正在寻求 1000 亿美元,创立一家 AI 芯片企业,旨在挑战英伟达。该 AI 芯片项目暂定名为 Izanagi,在日本神话中寓意创造与生命之神。
孙正义的意愿很强烈。孙正义对人工智能已经关注多年,但远景基金败北、Arm 业绩不佳,其一度隐居幕后。AI 浪潮让其重燃信心,2023 年 6 月,孙正义重回台前,用 34 页的 PPT 高调宣布软银开启 " 进攻模式 ":" 现在该是换挡的时候了,人工智能革命的奇点即将到来。未来 10 年,人工智能会改变世界,软银要成为人工智能领域的领导者,且软银已经准备了充足的弹药。"
Arm 的定位在芯片行业中非常独特,Arm 与英伟达并非横向竞争关系。英伟达、AMD、英特尔最终都是通过卖芯片赚钱,但 Arm 的收入来自 IP 授权。2020 年英伟达欲以 400 亿美元收购 Arm,被定性为 " 纵向收购 ",即产业链上下游企业之间的并购行为。
从目前的报道来看,孙正义下一步想做的和 Arm 的授权模式不同。背靠软银、以千亿美元启动、聚焦 AI 芯片。从纵到横,和黄仁勋 " 哥俩好 " 的孙正义终于要与其坐下来掰手腕了。
孙正义
与此同时,初创芯片企业也十分活跃。The information 估计,全球目前有超过 18 家用于 AI 大模型训练和推理的芯片设计初创公司,融资总额超过 60 亿美元,企业整体估值共计超过 250 亿美元,背后的投资方包括红杉资本、OpenAI、字节跳动、五源资本等。
从 AMD、英特尔等吹响号角,到 Arm 背后的孙正义与软银加入战局,初创企业摩拳擦掌,半导体行业添了许多变数。
那边竞争对手开始争当卖水人,这厢口渴的买水人也开始挖井取水——研发大模型的科技公司或开始或加快 AI 芯片自研的脚步。
在 ChatGPT 爆火之初,黄仁勋的超前眼光成为佳话。一个广为流传的故事是,2016 年,黄仁勋亲自到访 OpenAI 总部,将 " 全球第一台 AI 超算捐给了 OpenAI"。
全球第一台 AI 超算— DGX-1
研发 AI 大模型的科技企业和提供 " 燃料 " 的英伟达,原本是互相成就的合作关系。但如今,这种关系变得微妙起来。
科技巨头因入局 AI 较早,又在资金和人才方面有优势,对 AI 芯片的自研也早已开展。但随着 ChatGPT 后的 AI 浪潮,科技巨头明显加快了自研脚步。谷歌自 2016 年就推出了 AI 处理器,即张量处理单元 TPU,如今已经更新到第五代。亚马逊向 AWS 客户提供 AWS Trainium、AWS Inferentia 芯片,去年亚马逊又最新发布了两款 AI 芯片 Trainium2 和 Graviton4。Meta 自 2020 年就开始了自研芯片的设计,前不久,英国媒体报道称 Meta 计划今年就投产第二代自研 AI 芯片 Artemis。
就连一直在自研 AI 芯片上按兵不动的微软也已经出击。去年年底,微软发布其首款用于云端训练和推理的 AI 芯片 Azure Maia 100,将首先支持微软自己的 AI 应用程序。就在英伟达本次财报发布的两天前,The Information 传出消息,微软正在开发一款新的网卡,入局 DPU(数据处理单元),其产品将类似于英伟达的 ConnectX-7 卡,可以提高 Maia AI 芯片的性能。
OpenAI 庞大的芯片野心,则是将 " 取代英伟达 " 写在了脸上。OpenAI CEO 奥特曼想要自研芯片的消息已经流传很久,2 月也得到了证实。奥特曼在 X(原推特)上表示:" 我们相信,世界需要的 AI 基础设施——晶圆厂产能、能源、数据中心等——比人们目前计划建造的还要多。"
据报道,奥特曼正在推动一个旨在提高全球芯片制造能力的项目,并在与包括阿联酋政府在内的不同投资者进行谈判。而这个项目的标价(奥特曼正在寻求的资金),高达 5 万亿至 7 万亿美元。
7 万亿美元也许不够直观:这个数字是 7 后面加 12 个 0;去年全球半导体芯片市场规模不过 5270 亿美元。黄仁勋听闻这个消息,笑称 7 万亿足以买下 " 所有 GPU"。有人戏称这个价格足以买下 4 个英伟达。
这个数字引发了舆论哗然,如果说此前科技公司自研芯片还属于自己挖点地下水的程度,那奥特曼则是想要做到建立一个新的全球输水网络。
芯片短缺,成本高筑,是 " 围堵黄仁勋 " 的原始动力。在英伟达业绩飘红,股价市值节节高的另一面,是科技公司痛恨的 " 英伟达依赖症 "。
据数据分析公司 Omdia 估计,英伟达在 2023 年第三季度仅凭其旗舰 H100 加速器,就售出了超过 50 万个 GPU,其中微软和 Meta 是其最大的客户,分别购买了 30 万和 15 万个 H100 芯片。
初创企业则更 " 惨 ",A16Z 的投资人 Stephaie 称,许多 AI 初创企业将其筹集的总资本的 80% 以上用于计算资源。
反过来以成本节约的角度看,SemiAnalysis 创始人 DylanPatel 估计,如果 Meta 自研 AI 芯片今年部署成功,预计每年可以省下数亿美元的能源成本和数十亿美元芯片采购成本。
而就目前来看,AI 热潮没有降温的趋势,算力需求依旧在膨胀。
2024 年刚到 2 月,谷歌发布的 Gemini 1.5,最高可支持 100 万 token 的超长上下文。OpenAI 则公布了文本转视频产品 Sora,超高质量的演示视频让这款产品尚未公开测试就已引爆网络。不论是 Sora 还是 Gemini1.5,都仍然遵循 Scaling Law 缩放定律,参数量扩大、模型性能提升,同时,对于推理端算力的需求也会进一步上升。相比于训练端,这种需求的成本可能是 5 倍、10 倍甚至更高。
可以想见,在目前已经受制于算力限制的科技公司,对于未来大模型的发展若抱有乐观预期,则解决 " 英伟达依赖症 " 也会愈发迫切。
但 " 自研芯片 " 并不是一条简单的路,涉及芯片设计、制造、封装、测试等多个环节,需要巨大的投入和长时间的试错。
这是一场豪赌,而失败而归的案例时有发生。离我们比较近的 2023 年,OPPO 终止旗下已经投资上百亿的芯片设计公司哲库科技(ZEKU)的业务,星纪魅族传出 " 终止自研 AR/VR 芯片业务 "。此外,Meta 也在去年传出自研 AR 芯片遇阻、增加对高通的依赖的消息。
从设计到最终生产出产品,芯片的产业链冗长而复杂,想要生产出性能上乘的芯片需要集中细分领域的领头企业。而目前,英伟达仍然手握供应链优势。通过承诺不可取消的订单,如上百亿美元的采购承诺、产能义务和库存义务,英伟达占据了台积电近六成产能和 SK 海力士、三星、美光 HBM 的大部分供应。而就连英伟达自己,其芯片短缺也主要受累于生产环节,主要涉及台积电的先进制程和封装产能,特别是 CoWos 封装。
这实际上也是奥特曼没有将野心限制在 " 自研芯片 " 这个 " 小目标 " 上,而是着眼供应链搭建的原因。
此外,自研芯片需要人才支撑,而半导体行业的人才缺口远远无法满足奥特曼们的野心。据德勤预测,2030 年全球半导体行业潜在劳动力缺口将达 100 万人。
在积极部署自研芯片的背面,即便是积极部署自研 AI 芯片的科技巨头,现阶段也在扩大与英伟达的合作。Meta 宣布今年投产第二代自研 AI 芯片之前,还宣布了另一个消息:扎克伯格宣布要建立一个 " 大规模计算基础设施 ",到 2024 年底将包括近 60 万个 GPU 储备,其中有 35 万张英伟达 H100 显卡,以售价保守估计这项支出就将高达 90 亿美元。
亚马逊也扩大了和英伟达的合作。2023 年 11 月,身着皮衣的黄仁勋现身亚马逊云科技 AWS 的 re:Invent 大会上,双方宣布扩大战略合作,正设计世界上最快 GPU 推动的云 AI 超级计算机,配置超过 1.6 万颗英伟达 GH200 超级芯片,以及构建更多基于英伟达芯片的云实例等,提高生成式 AI、HPC 高性能计算性能。
与此同时,英伟达也在积极防守。
一手更快地推出新品,据 servethehome 披露的英伟达数据中心产品路线图,英伟达将在未来两年推出 12 款 GPU。
另一手则试图缩短产品交付周期。台积电从 2023 年第二季度开始大规模扩增 CoWos 产能,这也是英伟达芯片生产的主要 " 卡点 "。近期,瑞银(UBS)最新报告显示,英伟达大幅缩短了 AI GPU 的交付周期,从去年底的 8~11 个月,缩短到了现在的 3~4 个月。
" 围堵黄仁勋 " 之势已经形成,但短期内,科技公司还难以摆脱 " 英伟达依赖症 "。那个卖水人只是被围住了,但摊位前长龙依旧。
热点 博物馆 微信公众号 拖鞋 网友 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-07-23
科技热搜 工资 行业 资产 北京 家庭 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-12-07
娱乐热点 张柏芝 造型 长裙 紧身 气质 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-09-23
科技热搜 绥化 大庆 高速公路 卫星 中国铁建 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-06
娱乐热点 明星 横店 罗志祥 圈外人 指向性 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-02-21
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13