“我实在搞不明白。”在硅谷从事数据中心和硬件工作已有30年的安德鲁·韦(Andrew Wee)如是说。
让他如此困惑——甚至愤怒的“这件事”,是未来AI超级计算机所预测的庞大能耗,而这些超级计算机正被认为将推动人类迈向新的跃进。韦曾在苹果和Meta担任高级职位,如今是云服务提供商Cloudflare的硬件负责人。他认为,当前AI所需能源的增长速度——据世界经济论坛估计,到2030年每年增长50%——是无法持续的。
“我们必须找到技术解决方案、政策解决方案,乃至其他解决办法,共同应对这一问题。”他说。
为了实现这一目标,韦在Cloudflare的团队正测试一种激进的新型芯片,这款芯片来自2023年成立的一家初创公司Positron。该公司刚刚完成了一轮5160万美元的新融资。这种芯片在AI推理任务上——也就是AI根据用户输入生成响应的过程——比行业领先者英伟达的芯片更具能效优势。尽管在可预见的未来,英伟达的芯片仍将在AI训练阶段占据主导地位,但如果推理阶段的能效提升,可能为企业节省数百亿美元的成本和相应的能源开支。
如今,至少有十几家芯片初创企业正努力向云计算服务商销售为AI推理量身打造的芯片。此外,谷歌、亚马逊和微软也在投入巨资、持续多年打造自家的推理专用芯片,既用于内部AI系统,也面向外部客户提供云服务。
这些努力的激烈程度以及累积的投入规模表明,几乎每一家科技巨头——以及许多初创公司——都急于在不支付“英伟达税”的情况下,为消费者和企业提供AI服务。所谓“英伟达税”,是指英伟达约60%的硬件毛利率,也就是购买该公司硬件所需的溢价成本。
英伟达深知推理环节的重要性与AI能耗问题日益引发关注。公司高级总监迪昂·哈里斯(Dion Harris)表示,他负责向英伟达的主要客户推介最新AI硬件。他补充说,英伟达最新的Blackwell系统在推理任务上的能效,是上一代产品的25到30倍。
为了达成目标,那些新兴AI芯片制造商采取了反复奏效的策略:从头开始设计芯片,专为突然间变得至关重要的新型任务而打造。过去是图形处理成了热点,也正是英伟达从中发迹。之后人们才发现图形芯片可被用于AI任务,但从根本上说,它们并不完美适配AI。
Jonathan Ross 是芯片初创公司 Groq 的首席执行官,曾负责谷歌的AI芯片开发计划。他表示创立Groq(与Elon Musk的xAI聊天机器人无关)是因为他相信AI芯片有一种全然不同的设计方式——专门为当今的AI模型而生。
Groq声称,其芯片运行AI的速度远超英伟达顶级产品,所需功耗仅为英伟达的三分之一到六分之一。这归功于其独特设计,即将内存嵌入芯片之中,而非作为独立组件。虽然Groq芯片的具体性能受诸多因素影响,但其在推理成本方面优于英伟达的说法是可信的,分析机构SemiAnalysis的分析师、曾在惠普企业工作十年的乔丹·纳诺斯(Jordan Nanos)表示。
Positron 走的是另一条提高推理效率的路线。这家公司已向包括Cloudflare在内的客户交付了芯片,其设计理念是简化芯片功能,专注于更窄的任务范围,从而实现更快的运行速度。其最新融资轮由Valor Equity Partners、Atreides Management和DFJ Growth参投,使得总融资额达到7500万美元。
Positron的下一代系统将与英伟达下一代系统 Vera Rubin 竞争。Positron首席执行官米特什·阿格拉瓦尔(Mitesh Agrawal)表示,根据英伟达的产品路线图,Positron芯片的单位成本性能将是英伟达的两到三倍,单位电力性能将是其三到六倍。
英伟达的哈里斯回应称,许多竞争者宣称在推理性能上超越英伟达,但这往往忽视了客户在选择硬件时所考虑的各种因素。他指出,灵活性也很关键,尤其是随着新AI模型和新用例的不断涌现,企业对芯片的用途也在快速变化。“英伟达的客户未必会被那些适用于小众推理应用的芯片所打动。”他说。
Cloudflare对Positron芯片的初步测试结果令人鼓舞,足以让韦决定将其部署到公司数据中心进行更长期测试。他表示,bwin必赢官方授权平台只有另一家芯片初创企业曾达到过这个标准。“如果他们真能兑现其承诺的性能指标,我们会全力放开采购阀门,让他们在全球大规模部署。”他说。
韦认为,通过让AI硬件实现“商品化”,并让英伟达的客户能够转向更高效的系统,市场竞争的力量或许能改变AI未来能耗不断攀升的趋势。“现在整个行业都处于FOMO(错失恐惧)状态,但我相信,最终理性会赶上现实。”他说。
一个不变的真理是:计算行业的发展历史一再表明,每当硬件工程师找到更快、更高效的方法时,软件开发者和消费者总会迅速将所有性能提升用尽,甚至超额使用。
马克·洛迈耶(Mark Lohmeyer)是Google Cloud的AI与计算基础设施副总裁,他的团队既提供谷歌自研AI芯片,也提供英伟达芯片,服务对象包括谷歌自身和其云客户。他表示,随着消费者和企业采用更复杂、要求更高的AI模型,无论AI交付效率提升多少,整体需求的增长依然看不到尽头。与几乎所有AI巨头一样,谷歌也在努力探索激进的新型能源方案,以满足AI所需,包括核能与核聚变。
关键在于:虽然新芯片或许能帮助个别公司更高效地交付人工智能,但整个行业仍然会消耗越来越多的能源。正如 Anthropic 最近的一份报告指出的那样,这意味着能源生产,而不是数据中心和芯片,才是未来人工智能发展的真正瓶颈。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
证券之星估值分析提示机器人行业内竞争力的护城河良好,盈利能力一般,营收成长性较差,综合基本面各维度看,股价偏高。更多
以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备240019号。