苹果在谷歌芯片上训练AI，打响抛弃英伟达GPU第一枪？

2024-07-31 05:57 来源：尚腻网点击：

苹果在谷歌芯片上训练AI，打响抛弃英伟达GPU第一枪？

美东时间 7 月 29 日，苹果公司发布 iPhone AI 的首个预览版，随后发布论文，称其人工智能模型是在谷歌的 TPU（张量处理单元）上训练的。论文中介绍了为支持 Apple Intelligence 功能而开发的基础语言模型，包括一个设计用于在设备上高效运行的约 30 亿参数模型和一个基于私有云计算的云侧大模型。

苹果基础模型的建模概述苹果官方发布论文

苹果发布的论文称，他们在 8192 块 TPU v4 芯片上训练云侧 AFM（Apple Foundation Model），使用 4096 的序列长度和 4096 个序列的批量大小，进行了 6.3 万亿 token 训练。端侧 AFM 在 2048 块 TPU v5p 芯片上进行训练。

苹果的决定表明，一些大型科技公司在人工智能训练方面可能正在寻找英伟达图形处理单元的替代品。

一些芯片行业媒体称，这是苹果打响了抛弃英伟达 GPU 的第一枪。

今年 6 月初，日本证券公司瑞穗证券估计，英伟达控制着用于训练和部署 OpenAI 的 GPT 等模型的 AI 芯片市场的 70% 至 95%。一些专家将英伟达在 AI 芯片市场的地位描述为护城河，其旗舰 AI 图形处理单元 GPU（例如 H100）与该公司的 CUDA 软件相结合，使其在竞争中占据了先机。

包括谷歌、Meta、甲骨文和特斯拉在内的科技公司一直在努力构建自己的人工智能系统和产品。

心智观察所研究员潘攻愚指出，苹果宣布其 Apple Foundation Model（AFM）在谷歌自主开发的 Tensor 处理单元（TPU）进行训练，而且还租用了谷歌的云服务。苹果在 AI 训练方面的权衡折射出了英伟达通用型 AI 加速器和谷歌的 ASIC 定制化 AI 服务体系的竞争升级。

谷歌自 2015 年以来一直在使用自主设计的 TPU 来训练和部署 AI 模型。不是设计通用处理器，而是将其设计为专门用于神经网络工作负载的矩阵处理器，在整个大量计算和数据传递过程中，根本不需要访问内存。

今年 5 月，谷歌宣布推出了人工智能（AI）数据中心芯片 Trillium，据称该芯片的速度相比之前的版本提升了几乎 5 倍。该公司表示，这款芯片将用于开发自己的模型，包括 Gemini 和 Imagen。

谷歌称，如果提前三年预订，最新的 TPU 每小时使用成本不到 2 美元。谷歌于 2015 年首次推出 TPU 用于内部工作负载，并于 2017 年向公众开放。它们现在是专为人工智能设计的最成熟的定制芯片之一。

尽管如此，谷歌仍是英伟达最大的客户之一。它使用英伟达的 GPU 和自己的 TPU 来训练 AI 系统，并且还在其云端出售英伟达技术的访问权限。

" 虽然英伟达目前控制着高达 80% 份额的高端 AI 芯片市场，但剩余市场份额大多被大型云服务供应商如谷歌、微软、亚马逊占据。这一次苹果采用的谷歌 TPUv5 虽然在通用性上较英伟达同生态位芯片逊色，但主打一个性价比，综合总成本（TCO）要低英伟达四倍，而且拿货周期短。目前谷歌 TPUv5 所在的市场大约有 300 亿美元，英伟达一直觊觎这块‘肥肉’，但考虑到和谷歌微妙的竞合关系，英伟达目前还不会贸然大举进入 ASIC 领域。" 潘攻愚分析称。

Meta 首席执行官马克 · 扎克伯格和 Alphabet 首席执行官桑达尔 · 皮查伊上周均发表评论称，他们的公司和业内其他公司可能在 AI 基础设施上投资过度，但他们也承认，不这样做的商业风险太高。一旦落后，将无法掌握未来 10 到 15 年最重要的技术。

本文系观察者网独家稿件，未经授权，不得转载。