“大力出奇迹”，20万卡练出马斯克口中“最聪明的AI”

Grok 3，马斯克口中“最聪明的AI”来了！ 2月18日中午12时许，马斯克（Elon Musk）的AI公司xAI研发的新一代AI基座大模型Grok 3正式发布。耗费了20万张GPU的Grok 3显示，“卷算力”目前仍是核心。

Grok 3的三个亮点

据马斯克团队介绍，Grok 3模型和Grok 3 mini（Reasoning，精简版）在数学推理、科学逻辑推理和代码写作等能力表现方面超越了所有主流模型，包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。

同时，具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning则是超越了类似的推理模型，包括DeepSeek-R1和OpenAI的o3 mini等。

发布会上，马斯克提及，Grok 3的推理模型还支持一项名为DeepSearch搜索引擎新功能的应用。Deep Search通过扫描互联网和X平台上的信息进行分析，并生成摘要以回答用户提出的问题，在这一过程中还可以“推测用户的真正意图”，在经过交叉比对不同信息来源后，确保能向用户返回正确的信息。

快思慢想研究院院长、原商汤智能产业研究院创始院长田丰在接受澎湃科技采访时表示，从发布会上的内容看，Grok3有三个亮点：一是通过缩放定律Scaling Law显著提升模型性能，二是数学与编程等逻辑推理能力大幅增强，三是融入智能体产品化设计。

澎湃科技注意到，曾担任OpenAI创始团队、斯坦福博士，训练大型深度神经网络的工程师Andrej Karpathy，分享了其用户体验。

Andrej 称，在今天早上大约使用了两个小时的过程中，他感受到，Grok3加上深度思考（Thinking）模式的能力略好于DeepSeek-R1和Gemini2.0 Flash Thinking。这是相当令人难以相信的，不过，现在模型给出的答案是随机的，每次可能会给出略有不同的答案，现在还处于早期阶段，在接下来的时间，还需要更多的评估。

模型将进入“神仙打架”

“不过这场大语言模型（LLM）模型领域的竞赛令人非常兴奋！”Andrej 说。

伴随人工智能快速迭代，模型的领先优势的“保质期”越来越短，此前有业内人士向澎湃科技表示，“不超过100天，就会有新的模型出现，并超越。”

快思慢想研究院院长、原商汤智能产业研究院创始院长田丰在接受澎湃科技采访时也表示，接下来将进入神仙打架阶段，“Grok3‘PK’DeepSeek V3，马上就会有人来‘PK’Grok 3，也许是GPT4.5”。根据此前OpenAI对外公布的信息，GPT4.5的发布日期已经列入日程。

另有观点认为，目前的大模型行业，训练还未卷完，范式已经统一。

目前Grok3并未开放给普通用户使用，实际推理效果还要使用产品后看，目前看起来基准测试是达到GPT-o1水平的模型，但还不确定实际效果，推理能力的最佳呈现是数学和代码。马斯克在这次直播中主要展现了Grok3的数学计算和代码的能力。

卷算力目前是核心

值得一提的是，在DeepSeek开启了低成本训练模型的风潮后，Grok 3却是花了重金。Groks 3短时间内反超之前的SOTA模型（state-of-the-art model指在该项研究任务中，目前最好/最先进的模型），说明“卷算力”目前仍是核心。

在此次发布会上，马斯克透露，Grok 3的计算能力是Grok 2的10倍以上，Grok 3训练过程累计消耗20万张英伟达GPU，计算资源的显著提升帮助Grok 3能更高效地处理大型数据集，缩短了模型训练时间也提高了准确性。有分析称，Grok 3算力消耗是Deepseek V3的263倍。

据xAI团队透露，Grok 2模型使用了2400亿参数规模，性能媲美GPT-4，为了训练Grok 3，xAI团队也将数据中心容量翻倍。

马斯克团队在发布会上表示，“早在去年4月，马斯克就决定创建我们自己的数据中心。我们大约在四个月内建立了数据中心，并花了122天时间，让10万个GPU启动并运行，这是一项艰巨的工作。我们相信这是同类中最大的全连接的H100集群。但我们并没有止步于此。”

“我们每天都在不断改进模型。”马斯克称，目前，Grok 3测试版现已面向马斯克的社交媒体平台X Premium用户推出。

田丰认为，Grok 3采用的还是“大力出奇迹”的模式，因其使用了20万块英伟达GPU卡训练而成，是典型的“又好又贵”。从数据来看，Grok 3的推理能力远远超过前一代的Grok 2模型。“xAI基础设施的建设能力全球领先，相比于10万块卡用了120多天，最新的20万块GPU集群只用了92天完成施工搭建，且利用率应该很高，值得中国算力供应链借鉴。”田丰补充说。

商业化布局更进一步

与DeepSeek相比，Grok 3最大的短板在于它并非开源模型，且需要付费。针对是否开源的问题，马斯克也在直播中回应，Grok 3并未开源，但“按照惯例，我们会在新模型发布时，将上一代模型进行开源。因此，可以预见的是，在几个月后，Grok-3也将迎来其开源时刻。”

此次推出的Grok 3测试版本已面向社交平台X上的付费用户开放，此外，xAI还推出了更高阶的Super Grok订阅服务。

“发布会只提到X用户能选择付费版的Grok 3与Super Grok服务，但没有提toB企业客户如何使用目前闭源的Grok 3大模型，相信今年马斯克会发布美国政企客户使用Grok的价格，因为发布会展示了游戏创意、航天科研等产业场景。”田丰预测。

单从xAI的资本投入角度，也确实存在进一步扩大商业化的需求。成立于2023年的xAI，日前正加速其资本布局，在2024年的11月，xAI告知投资者，该公司在最新一轮融资中筹集了50亿美元，估值达到500亿美元。2024年12月24日，xAI在其官网宣布已完成60亿美元（约合人民币438亿元）C轮融资，目前xAI公司的市值已超过400亿美元。据美国媒体报道，xAI正寻求新一轮约100亿美元的融资，此轮融资将使公司估值达到约750亿美元。