Grok 3,马斯克口中“最聪明的AI”来了! 2月18日中午12时许,马斯克(Elon Musk)的AI公司xAI研发的新一代AI基座大模型Grok 3正式发布。耗费了20万张GPU的Grok 3显示,“卷算力”目前仍是核心。
Grok 3的三个亮点
据马斯克团队介绍,Grok 3模型和Grok 3 mini(Reasoning,精简版)在数学推理、科学逻辑推理和代码写作等能力表现方面超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。
同时,具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning则是超越了类似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。

发布会上,马斯克提及,Grok 3的推理模型还支持一项名为DeepSearch搜索引擎新功能的应用。Deep Search通过扫描互联网和X平台上的信息进行分析,并生成摘要以回答用户提出的问题,在这一过程中还可以“推测用户的真正意图”,在经过交叉比对不同信息来源后,确保能向用户返回正确的信息。
快思慢想研究院院长、原商汤智能产业研究院创始院长田丰在接受澎湃科技采访时表示,从发布会上的内容看,Grok3有三个亮点:一是通过缩放定律Scaling Law显著提升模型性能,二是数学与编程等逻辑推理能力大幅增强,三是融入智能体产品化设计。
澎湃科技注意到,曾担任OpenAI创始团队、斯坦福博士,训练大型深度神经网络的工程师Andrej Karpathy,分享了其用户体验。
Andrej 称,在今天早上大约使用了两个小时的过程中,他感受到,Grok3加上深度思考(Thinking)模式的能力略好于DeepSeek-R1和Gemini2.0 Flash Thinking。这是相当令人难以相信的,不过,现在模型给出的答案是随机的,每次可能会给出略有不同的答案,现在还处于早期阶段,在接下来的时间,还需要更多的评估。
模型将进入“神仙打架”
“不过这场大语言模型(LLM)模型领域的竞赛令人非常兴奋!”Andrej 说。
伴随人工智能快速迭代,模型的领先优势的“保质期”越来越短,此前有业内人士向澎湃科技表示,“不超过100天,就会有新的模型出现,并超越。”
快思慢想研究院院长、原商汤智能产业研究院创始院长田丰在接受澎湃科技采访时也表示,接下来将进入神仙打架阶段,“Grok3‘PK’DeepSeek V3,马上就会有人来‘PK’Grok 3,也许是GPT4.5”。根据此前OpenAI对外公布的信息,GPT4.5的发布日期已经列入日程。
另有观点认为,目前的大模型行业,训练还未卷完,范式已经统一。
目前Grok3并未开放给普通用户使用,实际推理效果还要使用产品后看,目前看起来基准测试是达到GPT-o1水平的模型,但还不确定实际效果,推理能力的最佳呈现是数学和代码。马斯克在这次直播中主要展现了Grok3的数学计算和代码的能力。
卷算力目前是核心
值得一提的是,在DeepSeek开启了低成本训练模型的风潮后,Grok 3却是花了重金。Groks 3短时间内反超之前的SOTA模型(state-of-the-art model指在该项研究任务中,目前最好/最先进的模型),说明“卷算力”目前仍是核心。
在此次发布会上,马斯克透露,Grok 3的计算能力是Grok 2的10倍以上,Grok 3训练过程累计消耗20万张英伟达GPU,计算资源的显著提升帮助Grok 3能更高效地处理大型数据集,缩短了模型训练时间也提高了准确性。有分析称,Grok 3算力消耗是Deepseek V3的263倍。
据xAI团队透露,Grok 2模型使用了2400亿参数规模,性能媲美GPT-4,为了训练Grok 3,xAI团队也将数据中心容量翻倍。
马斯克团队在发布会上表示,“早在去年4月,马斯克就决定创建我们自己的数据中心。我们大约在四个月内建立了数据中心,并花了122天时间,让10万个GPU启动并运行,这是一项艰巨的工作。我们相信这是同类中最大的全连接的H100集群。但我们并没有止步于此。”
“我们每天都在不断改进模型。”马斯克称,目前,Grok 3测试版现已面向马斯克的社交媒体平台X Premium用户推出。
田丰认为,Grok 3采用的还是“大力出奇迹”的模式,因其使用了20万块英伟达GPU卡训练而成,是典型的“又好又贵”。从数据来看,Grok 3的推理能力远远超过前一代的Grok 2模型。“xAI基础设施的建设能力全球领先,相比于10万块卡用了120多天,最新的20万块GPU集群只用了92天完成施工搭建,且利用率应该很高,值得中国算力供应链借鉴。”田丰补充说。
商业化布局更进一步
与DeepSeek相比,Grok 3最大的短板在于它并非开源模型,且需要付费。针对是否开源的问题,马斯克也在直播中回应,Grok 3并未开源,但“按照惯例,我们会在新模型发布时,将上一代模型进行开源。因此,可以预见的是,在几个月后,Grok-3也将迎来其开源时刻。”
此次推出的Grok 3测试版本已面向社交平台X上的付费用户开放,此外,xAI还推出了更高阶的Super Grok订阅服务。
“发布会只提到X用户能选择付费版的Grok 3与Super Grok服务,但没有提toB企业客户如何使用目前闭源的Grok 3大模型,相信今年马斯克会发布美国政企客户使用Grok的价格,因为发布会展示了游戏创意、航天科研等产业场景。”田丰预测。
单从xAI的资本投入角度,也确实存在进一步扩大商业化的需求。成立于2023年的xAI,日前正加速其资本布局,在2024年的11月,xAI告知投资者,该公司在最新一轮融资中筹集了50亿美元,估值达到500亿美元。2024年12月24日,xAI在其官网宣布已完成60亿美元(约合人民币438亿元)C轮融资,目前xAI公司的市值已超过400亿美元。据美国媒体报道,xAI正寻求新一轮约100亿美元的融资,此轮融资将使公司估值达到约750亿美元。
发表评论