当前位置：首页 > TMT > 正文

马斯克放大招，发布号称“地球上最聪明”的AI大模型！DeepSeek同天发布论文…

2025-02-19 10:06:49 来源：北京商报 A+A-

北京时间2月18日，科技富豪埃隆·马斯克（Elon Musk）的人工智能初创公司xAI发布了更新版Grok-3大模型，马斯克称之为“地球上最聪明的人工智能”。

在数学、科学和编程等基准测试中，Grok-3超越了Alphabet旗下GoogleGemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o，xAI在周一的直播中表示马斯克在与三位xAI工程师共同进行的演示中透露，Grok-3的计算能力比前代版本提升了10倍以上，并已于今年1月初完成预训练。

马斯克表示：“我们每天都在不断改进模型，在24小时内就能看到明显的提升”。

xAI还在Grok-3中引入了一款智能搜索引擎，命名为DeepSearch。DeepSearch是一个推理型聊天机器人，它能够表达自己理解问题的过程，并解释如何规划回答。在演示中，该搜索引擎提供了研究、头脑风暴和数据分析等功能。此外，马斯克团队还表示，计划尽快推出一款基于语音的聊天机器人。

Grok-3已立即向X（原Twitter）上的Premium+订阅用户开放。同时，xAI还推出了一项名为SuperGrok的新订阅服务，适用于移动应用程序和Grok.com网站。xAI计划在最新版本完全成熟后开源其前代Grok模型，马斯克预计Grok-3的开源转换将在几个月内完成。

马斯克放大招，发布号称“地球上最聪明”的AI大模型！DeepSeek同天发布论文…

值得一提的是，在马斯克Grok-3大模型发布的同时，Grok网站一度出现无法访问的情况。截至15:07，时代财经发现该网站已恢复正常访问。

另据财联社报道，马斯克在发布会直播中首次披露了Grok-3的训练成本，称Grok-3训练过程累计消耗20万块英伟达GPU，训练在xAI公司的数据中心完成。

马斯克的xAI成为AI大模型领域强有力的竞争者，同样参与这场竞技的还有OpenAI、谷歌、Anthropic以及近期引发全球关注的中国初创企业DeepSeek。

就在2月18日，DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。

马斯克放大招，发布号称“地球上最聪明”的AI大模型！DeepSeek同天发布论文…

DeepSeek称，NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制，实现超高速长上下文训练与推理。

NSA的核心组件包括：动态分层稀疏策略、粗粒度的Token压缩、细粒度的Token选择。

DeepSeek称，通过针对现代硬件的优化设计，NSA在提升推理速度的同时降低预训练成本且不牺牲性能。在通用基准测试、长上下文任务以及基于指令的推理中，NSA的表现可媲美甚至超越全注意力模型。

另据中国新闻周刊报道，OpenAI于近日宣布，公司将在未来几个月内推出新一代人工智能模型GPT-5和GPT-4.5。据称，GPT-5将整合OpenAI的多项核心技术，包括o3推理模型。OpenAI首席执行官兼联合创始人SamAltman今日凌晨在社交平台表示：“对于高要求的测试者来说，试用GPT-4.5的体验，远比我预期的要深刻得多”。业内人士预计，这说明GPT-4.5已经进入测试阶段，离正式发布非常近了。

更早之前，2月初，DeepSeek新模型发布后，谷歌公司发布Gemini2.0系列模型，该系列模型强化了编码与推理能力，全面开放使用并降低成本。

另有消息称，Anthropic计划在未来几周内发布新的混合型大模型Claude 4，用户可以自行控制使用时的推理成本。当地时间本周一，总部位于法国巴黎的Mistral发布名为Mistral Saba的定制大模型，特点是具有高准确率的阿拉伯语交互能力。

(责任编辑：zx0600)