北京时间2月18日,科技富豪埃隆·马斯克(Elon Musk)的人工智能初创公司xAI发布了更新版Grok-3大模型,马斯克称之为“地球上最聪明的人工智能”。
在数学、科学和编程等基准测试中,Grok-3超越了Alphabet旗下GoogleGemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o,xAI在周一的直播中表示马斯克在与三位xAI工程师共同进行的演示中透露,Grok-3的计算能力比前代版本提升了10倍以上,并已于今年1月初完成预训练。
马斯克表示:“我们每天都在不断改进模型,在24小时内就能看到明显的提升”。
xAI还在Grok-3中引入了一款智能搜索引擎,命名为DeepSearch。DeepSearch是一个推理型聊天机器人,它能够表达自己理解问题的过程,并解释如何规划回答。在演示中,该搜索引擎提供了研究、头脑风暴和数据分析等功能。此外,马斯克团队还表示,计划尽快推出一款基于语音的聊天机器人。
Grok-3已立即向X(原Twitter)上的Premium+订阅用户开放。同时,xAI还推出了一项名为SuperGrok的新订阅服务,适用于移动应用程序和Grok.com网站。xAI计划在最新版本完全成熟后开源其前代Grok模型,马斯克预计Grok-3的开源转换将在几个月内完成。
值得一提的是,在马斯克Grok-3大模型发布的同时,Grok网站一度出现无法访问的情况。截至15:07,时代财经发现该网站已恢复正常访问。
另据财联社报道,马斯克在发布会直播中首次披露了Grok-3的训练成本,称Grok-3训练过程累计消耗20万块英伟达GPU,训练在xAI公司的数据中心完成。
马斯克的xAI成为AI大模型领域强有力的竞争者,同样参与这场竞技的还有OpenAI、谷歌、Anthropic以及近期引发全球关注的中国初创企业DeepSeek。
就在2月18日,DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。
DeepSeek称,NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理。
NSA的核心组件包括:动态分层稀疏策略、粗粒度的Token压缩、细粒度的Token选择。
DeepSeek称,通过针对现代硬件的优化设计,NSA在提升推理速度的同时降低预训练成本且不牺牲性能。在通用基准测试、长上下文任务以及基于指令的推理中,NSA的表现可媲美甚至超越全注意力模型。
另据中国新闻周刊报道,OpenAI于近日宣布,公司将在未来几个月内推出新一代人工智能模型GPT-5和GPT-4.5。据称,GPT-5将整合OpenAI的多项核心技术,包括o3推理模型。OpenAI首席执行官兼联合创始人SamAltman今日凌晨在社交平台表示:“对于高要求的测试者来说,试用GPT-4.5的体验,远比我预期的要深刻得多”。业内人士预计,这说明GPT-4.5已经进入测试阶段,离正式发布非常近了。
更早之前,2月初,DeepSeek新模型发布后,谷歌公司发布Gemini2.0系列模型,该系列模型强化了编码与推理能力,全面开放使用并降低成本。
另有消息称,Anthropic计划在未来几周内发布新的混合型大模型Claude 4,用户可以自行控制使用时的推理成本。当地时间本周一,总部位于法国巴黎的Mistral发布名为Mistral Saba的定制大模型,特点是具有高准确率的阿拉伯语交互能力。
在美国,Waymo 是特斯拉 Robotaxi 技术上的劲敌,Uber 是其服务上的对手,那么中国市场,谁才是 Robotaxi 的竞争者?
特朗普承诺,如果他当选总统,马斯克可能将担任“削减成本部长”或其他职务。一旦特朗普获胜,马斯克的商业帝国价值就会实现最大化。
钟睒睒很“水”,似德似仁、似义似智、似勇似察、似包似善化,心如止水之下又怀有“家国情怀”,这样怎能不让农夫山泉走得走得更远,行得更稳!
马斯克于2024年7月开始支持特朗普,并向“美国政治行动委员会”投入了至少1.18亿美元。