当前位置：首页 > TMT > 正文

大模型竞争的下半场，为何场景为王？

2025-07-11 13:37:43 来源：钛媒体 A+A-

大模型竞争的下半场，为何场景为王？

场景的深度与广度正成为大模型价值的真正标尺。

2025年4月发布的斯坦福AI指数报告，揭示了一些有趣的事实。2024年，TOP1和TOP10的模型的差距为12%，但如今，它们的差距已经锐减至5%。

这说明头部模型的效果没有本质差别，大模型的进化已经到达瓶颈期，与此同时，顶级模型能力也不再被小部分人垄断。随之变化的还有成本和参数等层面。与两年前相比，38亿参数的小模型就能实现之前5400亿参数模型的效果。

在大规模多任务语言理解（MMLU）基准测试中达到GPT-3.5水平（MMLU准确率64.8%）的AI模型调用成本，已从2022年11月的20美元/每百万token，骤降至2024年10月的0.07美元/每百万token（谷歌DeepMind的Gemini-1.5-Flash-8B模型），18个月内成本下降280倍。

当模型能力不再是壁垒，场景穿透力成为新的竞争维度。单纯刷榜失去意义，不论大厂还是初创，都在寻找垂直场景深度、逻辑可靠性与终端适配性，本质上是在某一个具体的场景中，验证“效率-性能-安全”的三角平衡。

而就钛媒体接触和收集到的场景来看，过去三年，也呈现出明显从「技术试水」到「价值深耕」的过渡。

2023-2024年是通用场景的探索期，以技术验证为主，主流大模型聚焦通用能力测试，文本生成、多模态交互等，主要应用于内容创作等场景，而在一些亟需确定性的场景，能力稍显不足。

某银行引入通用模型后，反欺诈误报率居高不下，反映出早期模型在专业场景水土不服；某医院的人工辅助诊疗，强依赖人工标注数据，且 NMPA 审批周期长，商业化进程缓慢；大模型的训练需高额投入，导致多数企业处于观望状态，仅头部机构能承担技术验证成本。

大模型场景的闭环系统尚未跑通，诸多要素不健全，这也是技术发展的必经之路，到了今年则有很大不同。

“空有模型无用，甚至一些企业认为模型应该是免费的，他们开放了核心生产场景和模型厂商共创，模型厂商才是需求更迫切的一方。”一位大型企业高管表示。“无场景支撑的通用模型，正面临用户留存低、付费意愿弱的商业化困局。”

在刚刚落幕的2025年全球数字经济大会上，北京正式揭晓了2025年人工智能应用场景“揭榜挂帅”名单，共涉及12个领域，包括制造业、教育、医疗、金融、环境、能源、文旅、智慧水厂、街道安全、建筑以及智慧城市等，总预算金额高达1.1亿元。

上至政策制定方，下至业务需求方，大模型产业要向前，都在把大模型推到千行百业的场景中。

钛媒体App将大模型应用场景分成三类，首先是短期收益明确的“效率型”场景，例如私有化部署+ RAG（检索增强生成）做企业知识库，解决数据安全与幻觉问题，再如之前已有的算法场景优化，供应链的周转优化，智能制造的预测性维护等，这些场景入手容易，产出可见，是多数企业小规模试验的优先选择。

其次是需求爆发中的“创造力型”场景，例如多模态生成技术（文生图、文生视频），可将游戏素材制作成本大幅降低，AI Agent驱动游戏NPC动态交互，提高玩家留存率。

最后是最难的，长周期高门槛的“复杂系统型”场景，比如医疗健康的辅助诊断，需跨域融合基因数据、影像学知识，政策合规要求高，再如自动驾驶，依赖VLM（视觉语言模型）与端到端算法融合，技术成熟度与法规滞后制约商业化，价值足够大，却也是难啃的骨头。

钛媒体从2023年初，就持续关注场景应用，创设《创新场景50》栏目，挖掘、报道市面上真正有价值的技术场景。综合去年「创新场景50」系列榜单，钛媒体发现了几个趋势，首先，大模型创新场景处于浅层、实验性、内部场景居多，深层、规模化、外部场景较少。

但也有一些不错的场景出现。例如首旅用大模型为6300家酒店客房精准定价；大模型智能体应用“闺蜜AI医生”，女性用户问答准确率达80%；借助大模型技术，货运物流智能接单效率提升75%；基于大模型的深基坑风险管理Agent，提高管控效率和准确率；大模型落地场外衍生品交易场景，撮合成功率增长 3 倍，等等创新场景。

此外，我们明显看到了中大型企业和政府等行业的进展，在宏观经济的逆周期，以及所处行业环境的大背景下，更多企业迫于外力加速了创新场景的实践，论投入产出比，论直接和间接效果，数字化投入带来的回报都在优先级之列。

最后，创新场景领先者给予我们的反馈是，场景创新其实一直都在发生，应当成为企业的数字化惯性，而不是数字化冲动，不论创新场景的大和小、深和浅，及早实践最重要。

在我们看来，变化的是技术，不变的是需求，大模型必然会走向场景为王，并将在千行百业中兑现价值，这将是未来较长一段时间的主线。大模型时代的创新场景应该是什么样？行业都在摸索中前行，我们希望听到更多真实的声音。

2024创新场景的获奖企业各有各的特色，集合往年优秀创新场景参与方的后续发展来看，除了能得到广阔的曝光，还有机会登上更大的舞台。例如去年创新场景获奖企业中能坤域，旗下低空全自动充电机器人开创性地实现了“机器人找车”的主动服务模式，入选央视《赢在AI+》并晋级全国总决赛。

创新场景的评审方包括各大企业CXO级别技术和管理层，他们将为行业厘清真实的发展脉络。钛媒体将链接更多渠道和资源推广创新场景，让更好的创新场景，先一步被看见、发掘和变现。在评选中脱颖而出的获奖创新场景，更将获得钛媒体矩阵持续曝光，包括内容层面的宣传，以及参与钛媒体全年各种含金量极高活动的潜在合作机会。

(责任编辑：zx0600)