价格战在中国,从来都是最熟悉、最痛苦,也终究是无可回避的情节。短短10天时间,一度选择“等等看”的字节,猝不及防地打出“低价”王炸,将大模型战火拉进了下一序列。
5月15日,在字节跳动“FORCE原动力大会”上,跳过介绍和过渡,火山引擎总裁谭待一步到位亮出了“豆包”的最新价格:0.0008元/千Tokens,宣布这是低于行业99.3%的“地板价”。
他同时高调向阿里和百度喊话:此次是主力模型降价,不是用小模型降价来混淆视听。“很遗憾阿里和百度还没有128k可精调的模型,但我期待他们的更新。”
从多方了解,阿里、百度、腾讯等头部玩家对字节的这次出击缺少准备;各方虽感无奈,也只能被动追随。
5月21日,阿里云宣布:旗下多款大模型的推理输入token降价,降价幅度为67%-97%。同日,百度文心大模型旗下两款模型ENIRE Speed、ENIRE Lite宣布免费。5月22日,腾讯云宣布,旗下多款大模型推理输入token降价,降价幅度为50%-87.5%。
站在行业层面看,某种程度上大模型的价格战终不可避免。一方面,推理算力价格的不断降低构成了价格战基础;而生成式大模型发展仍处于早期阶段,各家差距尚不明显。同时,卷应用、卷生态的蓝海正在展开,云厂商的降价,将吸引更多开发者、商户共同做大蛋糕。
不过相比于大厂的高调作战,「市界」接触的大模型开发者、创业者们多数表现平淡。虽然他们相信:价格战会打消一部分AI成本顾虑,但更多人认为,大厂降价开源的多是小模型,使用起来也有许多限制,降价远没有那么货真价实。
“鲶鱼”字节
许多人没猜到,价格战的发起者,会是云厂商巨头里对大模型布局最为滞后与暧昧的字节。
2023年4月,字节跳动火山引擎总裁谭待在与包括「市界」在内的媒体沟通中,曾言之凿凿地表示:“火山引擎自己是不做大模型的,我们做的是服务好大模型创业的公司。字节跳动未来如果推出基础大模型,将会是火山引擎客户之一。”
在去年“百模大战”角逐中,字节一度选择“佛系”跟随。2023年3月、4月,百度文心一言、阿里通义千问先后公布。而字节到了2023年8月,才上线了AI聊天机器人“豆包”。
动作偏“慢”的背后,字节入局云市场较晚、技术与客户储备较弱是原因之一。
一方面,2021年才正式做云的火山引擎在巨头云厂商里,是“最年轻”的一朵。做云三年多来,火山云一直被视为挑战者角色,尚未进入中国云市场份额前五强。
据媒体报道:在2024年1月召开的字节跳动年度全员会上,字节跳动 CEO梁汝波曾提到:公司直到 2023年才开始讨论GPT,而业内做得比较好的大模型创业公司都是在2018年至2021年创立。
但最终字节从低调观望,到主动出击,“转变”或来自于两方面原因:其一,市场经过一年酝酿,竞争逐渐从底层算力训练,进入到了模型优化层的推理算力比拼。对于算力“卡脖子”问题,国内市场也逐渐找到了通过调整模型结构,以降低推理成本的办法——如采用MoE(Mixture of Experts)混合模型架构等策略。
目前,虽然用于算力训练的高端芯片仍然紧缺,但用于优化模型的、相对低端的推理算力芯片,供应已比较充足——这让降价也变得有条件发生。
同时,阿里等玩家的积极出击,或也不断给字节带去了扰动和求变的决心。
近日据“腾讯科技”报道,2023年年中,字节曾在市场上寻觅大模型投资标的。但在几乎与创企MiniMax达成协议的关口,字节突然临场反悔,决定“要么自己做,要么收购一家公司”。
站在集团层面,押注大模型还有更加现实的意义。2024年,TikTok海外市场深陷风暴眼中,字节对站上新风口的渴求尤为迫切;外界也将字节在大模型上的密集动作描述为“寻找下一个TikTok”。
进入2023年底,字节的AI布局陡然提速。据“凤凰科技”报道,字节正式组建了Flow部门,专注于AI大模型的应用研发。2024年3月,飞书产品副总裁齐俊元调至Flow部门,主要负责豆包的PC端业务。2024年4月,历任今日头条CEO以及TikTok产品技术负责人的朱文佳开始整体负责字节AI业务,向梁汝波汇报。
一位知情人士向「市界」透露:一旦下定决心,字节就确立了“全面横向对标”的大模型战略,在应用层、连接层、技术层,都不愿放过。换句话说,市场中已有的整条大模型产业链,几乎全被字节视为“敌人”。
虽然身位落后,字节也有大模型必需的两大利器:算力与流量。据“晚点Latepost”报道,2023年春节后,字节曾“抢购”了超10亿美元的英伟达GPU。
而一旦抖音助力,字节亦有能力快速抬高任何产品的用户大盘。2023年底,据媒体多方统计,豆包的月活用户还远逊于文心一言和通义千问。而到今年3月前后,据QuestMobile最新报告显示:2024年3月,“豆包”App月活用户为2328.2万,在AIGC类应用中排名第一——这自然离不开字节的庞大流量池扶持。
阿里、百度、腾讯各怀心事
字节突然下场,改写了游戏规则;对阿里、百度等领跑者来说,“低价”的标签不容这样轻易地被夺走。
5月15日字节发动价格战后,市场一度沉寂数日——某种程度上,大家在等待头号玩家阿里的表态。从2023年以来,阿里在云计算市场上,一直表现为寸土必争。其大模型应用层也堪称国内最丰富,既有自研通义大模型,也囊括了最全的模型和开放生态。
5月21日,阿里云终于宣布,高调跟进价格战:旗下九大模型降价。其中,对标GPT-4的Qwen-Long输入价格直降97%,仅需0.0005元/千tokens。阿里的正面硬刚,不仅意味着击穿了“豆包”定价;且降价的旗舰大模型覆盖的任务场景、目标客群也与字节高度统一。
毕竟对于内忧外患的阿里来说,大模型已被视为不容有失的、决定未来十年的船票。过去两年,阿里云虽然在市场份额、营收上仍位列行业第一,但在争夺政企云等节节受挫后,增速比起逐年仍以两位数抬升的华为云、天翼云等,已只余个位数。
阿里云迫切需要大模型为自己注入增长动力。近日,据“数智前线”消息,阿里云内部提出了一个非常激进的目标:三年之内,要拿下国内大模型云计算市场的90%。
另据阿里内部人士向「市界」透露,2023年阿里新任CEO吴泳铭上位后,在其投资背景和马云的支持下,阿里用“现金+算力”的模式,积极投资了月之暗面、Minimax、智谱AI、百川智能和零一万物,集齐“大模型五虎”。这些明星创企,一方面会作为客户在阿里云上训练大模型,一方面也透过阿里云,向外提供着服务。
相比起主打开放生态的阿里,更希望效仿“微软+OpenAI”,做高质量“垂直整合”的百度,在价格战面前的态度更为复杂。
在豆包宣布低价的当天,一位百度内部人士告诉「市界」,公司反应并不积极,更相信“客户真正关注的是效果,而非单纯低价”。5月16日的百度财报电话会上,百度智能云事业群总裁沈抖也指出:面对其他厂商的价格战,同样重要的是,评估不同模型在不同工作负载下的性能比,而不是仅仅关注表面价格。
但看到阿里下场后,百度还是用最快的速度跟上了。5月21日下午,百度宣布文心系列大模型中的ERNIE Speed(8K、128K)、ERNIE Lite(8K、128K)两款大模型的API将免费提供。
但不同于字节与阿里直接对旗舰级产品开放降价,百度免费的两款大模型,是于今年3月份发布的轻量级大模型,被动防御意味更浓。
阿里、百度表态后,隔日,腾讯云也作出了应对:官宣六款大模型API降费,其中混元-lite直接免费提供服务;混元-standard-256K的最新输入价格定为0.12元/千tokens,相当于降价87.5%;最高配置的万亿参数模型混元-pro的输入价格则从0.1元/千tokens降至0.03元/千tokens,降幅达70%。
相比之下,更擅长做产品和SaaS应用的腾讯,在AI技术层、客户层不及阿里、百度,跟随意味也更加明显。
在过去一年的“百模大战”中,腾讯更多侧重在混元大模型中,将自家的腾讯会议、企业微信、腾讯文档等产品装入,努力拓展集成了AI能力的几大产品客群。不过,也有市场声音认为,当生成式AI技术步入稳定期,开始应用层比拼后,握有产品线、流量、现金的腾讯,有能力以逸待劳,快速追上。
在腾讯云宣布降价同日,科大讯飞也挤上了降价的“末班车”,宣布Spark Lite-8K提供免费服务,Spark 3.5 Max-8K则降价至0.21-0.3元/万tokens区间。但不同于几家大厂,科大讯飞不涉及公有云服务,模型参数规模也较低。一位科大讯飞员工委婉地向「市界」表示了讯飞在降价潮中的焦虑:“跟友商们比,还有进步的空间。”
B端客户冷眼旁观
经过一个多星期的酝酿,这场如“618大促”般热闹的价格战,以大厂的悉数入场收官。但在高调的大厂和应用者之间,又快速拉开了火热与冷静的鲜明对比。
首先,不少开发者们发现,大厂所谓的“免费”有不少限制条件。例如,百度、讯飞等拿出的降价产品,均是偏轻量化的版本,只适用于推理量级小、场景简单的企业“尝鲜”使用。
此外,本轮降价更多聚焦于“API调用”场景——这也侧面说明,大模型行业仍处于早期阶段。
2023年,谭待便曾表示:云厂商按token消耗数量计费,无法真实反映不同业务、场景的客户价值,并非很理想的商业模式。
多位行业人士也对「市界」表示,在API层面的降价,更像“试用装”鱼饵——大厂希望借此达成的是“公有云+API”的闭环:B端用户被API吸引而来,结合使用深度,向公有云租用推理算力;未来在数据存储、高级功能、API调用次数、高峰期使用溢价等层面形成再付费。
因此,价格战也可被看作是大厂的一场“获客”游戏;而长期的角力关键,发展较成熟的云市场早已给出过答案。
近日,Lepton AI创始人、阿里巴巴原副总裁贾扬清的一则朋友圈留言在业界广为流传。他表示:“企业在使用AI的时候,并不是成本驱动的。不是因为API贵才没人用,而是因为企业首先得搞清楚怎么用起来产生业务价值,否则的话,再便宜也是浪费。”
因此,不少中小大模型创企也站在了大厂的另一极,选择理性观望,而不是跟随。
5月22日,在腾讯、科大讯飞同步宣布降价时,百川智能发布了最新一代基座大模型Baichuan 4,并推出了首款AI搜索助手“百小应”,没有跟随价格战。
创始人王小川在会后接受媒体采访时表示,价格战仅是大厂的游戏。“核心要看你的商业模式是什么。如果你是做to B服务的时候,降价最后卖的不是模型本身,卖的是整套云服务。”
零一万物创始人李开复对价格战的态度更为消极。他直言大模型价格战是双输打法,可以类比曾经的共享单车烧钱大战。“以后可能中国就是这么卷,大家宁可赔光通输也不让你赢,那我们就走外国市场。”
据零一万物API平台负责人蓝雨川透露:目前零一万物Yi-Large的API定价是20元对应百万tokens,大概是GPT-4 Turbo成本和定价的1/3。对此,李开复自信地表示:“我们的定价非常合理。”
能引爆商业化元年吗
不论创企是否选择、或有能力跟随价格战,当行业被价格燃起热火后,接下来比拼算力储备、补贴力度、技术实力的淘汰竞赛势必会加速展开。留给各家建立护城河的时间,也将急剧压缩。
对于迫切希望打开to B市场入口的大厂而言,彼此之间图穷匕见,争夺API用户的“贴身肉搏”已经率先展开。
一家小B端客户告诉「市界」,在5月15日发布会举办之前,火山方面已多番与其进行接触,希望其能够从原有的API服务商上转用豆包。另一位开发者则表示,近日当他在豆包大模型官网页面注册了登录账号后,短短一小时内就接到了火山引擎方面的沟通电话,“挂断后第二天他们还接着打”。
每一个分散的需求,开始被巨头case by case般地注意和争夺——虽然大厂力推的价格杀器,未必是客户选择的首要因素。
一位企业用户告诉「市界」,自己一直在被火山“密集轰炸”,“但最后是否会接入豆包,要试用一下看看效果再做决定”。
留学文书GPT创业者小鱼则透露,在创业之初探索MVP(最小化的可行性产品)阶段,小鱼试用了国内的大部分大模型产品后,最终选择接入的API并不最具经济性。
他谈道:“当时我注意到百度文心的API定价最为便宜,但它的效果尤其是英语效果实在是无法满足我们的需要,所以也被排除了。”
价格之外,各家云大厂能够提供的服务附加值,也是用户更为看重的方向。例如,使用豆包是否会获得抖音的流量扶持;使用通义千问,阿里的生态能否提供整体支持,将是达成更深层绑定的关键因素。
同时,经过一年的大模型基础设施铺陈,AI的爆款级应用还有多远,也再度被广泛期待。
毕竟在移动互联网早期,也曾有移动App付费还是免费的商业化困局。但这些疑问,很快被微信、支付宝、美团、滴滴的一场场免费商战进行了颠覆式解答。而随着现象级的AI应用产生,能否卷起新的商业世界,才是巨头们不惜成本投入的核心原因。
近日,猎户星空创始人傅盛在回应价格战问题谈到:大降价宣告了大模型创业公司,必须寻找新的商业模式。而寻找超级应用的重要性,也再升了一级。