AI行业进入"成本现实期":企业开始算账、巨头开始收缩、监管开始收网
2026年7月,AI行业发生了几件看似无关、实则指向同一趋势的事情:花旗和Adobe悄悄禁用了员工使用Claude和GPT-5.5的权限,字节跳动宣布豆包智能体功能7月15日正式下线,广电总局公布了6月清理近7600条AI魔改视频的治理成果。
当所有人还在讨论"AI能做什么"的时候,一个更现实的问题已经浮出水面——AI的成本,到底谁来买单?
一、企业AI成本失控:从"拥抱AI"到"限制AI"
7月初,IT之家报道了一条被很多人忽略的新闻:多家科技和金融巨头因AI成本飙升,正在限制员工使用高性能大模型。
Atlassian的月度AI支出从500万美元飙升至1500万美元,三个月翻了三倍。花旗集团和Adobe已经禁用了Claude、GPT-5.5等旗舰模型,引导员工改用低配版本以控制Token消耗。
这不是个例。2026年上半年,全球企业AI支出呈现爆发式增长。Gartner数据显示,企业级AI应用的平均年度预算已从2025年的230万美元增长至580万美元,增幅超过150%。但与此同时,AI带来的可量化回报却远低于预期——麦肯锡最新报告指出,只有23%的企业声称从AI项目中获得了正向ROI。
问题出在哪里?
第一,Token消耗远超预期。 企业级AI应用不是聊天机器人那么简单。当AI Agent开始处理复杂工作流——编写代码、分析数据、生成报告、与客户交互——每个任务的Token消耗是简单对话的10到50倍。以Claude Sonnet 5为例,虽然单价降到了每百万Token 2美元,但一个Agent完成一个完整项目可能消耗数百万Token,成本轻松突破数十美元。
第二,模型选择陷入"贵的不一定对"困境。 企业发现,GPT-5.5和Claude Opus 4.8在大多数任务上的表现并不比中端模型好多少,但价格却贵了5到10倍。Adobe内部测试显示,在文档摘要和邮件草拟等常见任务上,Claude Sonnet 5的表现与Opus 4.8差距不到5%,但成本只有后者的六分之一。
第三,隐性成本被严重低估。 AI应用的总成本不仅仅是API调用费用。数据清洗、模型微调、安全审计、合规检查、员工培训、系统集成……这些"冰山下"的成本往往占到总投入的60%以上。
花旗集团的CTO在内部邮件中写道:"我们不是在放弃AI,而是在学会更聪明地使用AI。"这句话精准概括了企业AI应用从"全面拥抱"到"精细管理"的转变。
二、豆包智能体下线:字节跳动的AI战略转向
7月3日,字节跳动旗下豆包App发布通知,其智能体功能将于7月15日正式下线。用户需在此之前备份智能体信息及历史对话数据,10月15日后相关数据将按隐私政策处理。
豆包智能体功能上线仅数月就宣布下线,背后折射出字节跳动对AI产品路径的深度反思。
智能体功能的用户留存率远低于预期。 虽然字节跳动未公布具体数据,但多方信源显示,豆包智能体的日活跃用户数不到总用户数的8%。大部分用户尝试几次后就回到了简单的对话模式。
更深层的原因是成本与收益的不匹配。 智能体功能需要持续的后台计算资源来维持上下文、执行工具调用、管理多轮交互。字节跳动内部测算显示,每个活跃智能体用户的月均计算成本是普通对话用户的15倍以上,但付费转化率几乎没有差异。
这不是豆包一家的问题。2026年上半年,多家大厂的AI产品都经历了类似的"功能收缩":腾讯混元调整了插件生态策略,百度文心一言减少了第三方工具集成,阿里通义千问重新定义了智能体的触发条件。
行业正在从"功能越多越好"转向"核心体验优先"。字节跳动选择在豆包上做减法,本质上是在回答一个根本问题:AI产品应该是什么样的?
答案可能比我们想象的更简单。ChatGPT最初的成功恰恰在于它的简洁——一个对话框,输入问题,获得答案。当所有厂商都在往AI产品里塞入越来越多的功能时,用户可能真正需要的只是更聪明的对话、更准确的回答、更可靠的结果。
三、广电总局出手:AI内容治理进入常态化
7月3日,国家广播电视总局公布了6月"AI魔改"视频治理成果:清理违规视频近7600条,处置违规账号20余个。
治理重点针对四大名著、历史题材等经典作品的违规改编。自专项治理以来,违规视频清理量已呈下降趋势——这说明行业正在形成自律。
广电总局的治理行动有两个值得关注的信号:
第一,监管从"运动式"转向"常态化"。 2025年的AI内容治理更多是"发现一起查处一起",而2026年已经建立起一套持续性的监测和处置机制。这意味着AI生成内容的合规成本将持续上升。
第二,治理重点从"明显违规"转向"灰色地带"。 早期被清理的视频大多涉及明显的色情、暴力或政治敏感内容。但现在的治理已经延伸到"AI魔改"——用AI技术改编经典作品,虽然不涉及直接违规,但可能侵犯版权、歪曲历史、误导公众。
这对AI内容创作者提出了更高的要求。未来,AI生成的视频、图片、文字内容都需要经过更严格的合规审查,这将大幅增加内容生产的成本和周期。
四、硬币的另一面:AI在科研领域的突破
在企业"算账"、产品"收缩"、监管"收网"的同时,AI在科研领域却展现出截然不同的面貌。
7月3日,阿里达摩院联合中国人民大学、中国科学院大学发布了首个超导材料发现AI智能体Elements Claw。这个AI系统预测出了6.8万个可能的超导材料,其中4种全新材料已合成并证实存在超导性。
这是一个真正的科学突破。
超导材料是现代科技的基石——从MRI医疗设备到粒子加速器,从量子计算机到磁悬浮列车,都离不开超导技术。但传统的新材料发现过程极其缓慢:一个材料科学家一辈子可能只能发现几种新材料,而Elements Claw在短时间内就预测出了数万个候选材料。
更重要的是,阿里达摩院选择了完全开放数据。这意味着全球的材料科学家都可以利用这些预测结果进行进一步研究,大幅加速超导材料的研发进程。
这个案例揭示了AI应用的一个重要分野:在标准化、可量化的任务上,AI的ROI最高;而在需要创造力、判断力和人际交互的场景中,AI的投入产出比仍然存疑。
五、2026年下半年:AI行业走向何方?
综合以上事件,我们可以清晰地看到2026年下半年AI行业的几个确定性趋势:
趋势一:企业AI支出将从"增长"转向"优化"。 不是减少投入,而是更聪明地投入。中端模型将获得更多采用,Agent架构将更加注重成本控制,AI项目的ROI评估将更加严格。
趋势二:AI产品将经历一轮"功能瘦身"。 从"什么都能做"到"把核心功能做到极致"。豆包的下线不是失败,而是产品成熟的表现。
趋势三:AI内容监管将持续加强。 从视频到文字,从图片到音频,AI生成内容的合规要求将越来越明确。合规将成为AI内容创业的基本门槛。
趋势四:AI在科研和工业领域的价值将进一步凸显。 相比消费端的不确定性,AI在药物研发、材料发现、工业优化等领域的投入产出比更加确定。
趋势五:开源生态将迎来新一轮爆发。 当企业开始精打细算,开源模型的成本优势将更加明显。GLM-5.2的MIT开源已经证明了这条路径的可行性。
结语
2026年是AI行业的"现实检验之年"。
2024年的狂热、2025年的落地、2026年的算账——这是任何一个技术领域走向成熟的必经之路。AI不是万能药,也不是泡沫,它是一种强大的工具,而工具的价值取决于使用它的人。
花旗限制员工使用大模型,不是因为AI没用,而是因为要更聪明地用。豆包下线智能体功能,不是因为字节放弃AI,而是因为要聚焦核心体验。广电总局清理AI魔改视频,不是因为反对AI,而是要确保AI在正确的轨道上发展。
当潮水退去,才知道谁在裸泳。而当AI行业开始算账,我们才能真正看清——哪些AI是真需求,哪些只是伪场景。
本文首发于小澜AI公众号,内容基于公开信息整理分析,不构成投资建议。
