企业报道

从DeepSeek融资再看大模型公司现在都值多少钱

 作者：本站编辑  2026-04-21 21:53:49  8

梁文锋的第一次对外融资

2026年4月17日晚，The Information爆料：DeepSeek正寻求史上首次外部融资，目标估值超100亿美元，筹集至少3亿美元。

自从DeepSeek以扫地僧的角色独自踏平中美大模型的鸿沟之后，一年半的时间以来，想要投资DeepSeek的机构和大厂肯定就没有断过。

但是DeepSeek都拒绝了，梁文锋也曾表示，DeepSeek不缺钱，具备自我造血能力，短期内无融资计划。

DeepSeek背后的母公司幻方量化，管理规模峰值接近千亿级别，2025年收益约56%，粗略估计幻方量化2025年就赚了50亿人民币约7亿美元，这次融3亿美元，似乎不是因为缺钱才想融这笔钱。

当然在V4发布一直推迟的时间窗口，没有压力是不可能的，在几乎每天都有新进展的AI行业，DeepSeek却让全行业已经等了将近一年半。

从技术上来看，DeepSeek在做重构式的改变。

DeepSeek R1的颠覆性领先，有一个核心：它直接针对英伟达GPU的PTX底层进行了极致优化。PTX是英伟达CUDA生态里的中间语言，深入到这一层，才实现了"花小钱办大事"的极致性价比。

相比于其他初创公司，DeepSeek因为做量化有英伟达的卡，但V4在硬件层面全面适配华为升腾芯片，转向国产芯片，PTX优化就全部作废。

这不仅是适配，是重写。整套底层代码、调度逻辑、工程体系，都要从头来。

DeepSeek曾经的优势越深，迁移成本就越高。

据路透和The Information报道，V4将运行在华为昇腾芯片上，规格令人期待：

MoE架构，总参数约1万亿，每个token仅激活约370亿参数，推理成本与V3持平
上下文窗口扩展至100万token，召回率达97%
首个原生多模态版本，支持文本、图像和视频生成
代码能力SWE-bench成绩超过80%，HumanEval达到90%

如果V4在华为芯片上跑出有竞争力的性能，它将是全球第一个不依赖英伟达的前沿AI模型。

黄仁勋近期接受采访时表示，DeepSeek基于华为平台的新模型"对美国来说将是一个糟糕的结果"。

从人员上看，2025年下半年至今，DeepSeek核心研究人员已出现批量出走，覆盖基座模型、推理、OCR、多模态四大核心技术主线。

第一代大语言模型核心作者、全程参与历代模型训练的王炳宣加入腾讯，DeepSeek V3核心作者罗福莉加入小米，R1核心研究员、GRPO算法核心发明者郭达雅加入字节跳动Seed团队，OCR系列核心作者魏浩然确认离职，从幻方时期便加入的老成员、多模态成果核心贡献者阮翀则加入自动驾驶公司元戎启行。

DeepSeek这次100亿美元估值的融资，也有可能还是梁文锋有意为之，他不需要最高价而是需要最少干扰。3亿美元换的是核心团队期权的兑现预期，以及公司估值的锚定。

几个月时间中国大模型从1%变成了5%

AI行业中国赛道头部的公司，值美国同赛道头部公司的1%，训练成本是1%，市值也是1%。这个“对标”方式虽然有开玩笑的成分，但实际确实大部分时间如此。

2025年12月底，智谱和MiniMax在港股刚刚上市时，也在验证这个对标方式，智谱和MiniMax市值分别是582亿和610亿港元，相对于当时OpenAI的6000亿美元估值，换算过来就是1%左右。

但是不到4个月过去，智谱和MiniMax的最高市值都在4000亿港元附近。

而OpenAI最新估值8520亿美元（2026年3月刚完成1220亿美元融资），国内大模型公司的估值已经从1%涨到了5%到6%的区间。

要知道在2025年12月底，看完招股说明书，智谱上市第一天，股价还一度跌了。

从招股说明书上看，智谱是一家to B的AI项目公司，收入薄、亏损大。MiniMax虽然账面稍微好看一些，但是很多收入也是靠产品端创新出海。

但是，上市没多久，龙虾的到来改变了逻辑。

这场龙虾浪潮，让大模型的使用方式从chat变成了主动执行的Agent，重构了token消耗的底层逻辑。

就以腾讯的龙虾产品WorkBuddy为例，MiniMax、智谱GLM、Kimi、DeepSeek这些大模型都是核心底层配置，凭借对OpenClaw生态的快速适配，实现了收入的爆发式跃迁。

Kimi曾宣布OpenClaw相关功能上线前20天，带来的新增收入就超过了2025年全年营收总和，按这个增速折算，2026年其收入预期至少是2025年的18倍起步。

MiniMax的MaxClaw上线仅一个月，API调用量就环比暴涨1200%，付费企业客户数较2025年末翻了8倍，2026年3月单月营收直接超过2025年下半年营收总和。

以B端MaaS服务为基本盘的智谱，借龙虾完成了商业化模式的升级，将原本的项目制、年框制付费模式，转化为持续的token流水式付费。2026年Q1，智谱MaaS平台ARR环比增长380%，其中OpenClaw相关业务收入占比超过60%。

本来智谱和MiniMax先上市，给还没上市的Kimi、DeepSeek带来了很大的压力，在一级市场可能后来者不好再融到那么多的钱。

但是现在却是智谱和MiniMax因为已经上市，享受到的更像是“虚假的上涨”，Kimi和DeepSeek确实实打实的能融到更多的钱。

市场对大厂却是苛刻的

相较于AI公司从1%到5%的变化，国内的互联网大厂相较于美国互联网大厂的市值差距本身就小很多，在这一轮龙虾热里面对的情况也类似。

相较于纯大模型初创公司凭借龙虾热估值暴涨，市场对于腾讯、阿里这些大厂却是十分苛刻的。

从25年4月贸易战风波之后，中美的大厂很多走了一个“A”字，“A”下来虽然美伊战争的影响，人们也预期会复刻去年的走势，再“A”上去。

但是对大厂，比初创公司更难享受到AI叙事确实是事实。

大厂不是AI做得不好，而是AI带来的收入在总营收里连1%都不到。

腾讯也好，阿里也好，它们就是要被用传统的财务指标衡量的。AI做得再好，还是靠广告、电商、金融服务撑起营收，市场就会用旧逻辑定价。

纯大模型公司恰恰相反。它们的营收基础薄到可以忽略，这反而成了优势，因为一切都是想象空间。

而且，龙虾效应直接证明了一件事：中国大模型的付费意愿是存在的，大模型公司的收入暴涨是可以持续预期的。收入曲线一旦往上走，原来的估值框架就整个松动了。

大厂也有大厂的优势，那就是家底足够厚。

大模型公司的市值需要一个个的龙虾来支撑，毕竟上市之后的市值是二级市场情绪与资金共识堆砌的纸面数字，而非牢不可破的价值底线。

一旦新的技术叙事断档、商业化增长不及预期，叠加解禁期的流动性冲击，虚高的市值就可能面临断崖式回调。商汤解禁当日股价单日暴跌超50%，此后即便经营数据改善，市值也较巅峰期缩水超80%。

大厂深厚的家底容错会高很多，比如Meta一代模型落后，还能有机会调整，大厂自带的十亿级C端用户场景、百万级B端企业客户资源，在AI入口争夺中优势更大。

尾声

再回到DeepSeek，我们当然期待V4再能带来颠覆性的创新，但是AI圈如今的竞争烈度，DeepSeek还想做扫地僧基本不太可能。

Anthropic过去3个月上线了70多个新功能，昨天上线的Kimi K2.6把Agent Swarm从100个扩展到300个，在4000步并行执行里塑造自己"Agent OS"的定位。

大模型的迭代周期早就从半年压缩到3个月，还在继续压缩。

DeepSeek不可能靠着过去的成就躺赢，每份估值背后都需要技术迭代与商业化兑现支撑。

智谱和MiniMax等国内大模型公司市值从1%到5%，是情绪和龙虾效应的结果。但要想像大厂那样与美国大厂差距进一步拉近需要持续的收入增长。估值游戏，永远只会为真正的技术突破与商业价值买单。

参考：屠龙之术播客、新智元、36Kr

- END -

本文所提及的任何资讯和信息，仅为作者个人观点表达或对于具体事件的陈述，不构成推荐及投资建议。投资者应自行承担据此进行投资所产生的风险及后果。

下一篇： 展会活动宣传破局!全网媒体直播分发,让你的活动触达亿万受众
上一篇： 金砖国家特殊经济区及合作项目推介会在沪成功举办,欧亚明星翻译全程助力!

企业报道

从DeepSeek融资再看大模型公司现在都值多少钱

梁文锋的第一次对外融资

几个月时间中国大模型从1%变成了5%

市场对大厂却是苛刻的

尾声

相关内容查看全部 

宁波企业主融资:

乌鲁木齐企业融资

苏州又有公司成功

【关注】青岛市企

科技创新型小微企

复旦系科创企业5

亿元驰援!江西这

中小企业缺钱?别

饲料企业融资并购

国内CAR-T领军企

从DeepSeek融资再看大模型公司现在都值多少钱

梁文锋的第一次对外融资

几个月时间中国大模型从1%变成了5%

市场对大厂却是苛刻的

尾声

相关内容 查看全部 

相关内容查看全部 