发布信息

从DeepSeek融资再看大模型公司现在都值多少钱

作者:本站编辑      2026-04-21 21:53:49     0
从DeepSeek融资再看大模型公司现在都值多少钱
01

梁文锋的第一次对外融资

2026年4月17日晚,The Information爆料:DeepSeek正寻求史上首次外部融资,目标估值超100亿美元,筹集至少3亿美元。

自从DeepSeek以扫地僧的角色独自踏平中美大模型的鸿沟之后,一年半的时间以来,想要投资DeepSeek的机构和大厂肯定就没有断过。

但是DeepSeek都拒绝了,梁文锋也曾表示,DeepSeek不缺钱,具备自我造血能力,短期内无融资计划。

DeepSeek背后的母公司幻方量化,管理规模峰值接近千亿级别,2025年收益约56%,粗略估计幻方量化2025年就赚了50亿人民币约7亿美元,这次融3亿美元,似乎不是因为缺钱才想融这笔钱。

当然在V4发布一直推迟的时间窗口,没有压力是不可能的,在几乎每天都有新进展的AI行业,DeepSeek却让全行业已经等了将近一年半。

从技术上来看,DeepSeek在做重构式的改变。

DeepSeek R1的颠覆性领先,有一个核心:它直接针对英伟达GPU的PTX底层进行了极致优化。PTX是英伟达CUDA生态里的中间语言,深入到这一层,才实现了"花小钱办大事"的极致性价比。

相比于其他初创公司,DeepSeek因为做量化有英伟达的卡,但V4在硬件层面全面适配华为升腾芯片,转向国产芯片,PTX优化就全部作废。

这不仅是适配,是重写。整套底层代码、调度逻辑、工程体系,都要从头来。

DeepSeek曾经的优势越深,迁移成本就越高。

据路透和The Information报道,V4将运行在华为昇腾芯片上,规格令人期待:

  • MoE架构,总参数约1万亿,每个token仅激活约370亿参数,推理成本与V3持平

  • 上下文窗口扩展至100万token,召回率达97%

  • 首个原生多模态版本,支持文本、图像和视频生成

  • 代码能力SWE-bench成绩超过80%,HumanEval达到90%

如果V4在华为芯片上跑出有竞争力的性能,它将是全球第一个不依赖英伟达的前沿AI模型。

黄仁勋近期接受采访时表示,DeepSeek基于华为平台的新模型"对美国来说将是一个糟糕的结果"。

从人员上看,2025年下半年至今,DeepSeek核心研究人员已出现批量出走,覆盖基座模型、推理、OCR、多模态四大核心技术主线。

第一代大语言模型核心作者、全程参与历代模型训练的王炳宣加入腾讯,DeepSeek V3核心作者罗福莉加入小米,R1核心研究员、GRPO算法核心发明者郭达雅加入字节跳动Seed团队,OCR系列核心作者魏浩然确认离职,从幻方时期便加入的老成员、多模态成果核心贡献者阮翀则加入自动驾驶公司元戎启行。

DeepSeek这次100亿美元估值的融资,也有可能还是梁文锋有意为之,他不需要最高价而是需要最少干扰。3亿美元换的是核心团队期权的兑现预期,以及公司估值的锚定。

02

几个月时间中国大模型从1%变成了5%

AI行业中国赛道头部的公司,值美国同赛道头部公司的1%,训练成本是1%,市值也是1%。这个“对标”方式虽然有开玩笑的成分,但实际确实大部分时间如此。

2025年12月底,智谱和MiniMax在港股刚刚上市时,也在验证这个对标方式,智谱和MiniMax市值分别是582亿和610亿港元,相对于当时OpenAI的6000亿美元估值,换算过来就是1%左右。

但是不到4个月过去,智谱和MiniMax的最高市值都在4000亿港元附近。

而OpenAI最新估值8520亿美元(2026年3月刚完成1220亿美元融资),国内大模型公司的估值已经从1%涨到了5%到6%的区间。

要知道在2025年12月底,看完招股说明书,智谱上市第一天,股价还一度跌了。

从招股说明书上看,智谱是一家to B的AI项目公司,收入薄、亏损大。MiniMax虽然账面稍微好看一些,但是很多收入也是靠产品端创新出海。

但是,上市没多久,龙虾的到来改变了逻辑。

这场龙虾浪潮,让大模型的使用方式从chat变成了主动执行的Agent,重构了token消耗的底层逻辑。

就以腾讯的龙虾产品WorkBuddy为例,MiniMax、智谱GLM、Kimi、DeepSeek这些大模型都是核心底层配置,凭借对OpenClaw生态的快速适配,实现了收入的爆发式跃迁。

Kimi曾宣布OpenClaw相关功能上线前20天,带来的新增收入就超过了2025年全年营收总和,按这个增速折算,2026年其收入预期至少是2025年的18倍起步。

MiniMax的MaxClaw上线仅一个月,API调用量就环比暴涨1200%,付费企业客户数较2025年末翻了8倍,2026年3月单月营收直接超过2025年下半年营收总和。

以B端MaaS服务为基本盘的智谱,借龙虾完成了商业化模式的升级,将原本的项目制、年框制付费模式,转化为持续的token流水式付费。2026年Q1,智谱MaaS平台ARR环比增长380%,其中OpenClaw相关业务收入占比超过60%。

本来智谱和MiniMax先上市,给还没上市的Kimi、DeepSeek带来了很大的压力,在一级市场可能后来者不好再融到那么多的钱。

但是现在却是智谱和MiniMax因为已经上市,享受到的更像是“虚假的上涨”,Kimi和DeepSeek确实实打实的能融到更多的钱。

03

市场对大厂却是苛刻的

相较于AI公司从1%到5%的变化,国内的互联网大厂相较于美国互联网大厂的市值差距本身就小很多,在这一轮龙虾热里面对的情况也类似。

相较于纯大模型初创公司凭借龙虾热估值暴涨,市场对于腾讯、阿里这些大厂却是十分苛刻的。

从25年4月贸易战风波之后,中美的大厂很多走了一个“A”字,“A”下来虽然美伊战争的影响,人们也预期会复刻去年的走势,再“A”上去。

但是对大厂,比初创公司更难享受到AI叙事确实是事实。

大厂不是AI做得不好,而是AI带来的收入在总营收里连1%都不到。

腾讯也好,阿里也好,它们就是要被用传统的财务指标衡量的。AI做得再好,还是靠广告、电商、金融服务撑起营收,市场就会用旧逻辑定价。

纯大模型公司恰恰相反。它们的营收基础薄到可以忽略,这反而成了优势,因为一切都是想象空间。

而且,龙虾效应直接证明了一件事:中国大模型的付费意愿是存在的,大模型公司的收入暴涨是可以持续预期的。收入曲线一旦往上走,原来的估值框架就整个松动了。

大厂也有大厂的优势,那就是家底足够厚。

大模型公司的市值需要一个个的龙虾来支撑,毕竟上市之后的市值是二级市场情绪与资金共识堆砌的纸面数字,而非牢不可破的价值底线。

一旦新的技术叙事断档、商业化增长不及预期,叠加解禁期的流动性冲击,虚高的市值就可能面临断崖式回调。商汤解禁当日股价单日暴跌超50%,此后即便经营数据改善,市值也较巅峰期缩水超80%。

大厂深厚的家底容错会高很多,比如Meta一代模型落后,还能有机会调整,大厂自带的十亿级C端用户场景、百万级B端企业客户资源,在AI入口争夺中优势更大。

04

尾声

再回到DeepSeek,我们当然期待V4再能带来颠覆性的创新,但是AI圈如今的竞争烈度,DeepSeek还想做扫地僧基本不太可能。

Anthropic过去3个月上线了70多个新功能,昨天上线的Kimi K2.6把Agent Swarm从100个扩展到300个,在4000步并行执行里塑造自己"Agent OS"的定位。

大模型的迭代周期早就从半年压缩到3个月,还在继续压缩。

DeepSeek不可能靠着过去的成就躺赢,每份估值背后都需要技术迭代与商业化兑现支撑。

智谱和MiniMax等国内大模型公司市值从1%到5%,是情绪和龙虾效应的结果。但要想像大厂那样与美国大厂差距进一步拉近需要持续的收入增长。估值游戏,永远只会为真正的技术突破与商业价值买单。

参考:屠龙之术播客、新智元、36Kr

- END -

本文所提及的任何资讯和信息,仅为作者个人观点表达或对于具体事件的陈述,不构成推荐及投资建议。投资者应自行承担据此进行投资所产生的风险及后果。

相关内容 查看全部