
先说个感触。
去年我们谈DeepSeek R1的时候,关键词是“震惊”:560万美元训练出对标GPT-4o的模型,硅谷慌了,英伟达股价晃了。
今年DeepSeek V4发布,行业更多的是期待。不是不震撼,这一串数字:1.6万亿参数、100万token上下文、推理能耗压到V3.2的27%,任何一个拿出来都很能打,只是大家内心认为DeepSeek就应该很牛,就应该有惊艳之举,所以就会有更多的期待。
这两天有不少媒体对这一事件做了解读,我也在第一时间写了一篇解读文章,从技术突破带来的产业变革视角做了阐述,有兴趣的可以看看:
DeepSeek V4上昇腾:中国AI产业的技术底座,正在从“单极依赖”走向“多元共存”
今天我想聊的不是V4跑分有多高,而是想聊另一件容易被忽视掉的事情:就在V4发布的前不久,有报道说DeepSeek正在启动首次外部融资,目标估值100亿美元以上,而且阿里和腾讯都在接触。
大家或许会和我一样好奇:一家长期“不差钱”的公司——母公司幻方量化管理规模超700亿,每年利润数亿美元往里输血——突然开始向外部资本敞开大门。
为什么是现在?DeepSeek到底发生了什么?
DeepSeek为什么之前不融资?因为不需要。母公司幻方量化是它的提款机,R1那代模型训练成本号称只有560万美元,靠自有资金完全撑得住。
但V4就不一样。万亿参数意味着指数级增长的算力消耗。而且DeepSeek这次做了一个非常激进的决策:V4要同时适配两条硬件路线——华为昇腾950PR和英伟达Blackwell。一条是国产替代的战略方向,一条是应对出口管制的备选方案。两条路线并行跑,成本直接翻倍。
这还不算完。DeepSeek在乌兰察布启动自建数据中心,一家做软件起家的公司,开始自己搞机房了。烧钱的速度已经不是内部输血能跟上的。
表面上看,这些烧钱的地方就是融资的充分注脚,但如果我们把最近这一年DeepSeek核心研发人员的流失情况放到一块来思考,就会发现,这次的融资还有一个很关键的目的,解决人的问题。
我给大家先简单回顾一下,从去年下半年到现在,至少有5个核心研究员被其他大厂挖走了。
罗福莉去了小米,雷军亲招,千万年薪。郭达雅去了字节Seed团队,传说期权接近一个亿。他是GRPO算法的发明者——R1的技术底座就是他搞出来的。
王炳宣去了腾讯,阮翀去了元戎启行当首席科学家,魏浩然春节前后离职。
DeepSeek总共不到200人,核心基模架构团队只有小几十个。这个体量的团队,走任何一个关键人物都是伤筋动骨。
这些才是DeepSeek真正的隐忧!
此时融资的意义就非比寻常了,通过融资不但能解决庞大的资金需求,还能让期权变得有价值,更有利于留住人才!
期权这个东西,在没有外部融资的时候就是一张白条。公司估值多少、什么时候能兑现、兑现了值多少钱——全是未知数。对于一个不到200人的团队,当隔壁字节、腾讯、小米拿着明确的现金和上市期权来挖人的时候,你连一个具体的数字都说不出口,怎么留人?
虽然不能说这些核心人才是因为这些因素离开的,但如果当时公司已经有明确的期权计划、有上市路径,至少在被挖的时候,他们权衡时的会多一份的考量。
那这件事跟普通AI从业者有什么关系?关系还真不小。
DeepSeek V4的发布,我个人觉得对从业者最大的信号是技术变革带来的就业趋势变化。不是“要学新框架了”,而是一个更根本的变化:纯算法研究的溢价在往下走,工程化落地的人在涨价。
为什么?
因为开源模型已经把算法能力拉到很高的水位了。V4很多指标确实还落后GPT-5.4和Gemini 3.1,但差距正在缩小。当顶尖模型开源、价格打到地板价,单靠“我能训出好模型”已经不够有竞争力了。
真正稀缺的变成另一批人:能把模型从论文变成产品、能在国产芯片上跑通全链路、能把推理成本压到商业可接受范围内的人。
从我们猎头的数据更是验证了这个判断。懂模型部署、推理优化、昇腾适配的人,跳槽涨幅普遍20%-50%。做纯算法的反而没那么好跳了——不是没需求,是供给开始跟上来。
如果你想抓住这波机会,三个方向最值得看:
推理优化和模型部署: 量化、剪枝、蒸馏、分布式推理。不是让你从头写,是能调通、能压成本。
国产算力适配: CANN框架、昇腾编程、精度对齐。现在上手等于提前占坑。
AI Agent开发: V4的Agent能力已经很强了,但把Agent真正落地到业务里,需要大量工程化人才。
有个朋友做AI infra的,去年还在犹豫要不要学昇腾。今年他的原话是:“幸亏学了,现在找工作起薪涨了30%。”
DeepSeek V4是一个分水岭,但分的不只是技术,是人。
我们已然看到中国AI产业正从“英伟达绝对主导”转向“两条路线并行”,那人才市场必然会经历一轮重新洗牌。短期内,能同时玩转两套生态的人最值钱;长期来看,国产算力生态如果跑起来,会在整个产业里催生出一批新的技术岗位和职业路径。
DeepSeek的融资也让我们感受到,AI产业的竞争已经从实验室转向了工程现场,从模型参数转向了人才密度。
坦白说,我看到的不是一个“国产算力碾压英伟达”的爽文,而是一个不到200人的团队,在拼命撑住中国最强开源模型这面旗。
他们能不能撑住,取决于三件事:钱能不能融到、人能不能留住、华为的芯片能不能按时供货。这三件事,目前没有一件是确定的。
如果你是一个AI从业者,这可能是未来两三年最大的结构性机会。因为每一次技术栈切换,都会重新分一次蛋糕。上一次是深度学习框架从Caffe、Theano切到PyTorch,不少人抓住了那一波。
而这一次是从CUDA切到CANN,窗口刚打开,希望你已经上车了!
James想和你说的:
近20年的职业生涯,我见过太多"本可以更好"的故事——
有人因为选错赛道,35 岁就被淘汰;
有人因为不敢跳槽,错过了行业爆发的红利期;
也有创业者因为招错核心成员,白白浪费了融资窗口期。
这些遗憾,其实都可以避免。
这就是为什么我要做"James职猎空间"——
不仅仅只是为了分享信息,
更是想成为你职业路上的"避坑指南"和"加速器"。
【如果你需要】
? 企业方:AI/机器人/智能制造领域的人才地图、招聘服务、薪酬调研
?求职者:职业规划咨询、简历优化、面试模拟、内推通道
欢迎随时联系我。
哪怕只是聊聊行业趋势,我也很乐意。
请关注公众号:James职猎空间
公众号后台留言,24 小时内回复
职场没有标准答案,但有更优解。
而我,恰好见过很多种"解法"。
