你在聊天框里等AI吐字时,背后其实有一条生产线,趋境科技这轮数亿元Pre-A融资,押的正是这条生产线:把算力稳定转成可用Token,再卖给企业级AI客户
聊天框前台很轻,后台是重工程
普通用户看AI,看到的是一个输入框和一段回答
企业看AI,先看到一串更硬的指标:首字多久出来,每秒吐多少Token,并发一高会不会抖,函数调用能不能稳,结构化输出会不会乱
这就是趋境科技想切进去的地方
这家公司把自己定位为AI Token生产服务商,提出Token as a Service,平台名叫ATaaS
融资的正式披露发生在5月20日,6月5日36氪欧洲站刊发星连资本授权文章,补充了更完整的技术、团队和客户信息
这轮数亿元Pre-A融资由星连资本与华控科技联合领投,弘晖资本、天壕能源、尚势资本、天津仁爱弘盛、杭州福成等机构跟投,老股东高瓴创投继续加注
资金用途很直接:算力储备、底层推理系统、质量保障和企业级Token供给
所谓Token工厂,卖的是稳定出答案
Token正在从计费页面里的单位,变成推理交付里的质量指标
在大模型服务里,Token决定了输入怎么被模型理解,输出怎么被模型生成,成本怎么被计算,延迟怎么被感知
一个模型再强,如果第一句话等太久、生成速度忽快忽慢、表格和JSON经常出错、函数调用不可靠,企业就很难把它接进真实业务
趋境科技的ATaaS要解决的正是这类后台问题
它选择少数高生产力模型做深度优化,目标是把每次调用做得更稳
公开材料里有一组很关键的指标:更稳定的TTFT、30至50 TPS高速级输出、稳定结构化输出、可靠函数调用和可预测服务质量
对普通用户来说,这些词可以翻译得更简单
TTFT就是你发出问题后,AI第一个字出来要多久
TPS就是AI每秒能吐出多少Token
函数调用就是AI能不能稳定调用工具、查系统、改表格、跑业务流程

这家公司目前给出的几组硬数字
这张表说明,趋境科技讲的是AI基础设施里的推理交付
它更像站在模型公司、企业应用和算力资源之间,把底层推理链路变成可交付产品
清华高性能计算团队,是这家公司最强的故事线
趋境科技成立时间不长,故事里最有分量的是清华高性能计算和推理系统背景
公开材料显示,公司背靠清华大学高性能计算研究所二十余年技术积累,并已完成清华大学相关技术成果作价增资入股流程
相关科研团队覆盖高性能计算、并行与分布式系统、存储系统、智能算力系统和大模型推理基础设施
创始人兼CEO艾智远是清华计算机博士
董事长任旭阳是百度早期创业元老,曾牵头创立爱奇艺、一点资讯、海致、News Break等公司
这让趋境科技的叙事有两层:一层是科研成果转化,一层是企业级AI基础设施商业化
技术生态里最容易被开发者感知的是KTransformers
KTransformers官网介绍,它用CPU/GPU异构计算,让100B以上参数模型可以在更低显存条件下本地运行,并支持DeepSeek、Kimi、GLM、Qwen、MiniMax等主流模型
这类开源项目会给公司带来开发者声量,也会帮助外界理解它到底在做哪一层基础设施
国内AI竞争,开始从模型榜单落到推理交付
过去一年,国内AI行业很容易被模型发布、榜单分数和价格战牵着走
真正进入企业生产后,另一张账会浮出来
客户要的是每天成千上万次调用都能稳定返回
客服、金融风控、医疗问答、网络安全、办公Agent、代码生成,都不能只看模型名字
它们要看延迟、吞吐、可靠性、成本、权限、审计、私有化和故障恢复
趋境科技这轮融资的信号就在这里:AI基础设施正在从“谁有大模型”转向“谁能把大模型稳定交付给业务”
这会给中国AI公司带来一类新机会
前台模型继续竞争能力,后台公司竞争成本、速度和稳定性
当用户对AI的要求从“能回答”提高到“回答得快、回答得稳、能接进业务”,Token工厂就有了自己的市场位置
这门生意还要证明长期毛利
Token工厂听起来很顺,难点也很现实
第一,算力仍是重资产,平台要持续拿到稳定资源
第二,客户需求变化很快,今天优化Kimi、GLM、Qwen、MiniMax,明天可能要适配新的模型架构和Agent工作流
第三,企业客户愿意为稳定性付费,但会持续压成本
第四,模型公司自己也会做推理优化,外部基础设施公司必须证明自己能长期提供更好的效率和服务质量
趋境科技拿到钱之后,要交的作业已经很清楚
它要证明高品质Token可以规模化生产,也可以规模化赚钱
如果这件事跑通,大模型产业链里会多出一个更清晰的位置:有人做模型,有人做应用,也有人专门把每一次AI回答变成稳定产能
