发布信息

日均近万亿Token,清华系AI公司趋境科技拿下数亿元融资,在聊天框背后建工厂

作者:本站编辑      2026-06-07 10:51:34     0
日均近万亿Token,清华系AI公司趋境科技拿下数亿元融资,在聊天框背后建工厂

你在聊天框里等AI吐字时,背后其实有一条生产线,趋境科技这轮数亿元Pre-A融资,押的正是这条生产线:把算力稳定转成可用Token,再卖给企业级AI客户

聊天框前台很轻,后台是重工程

普通用户看AI,看到的是一个输入框和一段回答

企业看AI,先看到一串更硬的指标:首字多久出来,每秒吐多少Token,并发一高会不会抖,函数调用能不能稳,结构化输出会不会乱

这就是趋境科技想切进去的地方

这家公司把自己定位为AI Token生产服务商,提出Token as a Service,平台名叫ATaaS

融资的正式披露发生在5月20日,6月5日36氪欧洲站刊发星连资本授权文章,补充了更完整的技术、团队和客户信息

这轮数亿元Pre-A融资由星连资本与华控科技联合领投,弘晖资本、天壕能源、尚势资本、天津仁爱弘盛、杭州福成等机构跟投,老股东高瓴创投继续加注

资金用途很直接:算力储备、底层推理系统、质量保障和企业级Token供给

所谓Token工厂,卖的是稳定出答案

Token正在从计费页面里的单位,变成推理交付里的质量指标

在大模型服务里,Token决定了输入怎么被模型理解,输出怎么被模型生成,成本怎么被计算,延迟怎么被感知

一个模型再强,如果第一句话等太久、生成速度忽快忽慢、表格和JSON经常出错、函数调用不可靠,企业就很难把它接进真实业务

趋境科技的ATaaS要解决的正是这类后台问题

它选择少数高生产力模型做深度优化,目标是把每次调用做得更稳

公开材料里有一组很关键的指标:更稳定的TTFT、30至50 TPS高速级输出、稳定结构化输出、可靠函数调用和可预测服务质量

对普通用户来说,这些词可以翻译得更简单

TTFT就是你发出问题后,AI第一个字出来要多久

TPS就是AI每秒能吐出多少Token

函数调用就是AI能不能稳定调用工具、查系统、改表格、跑业务流程

这家公司目前给出的几组硬数字

指标
公开信息
读者可以怎么理解
融资规模
数亿元Pre-A轮
国内AI推理基础设施仍有资本加注
平台定位
ATaaS,高效能AI Token生产服务平台
把模型输出做成可运营服务
日均处理量
近万亿Token
已经进入高并发生产环境
输出速度
30至50 TPS高速级输出
影响用户等待时间和产品体感
客户口径
智谱GLM、月之暗面Kimi等企业级客户
服务对象靠近国内头部模型生态
技术生态
KTransformers、Mooncake、SGLang、vLLM、NVIDIA Dynamo等
已进入推理系统工程层面

这张表说明,趋境科技讲的是AI基础设施里的推理交付

它更像站在模型公司、企业应用和算力资源之间,把底层推理链路变成可交付产品

清华高性能计算团队,是这家公司最强的故事线

趋境科技成立时间不长,故事里最有分量的是清华高性能计算和推理系统背景

公开材料显示,公司背靠清华大学高性能计算研究所二十余年技术积累,并已完成清华大学相关技术成果作价增资入股流程

相关科研团队覆盖高性能计算、并行与分布式系统、存储系统、智能算力系统和大模型推理基础设施

创始人兼CEO艾智远是清华计算机博士

董事长任旭阳是百度早期创业元老,曾牵头创立爱奇艺、一点资讯、海致、News Break等公司

这让趋境科技的叙事有两层:一层是科研成果转化,一层是企业级AI基础设施商业化

技术生态里最容易被开发者感知的是KTransformers

KTransformers官网介绍,它用CPU/GPU异构计算,让100B以上参数模型可以在更低显存条件下本地运行,并支持DeepSeek、Kimi、GLM、Qwen、MiniMax等主流模型

这类开源项目会给公司带来开发者声量,也会帮助外界理解它到底在做哪一层基础设施

国内AI竞争,开始从模型榜单落到推理交付

过去一年,国内AI行业很容易被模型发布、榜单分数和价格战牵着走

真正进入企业生产后,另一张账会浮出来

客户要的是每天成千上万次调用都能稳定返回

客服、金融风控、医疗问答、网络安全、办公Agent、代码生成,都不能只看模型名字

它们要看延迟、吞吐、可靠性、成本、权限、审计、私有化和故障恢复

趋境科技这轮融资的信号就在这里:AI基础设施正在从“谁有大模型”转向“谁能把大模型稳定交付给业务”

这会给中国AI公司带来一类新机会

前台模型继续竞争能力,后台公司竞争成本、速度和稳定性

当用户对AI的要求从“能回答”提高到“回答得快、回答得稳、能接进业务”,Token工厂就有了自己的市场位置

这门生意还要证明长期毛利

Token工厂听起来很顺,难点也很现实

第一,算力仍是重资产,平台要持续拿到稳定资源

第二,客户需求变化很快,今天优化Kimi、GLM、Qwen、MiniMax,明天可能要适配新的模型架构和Agent工作流

第三,企业客户愿意为稳定性付费,但会持续压成本

第四,模型公司自己也会做推理优化,外部基础设施公司必须证明自己能长期提供更好的效率和服务质量

趋境科技拿到钱之后,要交的作业已经很清楚

它要证明高品质Token可以规模化生产,也可以规模化赚钱

如果这件事跑通,大模型产业链里会多出一个更清晰的位置:有人做模型,有人做应用,也有人专门把每一次AI回答变成稳定产能

ref36氪欧洲站|星连资本被投企业趋境科技完成数亿元Pre-A轮融资,加速建设高品质AI Token生产基础设施|2026-06-05投资界|趋境科技完成数亿元Pre-A轮融资,加速建设高品质AI Token生产基础设施|2026-05-20DoNews|趋境科技完成数亿元Pre-A轮融资加码AI Token生产|2026-05-20KTransformers官网|Low-VRAM, Full-Precision Inference|访问日期2026-06-07本文基于公开融资信息、公司授权发布材料、项目官网及公开技术资料整理分析,不作为投资依据、企业采购依据或技术选型结论;趋境科技平台调用量、客户、速度和技术能力以公司及相关项目后续公开披露为准

相关内容 查看全部