企业报道

日均近万亿Token,清华系AI公司趋境科技拿下数亿元融资,在聊天框背后建工厂

 作者：本站编辑  2026-06-07 10:51:34  0

你在聊天框里等AI吐字时，背后其实有一条生产线，趋境科技这轮数亿元Pre-A融资，押的正是这条生产线：把算力稳定转成可用Token，再卖给企业级AI客户

聊天框前台很轻，后台是重工程

普通用户看AI，看到的是一个输入框和一段回答

企业看AI，先看到一串更硬的指标：首字多久出来，每秒吐多少Token，并发一高会不会抖，函数调用能不能稳，结构化输出会不会乱

这就是趋境科技想切进去的地方

这家公司把自己定位为AI Token生产服务商，提出Token as a Service，平台名叫ATaaS

融资的正式披露发生在5月20日，6月5日36氪欧洲站刊发星连资本授权文章，补充了更完整的技术、团队和客户信息

这轮数亿元Pre-A融资由星连资本与华控科技联合领投，弘晖资本、天壕能源、尚势资本、天津仁爱弘盛、杭州福成等机构跟投，老股东高瓴创投继续加注

资金用途很直接：算力储备、底层推理系统、质量保障和企业级Token供给

所谓Token工厂，卖的是稳定出答案

Token正在从计费页面里的单位，变成推理交付里的质量指标

在大模型服务里，Token决定了输入怎么被模型理解，输出怎么被模型生成，成本怎么被计算，延迟怎么被感知

一个模型再强，如果第一句话等太久、生成速度忽快忽慢、表格和JSON经常出错、函数调用不可靠，企业就很难把它接进真实业务

趋境科技的ATaaS要解决的正是这类后台问题

它选择少数高生产力模型做深度优化，目标是把每次调用做得更稳

公开材料里有一组很关键的指标：更稳定的TTFT、30至50 TPS高速级输出、稳定结构化输出、可靠函数调用和可预测服务质量

对普通用户来说，这些词可以翻译得更简单

TTFT就是你发出问题后，AI第一个字出来要多久

TPS就是AI每秒能吐出多少Token

函数调用就是AI能不能稳定调用工具、查系统、改表格、跑业务流程

这家公司目前给出的几组硬数字

指标	公开信息	读者可以怎么理解
融资规模	数亿元Pre-A轮	国内AI推理基础设施仍有资本加注
平台定位	ATaaS，高效能AI Token生产服务平台	把模型输出做成可运营服务
日均处理量	近万亿Token	已经进入高并发生产环境
输出速度	30至50 TPS高速级输出	影响用户等待时间和产品体感
客户口径	智谱GLM、月之暗面Kimi等企业级客户	服务对象靠近国内头部模型生态
技术生态	KTransformers、Mooncake、SGLang、vLLM、NVIDIA Dynamo等	已进入推理系统工程层面

这张表说明，趋境科技讲的是AI基础设施里的推理交付

它更像站在模型公司、企业应用和算力资源之间，把底层推理链路变成可交付产品

清华高性能计算团队，是这家公司最强的故事线

趋境科技成立时间不长，故事里最有分量的是清华高性能计算和推理系统背景

公开材料显示，公司背靠清华大学高性能计算研究所二十余年技术积累，并已完成清华大学相关技术成果作价增资入股流程

相关科研团队覆盖高性能计算、并行与分布式系统、存储系统、智能算力系统和大模型推理基础设施

创始人兼CEO艾智远是清华计算机博士

董事长任旭阳是百度早期创业元老，曾牵头创立爱奇艺、一点资讯、海致、News Break等公司

这让趋境科技的叙事有两层：一层是科研成果转化，一层是企业级AI基础设施商业化

技术生态里最容易被开发者感知的是KTransformers

KTransformers官网介绍，它用CPU/GPU异构计算，让100B以上参数模型可以在更低显存条件下本地运行，并支持DeepSeek、Kimi、GLM、Qwen、MiniMax等主流模型

这类开源项目会给公司带来开发者声量，也会帮助外界理解它到底在做哪一层基础设施

国内AI竞争，开始从模型榜单落到推理交付

过去一年，国内AI行业很容易被模型发布、榜单分数和价格战牵着走

真正进入企业生产后，另一张账会浮出来

客户要的是每天成千上万次调用都能稳定返回

客服、金融风控、医疗问答、网络安全、办公Agent、代码生成，都不能只看模型名字

它们要看延迟、吞吐、可靠性、成本、权限、审计、私有化和故障恢复

趋境科技这轮融资的信号就在这里：AI基础设施正在从“谁有大模型”转向“谁能把大模型稳定交付给业务”

这会给中国AI公司带来一类新机会

前台模型继续竞争能力，后台公司竞争成本、速度和稳定性

当用户对AI的要求从“能回答”提高到“回答得快、回答得稳、能接进业务”，Token工厂就有了自己的市场位置

这门生意还要证明长期毛利

Token工厂听起来很顺，难点也很现实

第一，算力仍是重资产，平台要持续拿到稳定资源

第二，客户需求变化很快，今天优化Kimi、GLM、Qwen、MiniMax，明天可能要适配新的模型架构和Agent工作流

第三，企业客户愿意为稳定性付费，但会持续压成本

第四，模型公司自己也会做推理优化，外部基础设施公司必须证明自己能长期提供更好的效率和服务质量

趋境科技拿到钱之后，要交的作业已经很清楚

它要证明高品质Token可以规模化生产，也可以规模化赚钱

如果这件事跑通，大模型产业链里会多出一个更清晰的位置：有人做模型，有人做应用，也有人专门把每一次AI回答变成稳定产能

ref36氪欧洲站｜星连资本被投企业趋境科技完成数亿元Pre-A轮融资，加速建设高品质AI Token生产基础设施｜2026-06-05投资界｜趋境科技完成数亿元Pre-A轮融资，加速建设高品质AI Token生产基础设施｜2026-05-20DoNews｜趋境科技完成数亿元Pre-A轮融资加码AI Token生产｜2026-05-20KTransformers官网｜Low-VRAM, Full-Precision Inference｜访问日期2026-06-07本文基于公开融资信息、公司授权发布材料、项目官网及公开技术资料整理分析，不作为投资依据、企业采购依据或技术选型结论；趋境科技平台调用量、客户、速度和技术能力以公司及相关项目后续公开披露为准

企业报道

日均近万亿Token,清华系AI公司趋境科技拿下数亿元融资,在聊天框背后建工厂

聊天框前台很轻，后台是重工程

所谓Token工厂，卖的是稳定出答案

这家公司目前给出的几组硬数字

清华高性能计算团队，是这家公司最强的故事线

国内AI竞争，开始从模型榜单落到推理交付

这门生意还要证明长期毛利

相关内容查看全部 

2026年6月1日中小

【企业贷款】六十

创业公司融资全周

【融资动态】量子

风口之上的OPC金

硬氪首发 | AI芯

省税指南|中小企

账改对,钱到位!不

低利率诱惑下,中

纳税=隐形资产!吃

日均近万亿Token,清华系AI公司趋境科技拿下数亿元融资,在聊天框背后建工厂

聊天框前台很轻，后台是重工程

所谓Token工厂，卖的是稳定出答案

这家公司目前给出的几组硬数字

清华高性能计算团队，是这家公司最强的故事线

国内AI竞争，开始从模型榜单落到推理交付

这门生意还要证明长期毛利

相关内容 查看全部 

相关内容查看全部 