成立2.5年,24人团队,融资17亿!这家AI芯片公司为何如此疯狂?
当所有人都在追求"通用"时,这家公司选择了"极致专用"。
就在上周,一家名不见经传的加拿大AI芯片公司宣布完成1.69亿美元融资,瞬间引爆科技圈。这家公司叫 Taalas,成立仅2.5年,团队只有24人,却声称做出了"世界上最快"的AI推理芯片。
这到底是怎么回事?

从GPU到"硬连线"
在聊Taalas之前,我们先回顾一下主流AI芯片的思路。
无论是NVIDIA的GPU还是Groq、Cerebras的定制芯片,它们都有一个共同点:可编程。一张芯片可以跑Llama,可以跑GPT,可以跑任何Transformer模型。
但Taalas觉得这样不够快。
他们的思路非常极端:干脆把模型直接刻在芯片里。不是软件模拟,不是指令优化,而是用物理方式——把神经网络的权重变成芯片上的晶体管布局。
这就是他们所谓的"Hard-wiring"(硬连线)技术。

速度与代价
效果怎么样?
Taalas官方数据:
- • 每用户 17,000 tokens/秒
- • 比 NVIDIA H100 快 10倍
- • 构建成本低 20倍
- • 功耗低 10倍
这是什么概念?你用 NVIDIA GPU 跑一个模型的时间,Taalas 的芯片能跑 10 个。
但代价也很明显:这颗芯片只能跑 Llama 3.1 8B。
想换模型?不好意思,重新造一颗芯片。

为什么这么"疯狂"?
你可能会问:这也太不灵活了吧?
但 Taalas 创始人认为,这恰恰是未来AI应用的趋势。
"当模型足够好时,你不需要灵活性。"
对于大多数企业级AI应用来说,一个模型跑三年五年很正常。既然模型不变,那为什么不把它做得更快?
这就是 Taalas 的核心赌注:专用化才是未来。

疯狂还是革新?
客观来看,Taalas 的路数确实刷新了AI芯片的边界。
| 方案 | 代表玩家 | 可编程性 | 速度 |
|---|---|---|---|
| 通用GPU | NVIDIA | ✓✓✓ | 中 |
| 定制架构 | Groq/Cerebras | ✓✓ | 快 |
| Transformer专用 | Etched | ✓ | 很快 |
| 模型硬化 | Taalas | ✗ | 最快 |
Taalas 把"专用化"推向了极致——不是针对某一类模型,而是针对某一个模型。

写在最后
Taalas 的出现,折射出AI算力竞争的一个新趋势:与其做通用的"万能钥匙",不如做专用的"瑞士军刀"。
当然,这种激进路线能否成功,还需要时间验证。毕竟芯片行业周期长、投入大,1.69亿美元说多不多说少不少。
但有一点是确定的:AI的算力战争,才刚刚开始。
而我们普通人最关心的可能是:什么时候能用上这么快的AI?什么时候本地跑大模型不再是梦想?
快了。

