发布信息

给算法划定边界—— AI 制药企业的行业治理之思

作者:本站编辑      2026-05-31 10:36:45     0
给算法划定边界—— AI 制药企业的行业治理之思

行业观点文章· 2026 年

过去十年,人工智能从药物发现流程的边缘工具,走到了流程的中枢。蛋白结构预测、生成式分子设计、抗体与环肽的从头设计、临床试验的患者分层与终点预测——这些过去依赖经验和漫长湿实验循环的环节,如今越来越多地由模型先行给出假设。作为一家长期在 AI 驱动药物发现一线的企业,圆壹智慧在抗体、GPCR 靶点、环肽、PROTAC、药物-染料偶联物等多个管线上的实践让我们确信:技术红利是真实的,但行业尚未为这份红利配齐应有的规则。

一个没有规则的高速行业,迟早会用一两次代价高昂的失败,替自己写下规则。与其被动等待那一刻,不如由真正理解技术与药物双重逻辑的从业者,主动提出一套可执行、可被监管者与投资者共同接受的框架。这篇文章正是基于圆壹智慧多年跨国研发与合作的经验,提出我们认为 AI 制药行业当下最需要的几条规则。

一、为什么 AI 制药需要自己的规则

制药业本就是受监管最严格的行业之一,而软件与人工智能行业则以快速迭代、容错试错为文化底色。当两者结合,真正的问题不是“要不要监管”,而是现有的两套规则都不完全适用。药品监管为湿实验和临床证据而设计,它无法回答“一个模型给出的分子假设可信度有多高”;而通用 AI 治理框架关注偏见、隐私与透明度,却没有为“一个错误预测可能进入人体试验”这一后果设定足够的安全裕度。

我们在实际项目中反复遇到这种规则真空。以下三个特征,使 AI 制药区别于一般的 AI 应用,也使它必须有自己的专属规则:

1. 错误的代价不对称且滞后

一个推荐系统推错商品,后果在分钟级显现且可逆。一个 AI 模型推错一个先导化合物,后果可能在两三年后的临床阶段才暴露,届时已消耗数千万美元与大量患者参与的机会成本。错误的代价不仅巨大,而且与决策之间存在长达数年的时间差——这意味着行业不能依赖“事后纠错”,必须依赖“事前规范”。

2. 模型的“知识”来自有偏差的历史数据

公开的化学与生物数据,系统性地偏向已被研究透彻的靶点、可成药的化学空间、以及特定人群的临床数据。一个在这种数据上训练的模型,会自信地在它“熟悉”的区域给出预测,而在罕见病靶点、新颖骨架、代表性不足的人群上悄然失准。在罕见病研究中,这一点尤为致命——而这恰恰是 AI 本应发挥最大价值的领域。

3. 价值链长,责任容易稀释

一个 AI 制药项目,往往横跨数据供应商、算法平台、CRO、临床团队、监管申报多个主体,且常常跨越国界。当一个由模型驱动的决策最终出了问题,“这是谁的责任”很容易在链条中被稀释为“不是任何单一方的责任”。规则的首要作用,就是把责任重新钉回到每一个环节。

二、我们建议的七条行业规则

以下七条规则,不是抽象的伦理宣言,而是我们认为可以写进企业内部 SOP、写进合作协议、并最终被行业组织与监管机构采纳的可执行条款。它们按“一个 AI 预测从产生到进入临床”的生命周期排列。

规则一:计算必须服务于 TPP 驱动的多目标优化,而非单点突破或盲目筛选

AI 在药物发现中的价值,常被简化为“在某个指标上做出突破”,或“把分子库筛得更快、更大”。但真实世界里的药物从来不是任何单一指标的冠军——它是在活性、选择性、成药性、安全性、代谢稳定性、可合成性乃至成本等一组相互冲突的目标之间,求得的最优平衡。一个把亲和力推到极致、却在溶解度或毒性上失守的分子毫无价值;而单纯的高通量筛选,本质上只是在既有空间里做穷举,并不回答“如何同时满足多个彼此矛盾的约束”这一真正的难题。

因此我们主张:每一个项目在动用算力之前,都应先明确定义其目标产品特征(Target Product Profile, TPP),并据此把计算组织成一场针对性的多目标优化,而非对某个孤立指标的单点冲刺。TPP 规定了这款药“最终要成为什么样”——给药途径、适应症、有效性与安全性的底线、相对竞品的差异化——它把抽象的“更好的分子”翻译成一组可计算、可权衡的具体约束。脱离 TPP 的计算,无论多么精巧,都可能在错误的方向上高效前进;而 AI 真正不可替代的价值,恰恰在于它能在这样一个高维、相互制约的目标空间里,完成人力难以穷尽的协同寻优。

规则二:模型卡与数据来源的强制披露

任何用于药物发现关键决策的 AI 模型,都应附带一份标准化的“模型卡”,如同药品的说明书。它至少应说明:训练数据的来源与时间范围、已知覆盖薄弱的化学或生物空间、模型的预期用途与明确的非预期用途、以及在独立测试集上的性能区间。

这条规则的意义在于,它把“模型适用边界”从研发者的隐性知识,变成了合作方与监管方可见的显性信息。在跨国合作中,一方常常无法核验另一方模型的训练细节;一份标准化模型卡,是建立技术信任最低成本的方式。

规则三:预测必须带不确定度,且区分内插与外推

一个只输出“这个分子活性很高”的模型是不够的;它必须同时回答“我对这个判断有多确定”,并明确指出该预测是落在训练数据的内插区域,还是外推到了模型未充分学习的空间。

这一区分在实践中价值巨大。对于内插区域的高置信预测,团队可以快速推进;对于外推区域的预测,无论模型给出的数字多么诱人,都应被视为“需要湿实验优先验证的假设”而非结论。把这条规则写进流程,等于为整个项目装上了一个防止“过度相信模型”的刹车。

规则四:湿实验闭环验证不可被算法替代

AI 可以极大压缩需要进入湿实验的候选数量,但不能取消湿实验这一环节本身。任何进入下一阶段(尤其是进入动物或人体研究)的 AI 生成候选,都必须经过独立的实验验证,且验证结果——无论成败——都应回流到模型用于再训练。

我们坚持把失败的验证数据视为与成功数据同等重要的资产。一个只学习成功案例的模型,会逐渐丧失对失败模式的判断力。规则应明确要求:阴性结果必须被记录、被结构化、被用于模型迭代,而不是被丢弃。

规则五:可成药性与安全性的预测,标准应高于活性预测

行业有一种自然的注意力偏差:活性、亲和力这类“正向”指标容易被优化和展示,而毒性、脱靶、成药性这类“否决型”指标则相对被轻视。但药物失败的主因恰恰常在后者。

我们建议,规则应要求对安全性相关预测采用更保守的置信阈值和更严格的验证标准。当一个模型预测某分子“可能存在心脏毒性风险”时,即使置信度不高,也应触发强制的实验排查;宁可错杀一个候选,不可放过一个风险。

规则六:责任链条必须可追溯到具体环节

每一个由 AI 参与的关键决策,都应留下记录:使用了哪个版本的模型、基于哪批数据、由谁审核、做出了什么判断。当项目横跨多个实体与国界时,这条“决策日志”就是事后复盘与责任界定的唯一可靠依据。

这并非为了追责而追责。一个清晰的责任链条,反而能保护诚实的从业者——它让“我们已按规范尽到注意义务”成为一个可被证明的事实,而不是一句无法验证的辩解。在涉及跨境合作与投资尽调的场景中,可追溯性本身就是企业信誉的一部分。

规则七:面向代表性不足人群与罕见病的公平性要求

如果 AI 制药只是更快地服务于已被充分研究的靶点和人群,它会放大而非缩小现有的健康不平等。规则应鼓励——并在可能时要求——披露模型在不同人群、不同罕见病领域的性能差异,并将缩小这种差异作为行业共同的目标之一。

这一条对我们而言不只是合规要求。AI 在数据稀缺领域的真正价值,正在于它有潜力让罕见病研究变得经济可行。一套好的规则,应当主动把技术的红利引向最需要的地方。

三、如何评价模型的贡献与价值

规则解决的是“不能做错什么”,而评价体系解决的是“做对了多少”。一套行业规则若不配套一套公允的价值评价方法,就会出现一个尴尬的局面:合规成为纯粹的成本,而真正创造价值的模型得不到应有的认可。在我们与投资方、合作伙伴的反复沟通中发现,行业普遍缺少一个能把“模型到底贡献了什么”讲清楚的语言。

我们认为,评价一个药物发现模型的价值,应当跳出“准确率”这类单一技术指标,从两个真正决定行业未来的维度入手:一是它是否帮助产生了更好的分子,二是它是否以更高的能源效率完成了这件事。前者是“做对了什么”,后者是“用多大代价做对的”。

1. 维度一:是否产生了更好的分子

“更好的分子”不是一个模糊的赞美,它可以被拆解为一组可衡量、可对比的贡献。我们建议从以下几个角度评价模型在分子层面的真实价值,而非停留在论文式的基准测试分数上:

终点质量,而非中间指标。模型的价值最终要由它推动的分子在湿实验、乃至临床中的表现来检验。一个在内部基准上得分很高、但产出的候选始终无法通过实验验证的模型,其真实贡献为零。评价应锚定可成药性、选择性、安全性窗口这些终点指标,而非仅看亲和力预测的相关系数。

相对基线的增量。正确的问题不是“模型产出的分子好不好”,而是“比不用模型、或用上一代方法,好了多少”。这要求评价时必须保留一个诚实的对照基线——传统的高通量筛选、专家经验设计或既有模型——并量化命中率、苗头到先导的转化率上的差异。

新颖性与可专利空间。一个只会在已知化学空间里重新组合的模型,价值有限;真正有贡献的模型,能够给出结构新颖、却仍然合理可成药的骨架。新颖性应当被量化(例如与已知化合物库的结构距离),并与可成药性联合评价——单纯的新颖而不可成药没有意义。

周期压缩。在分子质量相当的前提下,模型把“从靶点到可信先导化合物”的时间从数年压缩到数月,这本身就是巨大的价值。时间是药物研发中最昂贵的资源,周期的缩短应当被显式计入模型的贡献。

失败的提前暴露。一个能在早期就准确否决掉注定失败的候选的模型,贡献不亚于产出好分子。少走的弯路、省下的湿实验,同样是价值。评价体系不应只奖励“找到好的”,也应奖励“及早排除坏的”。

把这几个角度合起来,一个模型在分子维度的贡献可以被表述为一句可被核验的话:在保留诚实基线的前提下,它以更短的周期、更高的命中率,产出了结构更新颖且终点指标更优的候选,并提前排除了更多注定失败的方向。这样的表述,既能让投资者理解价值,也能让合作方核验真伪。

2. 维度二:能源效率与计算成本

行业在谈论 AI 制药时,几乎只谈它产出什么,很少谈它消耗什么。但随着模型规模的膨胀,训练与推理的算力、电力和水资源消耗已不再是可以忽略的脚注。一个模型若以惊人的能耗换取边际的性能提升,它在商业上和环境上都未必是“更好”的。我们认为,能源效率应当被正式纳入模型价值的评价框架。

具体而言,评价模型的能源效率可以从以下几个层面展开:

单位科学产出的能耗。真正有意义的指标不是模型训练消耗了多少度电,而是“每产生一个经实验验证的可信先导化合物,平均消耗了多少算力与能源”。这把能耗和科学产出挂钩,避免了“大模型一定更好”的误区——一个更小、更专精的模型若能以十分之一的能耗达到相近的产出,它在这个维度上显然更优。

训练成本与推理成本分开核算。训练是一次性的大额投入,推理则是随每一次使用累积的持续成本。一个训练昂贵但推理极廉的模型,与一个训练便宜但每次调用都很重的模型,适用的场景完全不同。评价时应分别披露,而非混为一谈。

与湿实验的能耗对比。AI 的一个核心价值主张,是用计算替代部分湿实验。这个主张应当被诚实地核算:模型筛选掉一万个分子所消耗的能源,与真正在实验室合成、测试这一万个分子所需消耗的能源、试剂与人力相比,究竟节省了多少。只有算清这笔账,“AI 更绿色”才是一个有依据的结论而非口号。

效率的边际曲线。模型性能的提升往往伴随着能耗的非线性增长——最后百分之几的性能提升,可能要付出成倍的算力代价。评价应关注这条边际曲线,帮助团队判断:在哪个点上,继续追加算力已不再划算。

把能源效率纳入评价,并非要给技术进步设置障碍,恰恰相反——它会激励行业去开发更精巧、更专精、而非单纯更大的模型。在药物发现这种垂直领域,一个深度理解化学与生物先验知识的小模型,常常比一个通用的巨型模型更高效。让能源效率成为一个被正式评价的维度,就是让这种“巧劲”得到应有的回报。

3. 两个维度合起来:一张诚实的价值记分卡

分子贡献回答“创造了多少价值”,能源效率回答“用多大代价创造的”,二者相除,才是一个模型真正的投入产出比。我们建议,无论是企业内部的模型选型,还是对外的价值沟通,都应当用一张同时包含这两个维度的“价值记分卡”来呈现:一边是经验证的分子产出与周期压缩,另一边是单位产出的能耗与计算成本。

这张记分卡的意义在于,它让“模型的价值”从一个靠演示和叙事支撑的模糊印象,变成一个可被投资者尽调、可被合作方核验、可被团队内部用于决策的事实。它也与本文前述的七条规则相互呼应:规则保证模型不会把我们带向危险的方向,而记分卡保证我们能识别出真正值得投入的模型。一个成熟的行业,既需要前者的刹车,也需要后者的标尺。

四、规则由谁来定,如何落地

一套规则若只停留在纸面,便毫无意义。基于我们参与跨国研发、临床合作与投资尽调的经验,我们认为规则的落地需要四类主体各司其职:

•企业自律先行。上述七条规则中的大部分,无需等待外部立法即可写进企业的内部标准操作流程与合作协议。领先企业主动采用,本身就会形成事实标准,并为后续监管提供经过验证的模板。

行业组织制定共识标准。模型卡的字段、不确定度的报告格式、决策日志的最低要求——这些技术细节最适合由行业联盟以共识标准的形式确定,使不同企业的实践可以互认、互查。

监管机构设定底线与审查接口。监管不必、也不应去规定企业用什么模型,但应明确:当 AI 参与的证据进入申报材料时,需要附带哪些信息才可被受理。把监管的着力点放在“接口”而非“内部实现”,既守住安全底线,又不扼杀创新。

投资方将合规作为尽调维度。资本对行为有强大的塑造力。当投资者在尽职调查中开始系统性地审视一家 AI 制药企业是否具备模型治理能力,合规就从成本项变成了估值项,规则的落地便有了最直接的商业动力。

我们尤其想强调跨境维度。AI 制药天然是全球化的:数据、算力、靶点知识、临床资源分布在不同国家。如果各地的规则彼此割裂、互不承认,跨国合作的成本将高到足以抵消技术本身带来的效率。因此,在制定本地规则的同时,保持与国际框架的可对接性,是每一个参与者都应纳入考量的长期问题。

结语:规则是这个行业走向成熟的标志

在任何一个新兴技术行业,规则的出现都不是创新的对立面,而是它走向成熟的标志。航空业、核能业、乃至传统制药业本身,都是在经历了规则的建立之后,才真正赢得了社会的信任,也才真正释放了规模化的价值。

AI 制药正处在这样一个节点。技术已经足够强大,强大到它的错误也足够昂贵。我们这些身处一线、既懂算法也懂药物的从业者,有责任不把规则的制定权完全让渡给事故,或让渡给不了解技术细节的旁观者。本文提出的七条规则未必完善,但我们相信它指向了正确的方向:让每一个 AI 预测都带着它的边界与不确定度,让每一个关键决策都留下可追溯的痕迹,让技术的红利优先流向最需要被治愈的人。

圆壹智慧愿意成为这套规则的早期实践者,也愿意与行业同仁、监管机构和投资伙伴一起,把它打磨成真正可被广泛采纳的行业共识。为 AI 制药立规,最终是为了让这个行业值得被信任——而值得信任,是它能够长久走下去的唯一前提。

潘麓蓉博士

圆壹智慧(Ainnocence Inc.)创始人兼首席执行官

本文为行业观点文章,代表作者个人及企业立场,不构成监管或法律意见。

相关内容 查看全部