为什么“表征”决定了 AI4S 模型的上限？《AI4S 实战派》首课回顾

魔搭ModelScope社区 · 2026-03-12 10:21:49 发布

AI4S（AI for Science，科学智能）正日益成为科研工作者必须掌握的关键能力与新型科研范式。

3月5日晚，上海科学智能研究院（上智院 SAIS）、复旦大学、魔搭社区、Datawhale 联合策划的《AI4S 实战派》正式启航。首场直播邀请到浙江大学百人计划研究员、前微软亚洲研究院高级研究员、RD-Agent（GitHub 1.3w+ Star项目）核心作者——方榯楷。

他用一场直播，拆解了AI理解万物的底层逻辑——表征学习。

一、AI4S ：一场AI和Science的“双向奔赴”

AI4S是什么？

方榯楷的回答是：这不是单向的技术赋能，而是一个双引擎驱动的循环。

AI for Science——用 AI 的计算能力解决蛋白质折叠、材料发现等复杂的科学黑盒问题。

Science for AI——利用物理学的第一性原理（能量守恒、对称性）重新构建AI的架构，使其更稳健、可解释。

两者相加，是完整的AI4S。

一个典型案例是AlphaFold 3。

如果说AlphaFold 2是AI4S的里程碑，那么AlphaFold 3则是双向奔赴的完美融合：在方法层面，研究团队受热力学启发，引入了原本用于图像生成的扩散模型架构，在结果层面，首度使用AI深入解决领域科学难题，实现了从单一蛋白质到所有生命分子相互作用的跨越。

为什么我们现在必须关注 AI4S？因为主流科学关注的是物质和物质之间的关系转化。AI的介入让科研从人力试错转向智能预见，帮助科学家在海量可能性中快速锁定最优解。当互联网文本数据已近枯竭，未来的AI需要通过科学模拟器，根据第一性原理合成无限的高质量数据，去解锁下一个智能临界点。

二、为什么“表征”决定了模型的上限？

在AI4S的通用任务流程中，存在三个核心挑战：

方榯楷给出了一个判断：很多人迷信更深层的Transformer，但在科学场景中，表征决定了模型的上限。

如果你将分子的3D结构简单粗暴地拍扁成2D图像处理，无论模型多强，都会因为丢失结构性质而导致预测崩塌。

表征，是AI理解物理世界的“第一性原理”

不是所有的映射都能称为好的表征。方榯楷拆解了衡量表征质量的四大黄金准则：

1. 距离保持——保持现实逻辑

现实中性质相近的物体，映射到隐空间后，其向量距离也必须相近。两把结构相似的椅子，在隐空间里应该靠在一起。如果一把椅子映射后的距离反而离一个苹果更近——这个表征就发生了“距离崩塌”，模型无法理解事物的相似性。

2. 连续性——拒绝规律“突变”

好的表征空间应该是平滑的。在隐空间里缓慢移动向量坐标，对应的现实事物也应产生连续变化，而不是无意义的“闪现”。在流体力学实验中，当你在隐空间缓慢拖动滑块，流场图像应像水流一样自然演变。

3. 可插值与可操作性——探索“中间地带”

在隐空间里对两个向量加权插值，结果应对应现实中介于两者之间的产物。这意味着：我们可以通过对已知材料的向量插值，让AI预测出一种尚未被发现的新型中间态物质。

4. 不变性——尊重第一性原理

科学对象拥有独特的对称性。一个化学分子，无论在空间中如何旋转、平移或翻转，它本质上还是同一个分子。优秀的表征必须保持这种物理性质的对称。如果旋转一下分子AI就不认识了——这种表征在科学场景下是失败的。

如何获取这些表征？技术路径经历了从人工驱动到数据驱动的进化：

有监督学习——经典范式，但依赖昂贵的实验室标注，且缺乏泛化性。
自监督学习（SSL）——学习数据的“数字全息图”，具体包括：掩码自编码器，像完形填空一样随机遮盖75%的流场；变分自编码器（VAE），实现从确定性映射到连续概率分布的跃迁；自回归，预测下一秒的物理场状态；扩散模型，从混沌中还原物理真实。