I-TASSER在CASP社区公测里连续拿了九次自动化蛋白质结构预测的第一名。做出这个工具的张阳教授,2023年从密歇根大学整组搬到了新加坡国立大学(National University of Singapore),现在同时挂着计算机学院、生物化学系和癌症科学研究所三个appointment。官网写着正在通过多个NUS博士项目招收PhD学生。
项目重点信息
NUS的博士项目由计算机学院和医学院联合招生,学生可以从CS或Medicine两个track入学。这意味着申请者的学术背景既可以是纯CS/AI方向,也可以是生物信息学、计算生物学甚至临床医学方向。项目覆盖学费,提供月度生活津贴(约SGD 2,500起),部分优秀学生可获得President's Graduate Fellowship等额外奖学金。
导师信息与研究领域
张阳教授是AI驱动蛋白质结构预测领域的标杆人物。他在密歇根大学待了十几年,2023年全职加入NUS,现在的appointment横跨三个单位:School of Computing的计算机科学系、Yong Loo Lin医学院的生物化学系,以及癌症科学研究所(CSI)。这种跨院任职在NUS不算常见,说明学校给了比较充分的资源支持。
他的研究主线可以分两层理解。底层是开发AI和物理力场结合的计算方法,用来预测蛋白质和RNA的三维结构;应用层是把这些方法延伸到药物设计和癌症治疗方向。I-TASSER是他最广为人知的工具,从2006年开始在CASP(蛋白质结构预测的社区盲测实验)里连续九次拿到最高排名。D-I-TASSER是最新一代,2025年发在Nature Biotechnology上。
研究问题与关键思路
我先看了他近两年的通讯作者论文。一个很明显的趋势是:他不再只做单链蛋白质的结构预测了,重心在往两个方向移。
第一个方向是多结构域蛋白质和蛋白质复合物的预测。2024年发在Nature Methods上的DeepMSA2那篇,核心改进是用大规模宏基因组数据来增强深度学习的序列比对输入。这意味着学生如果要接这条线,不光要会写深度学习模型,还得能处理海量的序列数据库,对生物信息学的数据处理流程要有一定基础。
第二个方向是药物发现。2026年初CSI官网报道他组里获得了NMRC Open Fund,用于AI驱动的TCR-pHMC相互作用建模。这条线更偏生物医学应用,学生需要理解免疫学中T细胞受体和MHC分子的相互作用逻辑。从公开信息来看,这个方向的funding是近期才拿到的,招生概率比较高。
第三个值得注意的信号:2025年他在Nature Protocols上发了US-align工具的协议文章,2025年又在Nature Biotechnology上发了D-I-TASSER。一年之内两个Nature子刊通讯作者,说明组里的产出节奏非常稳定,学生能用的方法和代码基础设施应该比较成熟。
论文信号
Deep-learning-based single-domain and multidomain protein structure prediction with D-I-TASSER
Nature Biotechnology, 2025
I-TASSER的最新迭代,引入端到端深度学习,预测精度进一步提升。对申请者来说,这是入组后最可能用到的基础平台。
US-align: Universal Structure Alignment
Nature Protocols, 2025
蛋白质和核酸结构通用比对工具的完整使用协议。这类工具文章说明组里的方法已经进入成熟推广阶段。
Improving deep learning protein monomer and complex structure prediction using DeepMSA2
Nature Methods, 2024, 21: 279-289
用宏基因组数据增强多序列比对,是做蛋白质复合物预测的基础模块。
申请材料要点
这个组的门槛比较明确:你得会写代码,最好有深度学习的项目经验,如果同时对生物数据有一定理解就更匹配。纯CS背景的人申请,CV里至少要体现出你用过PyTorch或者TensorFlow处理过结构化数据的经历;如果是生物信息背景,需要说清楚你做过什么具体的计算流程,不能只写"参与过课题组的数据分析"。
邮件第一段不要写"我对蛋白质结构预测很感兴趣"这种话。更好的写法是直接提你用过I-TASSER或者US-align做过什么具体的事情,或者你在自己的项目里遇到过什么结构预测相关的问题。导师一天可能收很多封邮件,第一段没有信息量的邮件,回复概率很低。
Research Proposal 创新点
主方向:抗体-抗原结合界面的结构预测与设计。对象是治疗性抗体和目标抗原蛋白的复合物;数据来源可以是PDB和SAbDab数据库中的已解析抗体结构;方法是在D-I-TASSER框架上加入抗体CDR区的特异性约束模块;可追问的问题是:能否在不做湿实验的情况下筛选出与特定表位结合力最强的CDR变体?这个题目接得上组里的蛋白质预测方法线,也能往药物设计延伸。
辅助方向:利用cryo-EM密度图进行RNA-蛋白质复合物的联合预测。组里2022年在Nature Computational Science上发过cryo-EM辅助蛋白质组装的文章,这条线可以延伸到RNA-蛋白质互作方向。但这个题目对实验数据的依赖比较重,如果你没有处理cryo-EM数据的经历,RP里不建议把这个写成主切口。
奖学金和学费
NUS PhD的资助结构需要分几层理解。学校层面,NUS Research Scholarship覆盖全额学费(约SGD 8,050/学期)并提供月度津贴(SGD 2,500起)。如果申请到了SINGA奖学金或者President's Graduate Fellowship,月度津贴可以到SGD 3,200以上。导师层面,张阳教授的组跨了CS和医学两个学院,funding来源相对多元。2026年初CSI报道组里获得了NMRC Open Fund,这笔钱通常能覆盖RA津贴。但具体到某个学生能不能拿到导师的项目经费补贴,要看入学时的具体安排,建议邮件确认。新加坡的生活成本比香港略低,校内宿舍月租约SGD 500-800,校外合租约SGD 800-1,200。
经历能接上他近两年这条蛋白质-药物设计的问题线,这个组值得认真准备。只是方向沾边但没处理过生物序列或结构数据的人,建议先补一些基础再发邮件。

