有些同学看到陈建新教授,会先把注意力放在几个很亮的词上:北京中医药大学、教授、博士生导师、国家杰青,还有中医药和人工智能。
但如果你真的准备给这样的导师写材料,我建议你先把视线从“我也懂一点AI”挪开。因为这类老师的工作,很少是在传统医学外面套一个算法壳。更关键的地方,是他怎么把原本很分散、很难标准化的中医知识,拆成可以被计算、可以被连接、可以被追问的数据。
陈建新教授的主页里,有一个很典型的成果叫 SymMap。你可以把它理解成一个很大的异构网络:里面不是只有药名,也不是只有疾病名,而是把中医症状、中草药、西医学症状、疾病、草药成分和靶基因放到同一套关系里。申请人读到这里,不能只写“我对数据库和人工智能感兴趣”。老师会更想知道,你能不能看懂这些实体怎么来,关系怎么定,证据从哪里补,最后这个网络能回答什么问题。
这一点对材料影响很大。你如果做过数据项目,CV 里不要只写“完成数据清洗与模型训练”。这句话放在这类导师面前信息太少。你要写清楚,你处理的是文献文本、临床记录、药物成分表、公开数据库,还是自己整理的标注表。再往下一步,实体是人工标注的,规则抽取的,还是模型识别的;关系是从实验结果里来的,还是从文献共现里来的。这些差别不是包装细节,而是博士研究能不能继续问下去的地方。
陈建新教授的另一条线,是证候生物学基础和中药复方作用机制的复杂网络分析。这里也容易被学生写浅。比如你说自己想研究“中药复方作用机制”,老师很可能不会先问你愿景。他会问:复方里有哪些成分,成分对应哪些靶点,靶点和疾病通路之间的证据是什么,最后有没有实验或临床材料能把计算结果往回校验。
如果你之前只做过单纯的机器学习分类,申请时就要特别小心。分类准确率不是不能写,但它不能替代机制解释。你要能说明模型分出来的结果,和症状、成分、靶点、通路之间有什么关系。如果这一步说不清,材料看起来像“会算法”,但老师会担心你进组之后只能跑模型,不能把医学问题继续往下拆。
这也是为什么我会建议申请人先做一张四列表。第一列写老师近几年反复处理的对象,比如中医症状、草药、疾病、成分、靶基因、证候或复方。第二列写这些材料从哪里来:数据库、文献、临床记录、实验数据,还是多源整合。第三列写方法:网络分析、表型计算、文本挖掘、多组学整合,或者机制验证。第四列写老师可能继续追问什么:关系可靠不可靠,证据能不能回到实验,模型结果能不能解释医学问题。
这张表不是为了显得勤奋,而是为了防止你把邮件和研究计划写散。很多同学会在邮件第一段写“我本科或硕士阶段学习过 Python、机器学习、深度学习,希望将人工智能用于中医药现代化”。这句话太容易被忽略。换成更具体的说法,会好很多:你做过哪类数据,处理过哪类实体,读到老师哪一类网络研究后,想继续追问哪一个关系是否成立。
这里还要看招生目录。北京中医药大学 2026 年“申请-审核制”博士招生专业目录里,陈建新教授列在生命科学学院,中西医结合药理学方向,研究方向写的是中医信息学、中医药大数据,学术学位,招生人数为 1,且显示可跨门类。这个信号很清楚:不是只适合传统中医背景,也不是只适合纯计算背景。它更像一个交叉入口。
但“可跨门类”不等于随便跨。理工、计算机、生物、药学背景的同学,如果没有中医药材料的阅读能力,进来会卡在问题定义上;中医药、药学、基础医学背景的同学,如果完全没有数据整理、网络分析或统计建模经历,也容易把研究计划写成综述感。比较稳的背景,是你至少能证明自己做过一段可被检查的研究:有明确材料来源,有处理过程,有结果解释,也知道结果的边界在哪里。
面试准备也不要只背导师头衔。老师如果问你读过什么工作,你可以从 SymMap 或类似数据库研究入手,但回答别停在“平台很有意义”。你要说得出它连接了哪些实体,为什么这些实体之间需要标准化,哪些关系强,哪些关系可能还需要实验或临床证据补上。然后再把自己的经历接进去:你以前处理过哪一类数据,遇到过什么噪音,怎么判断一个变量或关系能不能用。
最后说一句很实在的。陈建新教授这种导师,对“跨学科”三个字不会陌生。你不用在材料里反复证明自己跨。你要证明的是,你跨过去以后,手里有材料,脑子里有问题,方法知道边界。今天如果准备动手改材料,先改 CV 第一页的研究经历。把“参与项目”“负责数据处理”“使用机器学习方法”这些句子,改成对象、材料来源、处理方法和结果解释。再去写邮件,声音会稳很多。
