直说吧——如果你是数学/CS/统计/自动化/生物信息背景,想进生物医学但不想做实验,手里有一些机器学习训练经历,这篇值得你认真读完。这是一位你不太容易通过"随便翻港大官网"翻到的年轻PI,但他组里的博士生已经连续拿下港大最高博士奖学金(HKPF)——这个指标比任何排名都能说明问题。
这个组跟你有没有关系
先把这个问题说清楚——这不是一个"谁都能试试"的组。先把丑话说前面。
你适合申这个组,如果:· 本科是数学、CS、统计、自动化、生信或相近专业· 对概率图模型、变分推断、深度学习有过系统训练· 对生物学问题有真实的好奇心(不是为了热门而做)· 可以接受2-3年才看到方法论工作的真正成果
这个组不太适合你,如果:· 只做过湿实验,没有编程或ML基础· 想短平快发文章,对跨学科合作没耐心· 只对"生物学发现"感兴趣,对计算方法本身无感· 期望三年毕业——方法论工作周期偏长
家长视角一句话:港大、全奖、三篇Nature子刊年产、毕业进药企算法岗或biotech——这是一条跨学科但赛道极稳的路。
导师是谁
Yuanhua Huang(黃淵華),港大生物医学学院(SBMS) + 统计与精算系 + 计算与数据科学学院三聘的副教授,2019年入职。本科清华大学自动化,博士爱丁堡大学(ML+计算生物学交叉方向),博士后在剑桥大学+EMBL-EBI(欧洲生物信息研究所)做的EBPOD fellow——从学术谱系上看,他是一条"从工科转进计算生物学"的典型路径,这也决定了他组里对本科数学/工科背景的学生格外友好。
他建的实验室叫"Statistical Intelligence for Cell Biomedicine",100%干实验室(全程计算,不做wet lab),研究核心是用统计机器学习和计算算法,去破解单细胞组学数据里的科学问题。
组生态速览(2026年4月数据)
·团队规模:4名博士生 + 2名博后 + 1名联合培养博士生,合计6-7人
·中国学生占比:100%华人组——清华、南大、HKU、西工大、山东大学、中国农大等背景
·Funding状态:NSFC/RGC联合基金 + 港大内部多项基金,年度经费稳定
·博士奖学金:组内博士生拿到港大最高奖学金HKPF(港大博士研究生奖学金)
·带队风格:合作型——多位博士生与Jason Wong、Pentao Liu等港大其他PI合作
·学术影响:Google Scholar引用1,464次(青年PI阶段偏高水平)
导师在做什么、做得怎么样
掏心窝子说,单细胞+AI这个赛道现在正是最值得入的时间窗口。方向还在上升期——Nature子刊的产量三年翻了三倍;工业界需求极强,药企(阿斯利康、罗氏、百济神州)和biotech的算法团队年年招人,薪资接近互联网;学术路线也还没完全收口,青年教职的机会还在。
说一下他最近的三篇工作,你就能感受到这个组的"打法":
TemporalVAE: atlas-assisted temporal mapping of time-series single-cell transcriptomes during embryogenesis
Nature Cell Biology, 2025
我的判断是:这篇是组内博士生一作、直接命中胚胎发育单细胞研究的核心痛点——时间轴对齐。VAE+时间先验的做法很漂亮,代码开源后已经被多个发育生物学组拿去用了。
CLADES: a hybrid NeuralODE-Gillespie approach for unveiling clonal cell fate and differentiation dynamics
Nature Communications, 2025
神经ODE+Gillespie随机模拟混合,用来解读克隆细胞的命运决策——这是他的招牌打法:把漂亮的数学工具和具体生物问题对接起来。
SNPmanifold: Detecting single-cell single-nucleotide-variant clonality and lineages using binomial variational autoencoder
Genome Biology, 2025
二项VAE+单细胞突变谱系追踪,工具开源后社区使用量稳定上升。底线是这样的:他做的是"别人会拿去用"的方法,不是"发完就忘"的论文。
怎么进组
套磁友好度评级:🟢 主动招人型· 官网明确写"We welcome students to join us"· 2025年9月刚招了HKU-深圳医院联合培养博士生· 组内连续拿HKPF(港大最高博士奖学金)说明他带学生能力受港大认可,招新有扩招余地· 邮件直接发 yuanhua@hku.hk,他本人回复
切口1:机器学习基础 + 生物学好奇心
他是"干湿结合"的数据科学家——不要求你会做实验,但必须有扎实的ML训练:概率图模型、VAE、GNN、NeuralODE,其中至少有2-3个你能说清楚原理。邮件里提你做过的具体工作,不要泛泛说"对ML感兴趣"。
邮件关键词:VAE / probabilistic models / scRNA-seq / Bayesian inference
切口2:GitHub能力展示
他的所有工具——BRIE、SNPmanifold、CLADES、TemporalVAE——全部开源在GitHub。套磁信里一定要附上你的GitHub链接,哪怕只有小项目。更好的做法:指出他某个工具你用过、复现过、遇到什么问题——这比任何SOP都管用。
邮件关键词:GitHub / open-source / reproducibility / code contribution
切口3:带着具体问题来
不要写"对single-cell感兴趣"——具体到"我读了您2025年的TemporalVAE,想把这个框架扩展到spatial transcriptomics的时间维度分析",或者"SNPmanifold里的binomial VAE假设在高基因组深度数据上是否需要修改"。他最喜欢学生自带问题来聊。
邮件关键词:spatial transcriptomics / temporal dynamics / clonal evolution
申请材料怎么准备
1. 学历背景准备
· 本科数学、CS、统计、自动化、生物信息都可接受· 硕士阶段最好有ML研究或计算生物学实习经验· 有arXiv预印本或发表论文(一作/二作都可)会大幅加分· GPA top 10%+托福100+/雅思7.0+
2. 核心技能准备
·编程:Python(PyTorch、scanpy、anndata、scikit-learn)、R(Seurat、DESeq2)·数理:概率图模型、变分推断、贝叶斯方法、深度学习、随机过程基础·工具链:GitHub熟练、能独立复现论文、Nextflow或Snakemake数据流水线·软技能:能与生物学家讨论问题、文献综述能力
3. 申请材料准备
·SOP:聚焦"我为什么想做计算方法而不是实验"——要想清楚·推荐信:找ML/统计/概率方向的任课或research导师,不要都找生物老师·CV:GitHub链接必须放上,开源贡献(哪怕是issue或小PR)都要列·Writing Sample:一篇你写过的technical report或论文手稿
读完能去哪
组成立于2019年,目前已有博士生完整毕业流程启动。典型出口方向:
·工业界:药企算法研发岗(阿斯利康、罗氏、百济神州)、biotech(Illumina、10X Genomics、华大基因)算法组
·学术界:博士后→海内外青年PI,目前组内博后中有人已在筹备教职
·跨界:大厂AI+医疗方向(腾讯觅影、字节健康医疗)
最后留一个问题给你
"读完博士去药企算法岗" vs "读完博士做博后冲教职"——如果是这个组的两条典型路径,你会选哪条?理由是什么?。

