导师简介
如果你想申请香港大学 计算机科学系博士,那今天这期文章解析可能对你有用!今天Mason学长为大家详细解析香港大学的Prof.Guosheng的研究领域和代表文章,同时,我们也推出了新的内容“科研想法&开题立意”,为同学们的科研规划提供一些参考,并且会对如何申请该导师提出实用的建议!方便大家进行套磁!后续我们也将陆续解析其他大学和专业的导师,欢迎大家关注!
Professor Yin, Guosheng(尹国聖)现任统计学及精算学教授,同时担任统计主席,隶属于工程学院下的计算与数据科学学院。其学术研究横跨统计、数据科学、临床医学与金融等多个领域,长期深耕统计方法创新及跨学科应用。
研究分析
Professor Yin的研究聚焦四大核心领域,2025年发表的7篇论文精准体现了各方向的研究进展:
- Bayesian adaptive designs in clinical trials:《CFO: CalibrationFree Odds Bayesian Designs for Dose Finding in Clinical Trials》(JCO Clinical Cancer Informatics)提出无校准优势贝叶斯设计,解决临床试验中的剂量探索难题,避免传统方法依赖校准的局限性,提升肿瘤等疾病临床试验的效率。
- Survival analysis:《Efficient estimation for functional accelerated failure time models》(Biometrika)优化函数型加速失效时间模型的估计方法,为生存数据的精准分析提供新工具,该期刊是生物统计学领域的顶刊,体现成果的理论高度。
- Finance and econometrics:《Graph Portfolio: HighFrequency Factor Predictors via Heterogeneous Continual GNNs》(IEEE Transactions on Knowledge and Data Engineering)将异质持续图神经网络应用于金融高频因子预测,构建新型投资组合模型,衔接统计方法与金融工程实践。
- 跨学科应用(AI+统计):《Democratizing large language modelbased graph data augmentation via latent knowledge graphs》(Neural Networks)提出基于潜知识图谱的LLM图数据增强方法,降低AI模型对高质量标注数据的依赖,体现统计方法与人工智能的深度融合。
研究想法
- 贝叶斯自适应设计结合LLM的罕见病临床试验优化基于其临床试验设计与LLM研究基础,针对罕见病病例少、异质性高的痛点,设计融合LLM的贝叶斯自适应剂量探索方案。利用LLM提取过往罕见病临床试验的文本数据(如病例报告、方案文档),构建先验信息库,再通过贝叶斯方法动态调整试验分组及剂量水平,缩短试验周期。可通过模拟试验验证方案在神经罕见病中的可行性,核心技术衔接CFO设计与 latent knowledge graphs技术。
- 生存分析与金融高频数据融合的企业违约风险预测结合生存分析模型(如functional accelerated failure time models)与金融高频因子预测技术,构建企业违约风险动态评估框架。利用Graph Portfolio中的异质GNN提取企业多维度关联特征,通过生存分析刻画风险随时间的演化轨迹,解决传统静态评估的局限性。可应用于中小企业信贷风险评估,通过真实金融数据验证模型的预测精度。
- 贝叶斯整合模型在多组学数据驱动药物重定位中的应用延续其阿尔茨海默病药物重定位研究,设计多组学数据(转录组、蛋白质组)与临床数据的贝叶斯整合模型。通过贝叶斯计算方法量化不同数据来源的权重,构建“疾病靶点药物”关联网络,提升药物重定位的准确性。可聚焦神经退行性疾病,结合生物网络分析技术优化模型的生物学解释性。
申请建议
1.学术背景与课程准备
- 核心课程:优先修读贝叶斯统计、生存分析、高级计量经济学、机器学习等课程,重点掌握MCMC(马尔可夫链蒙特卡洛)方法、加速失效时间模型、图神经网络基础理论,夯实统计建模与数据分析能力。
- 跨学科补充:若侧重临床方向,选修临床试验设计、公共卫生统计学;若偏向金融方向,补充金融工程、高频交易数据分析等课程,匹配教授的跨学科研究需求。
2.技能储备重点
- 编程与工具:熟练使用R、Python进行统计建模,掌握Stan、BUGS等贝叶斯计算工具;具备GNN相关框架(如PyTorch Geometric)使用经验,能处理图结构数据;熟悉SQL数据库及数据清洗技术,可应对多源异构数据(如临床数据、金融数据)。
- 分析能力:具备独立设计统计实验、解读模型结果的能力;能运用混合方法分析复杂问题,如结合定性文本分析(对应LLM研究)与定量统计建模。
3.研究计划与材料优化
- 研究计划:选题需聚焦教授核心领域,例如“基于贝叶斯自适应设计的罕见病临床试验优化”“生存分析在企业违约风险评估中的应用”等具体方向。需明确说明研究问题与教授成果的衔接点,如“本研究将拓展您在JCO Clinical Cancer Informatics发表的CFO设计,融入LLM技术提升罕见病试验效率”。
- 材料打磨:CV中突出统计建模、数据处理相关经历,量化成果(如“使用贝叶斯模型分析临床数据,提升预测准确率15%”);Writing Sample优先提交统计方法应用或跨学科数据分析类论文,展现学术分析能力。
4.套磁与面试准备
- 套磁重点:邮件中需清晰说明个人研究兴趣与教授方向的匹配度,例如“您2025年在Neural Networks发表的LLM图数据增强研究,与我在统计机器学习领域的研究高度契合”;附上1页左右的研究提纲,提出具体可探讨的科学问题(如“贝叶斯方法如何优化LLM在小样本统计推断中的偏差?”)。
- 面试准备:深入研读教授近3年发表的论文,梳理其研究方法的演进脉络;准备案例分析,如“如何设计一项针对新型疫苗的贝叶斯自适应临床试验”,展现问题解决能力;熟悉教授提出的DTL学习器、CFO设计等原创方法,能阐述其原理与应用场景。
博士背景
Aurelia ,美国TOP10院校计算机科学与认知科学双博士生,研究聚焦算法博弈论不确定性及其在人工智能中的应用。她的跨学科研究融合了计算机科学、语言学和心理学知识,在国际顶级期刊《Journal of Artificial Intelligence Research》和《Cognitive Science》上发表多篇论文。Aurelia 荣获ACM SIGAI博士论文奖,擅长相关方向的PhD申请指导。