导师简介
如果你想申请新加坡南洋理工大学 电子工程学系博士,那今天这期文章解析可能对你有用!今天Mason学长为大家详细解析新加坡南洋理工大学的Prof. Chen的研究领域和代表文章,同时,我们也推出了新的内容“科研想法&开题立意”,为同学们的科研规划提供一些参考,并且会对如何申请该导师提出实用的建议!方便大家进行套磁!后续我们也将陆续解析其他大学和专业的导师,欢迎大家关注!
Lihui Chen现为新加坡南洋理工大学(NTU)电气与电子工程学院终身副教授,隶属于信息工程系。教授于1982年获中国浙江大学计算机科学与工程学士学位(BEng),1988年至1992年赴英国圣安德鲁斯大学攻读并获得计算科学博士学位;攻读博士前,曾在计算机软件公司担任软件工程师6年,积累了扎实的工程实践经验。
自1993年起,Chen教授便任职于NTU,至今已深耕该校教学与科研领域30余年。
研究分析
(一)核心论文研究方向
- BlendCSE(2024):发表于《Expert Systems with Applications》提出融合对比学习的句子嵌入方法(Blend contrastive learnings for sentence embeddings),核心优势在于提升嵌入向量的语义丰富度与迁移能力。该研究针对性解决传统句子嵌入模型在跨领域语义适配中的局限性,为信息检索、文本匹配等应用提供了更高效的语义表征方案。
- DistillCSE(2023):发表于ArXiv(并收录于Findings of EMNLP 2023)提出蒸馏对比学习框架用于句子嵌入。通过知识蒸馏技术压缩模型规模,在保证语义表征性能的前提下降低计算成本,具备更强的工程落地可行性,尤其适用于资源受限的Web智能与文本检索场景。
- Deep Embedded Clustering with Random Projection Penalty(2023):发表于《NETWORKING COMMUNICATION AND DATA KNOWLEDGE ENGINEERING, VOL 1》将随机投影惩罚机制引入深度嵌入聚类模型,有效缓解高维数据聚类中的过拟合问题,提升聚类结果的稳定性与可解释性,为文本/网页数据挖掘提供了新的聚类技术路径。
- On Synthetic Data for Back Translation(2023):发表于ArXiv(收录于NAACL 2022 Main Conference)聚焦合成数据在回译任务中的应用,探讨合成数据质量对翻译效果的影响,为自然语言处理中的数据增强策略提供了实证参考,与Web智能领域的多语言信息检索需求高度契合。
(二)在研项目
- 其主持的在研基金项目“Artificial Intelligence Empowered Semantic Search for Prior Art Retrieval”(人工智能驱动的在先技术检索语义搜索)进一步将基础研究与专利信息检索等实际应用场景结合,体现“基础理论-技术突破-行业应用”的研究逻辑。
研究想法
结合Chen教授的核心研究方向(对比学习、语义嵌入、Web智能、数据聚类),提出以下3个具有新颖性与适配性的研究想法,均紧扣其研究脉络并拓展新的研究维度:
- 多模态融合的对比学习句子嵌入用于跨媒体Web检索:现有BlendCSE、DistillCSE均聚焦文本单模态语义表征,可拓展至“文本-图像”多模态融合场景。通过构建跨模态对比学习框架,将网页中的文本信息与图像视觉特征进行联合嵌入,解决当前Web检索中“文本-图像语义错位”问题,提升跨媒体信息检索的准确性。该想法延续了Chen教授对比学习与语义嵌入的核心研究,同时拓展了多模态研究维度,契合Web智能的前沿发展需求。
- 小样本场景下的蒸馏对比聚类方法研究:针对现有聚类方法在小样本网页文本数据中性能下滑的问题,融合DistillCSE的蒸馏技术与随机投影惩罚聚类思想,设计轻量级小样本对比聚类模型。通过引入领域自适应策略,提升模型在小众领域(如专业学术网页、垂直行业资讯)文本聚类中的泛化能力,弥补当前研究在小样本场景的不足。
- 基于合成数据增强的低资源语言Web语义检索研究:结合“On Synthetic Data for Back Translation”的合成数据思路,针对低资源语言(如东南亚小语种)Web信息检索资源匮乏的问题,通过合成数据增强技术构建低资源语言-英语双语平行语料库,再基于对比学习训练跨语言语义嵌入模型,实现低资源语言网页的精准语义检索。该研究贴合新加坡多元语言环境的实际需求,也拓展了Chen教授研究的应用边界。
申请建议
(一)学术背景夯实
- 核心课程学习:优先掌握机器学习、深度学习、数据结构与算法、自然语言处理、数据挖掘等核心课程,建议选修模糊逻辑、神经网络相关专题课程,构建与Chen教授研究方向匹配的知识体系。
- 科研经历积累:重点参与文本嵌入、对比学习、数据聚类、Web信息检索相关的科研项目,即使是课程设计或小型科研实践,也需聚焦具体技术问题(如“基于对比学习的文本匹配模型设计”)。若有论文发表经历,优先投向Chen教授参与审稿的期刊(如《IES Journal –B》)或相关学术会议(如EMNLP、NAACL),提升成果认可度。无发表经历者,需整理科研项目的技术报告,清晰呈现问题定义、方法设计、实验结果等核心内容。
(二)文书材料优化
- 个人陈述(Personal Statement, PS):核心突出“研究兴趣匹配度”与“科研潜力”。需具体阐述阅读Chen教授的哪篇论文(如BlendCSE、DistillCSE)后产生研究兴趣,分析该论文的核心贡献与可拓展方向,并结合自身科研经历说明如何具备开展相关研究的能力。避免泛泛而谈,需将个人经历与Chen教授的研究方向精准绑定。
- 推荐信(Recommendation Letter, RL):优先选择具备机器学习、数据挖掘领域研究背景的推荐人,若推荐人曾与Chen教授有学术合作或共同审稿经历,将显著提升推荐信含金量。推荐信内容需具体,避免空泛评价,可让推荐人重点提及你的科研态度、技术能力(如编程、实验设计)及团队协作能力。
(三)能力补充
- 编程与工具能力:熟练掌握Python编程语言,精通PyTorch/TensorFlow深度学习框架,掌握Scikit-learn、Hugging Face Transformers等工具库的使用,具备数据预处理、模型训练与评估的完整实操能力。Chen教授团队的研究涉及大量实验验证,扎实的编程能力是核心基础。
博士背景
Blythe,985电气工程硕士,后毕业于香港科技大学电子及计算机工程学系博士学位。研究方向聚焦于电力电子与智能电网技术。在国际权威期刊《IEEE Transactions on Power Electronics》和《IEEE Transactions on Smart Grid》发表多篇论文。专注于开发新型高效率电力变换器和先进智能配电系统控制算法,熟悉香港PhD申请流程。
