南洋理工招收全奖博士 | 导师获新加坡NRF Fellowship这样的学生更受欢迎

上个月帮一个学生梳理新加坡CS方向的组,翻到MMLab@NTU的时候,我停在了一个名字上——不是因为论文数量,而是因为DragGAN。对,就是那个在GitHub上拿了三万六千颗星的项目。做出这个东西的人叫潘新刚,现在是南洋理工CCDS的Nanyang助理教授。坦白讲,一个2021年才拿到博士学位的人,三年后就拿到新加坡NRF Fellowship,这个速度在NTU的年轻教授里也算相当突出的。

导师背景与组内情况

潘新刚(Xingang Pan),南洋理工大学CCDS Nanyang助理教授(NRF Fellow),本科清华大学(2016),博士香港中文大学多媒体实验室(2021,导师汤晓鸥),博后德国马普所。核心方向是生成式AI、计算机视觉与计算机图形学。他所在的MMLab@NTU是NTU计算机视觉领域的旗舰实验室,由陈变禅(Chen Change Loy)教授领衔。潘新刚独立带组后,已经在CVPR、ICCV、ICLR、SIGGRAPH、NeurIPS等顶会顶刊上发表50余篇论文,Google Scholar引用近6000次。2024年获得新加坡NRF Fellowship,同时担任TPAMI和TVCG副主编、CVPR和ICLR Area Chair。说真的,这个学术履历在同年龄段的AP里属于顶尖水平。

研究方向与赛道判断

生成式AI这个赛道现在到底有多火,不用我多说。但有一说一,潘新刚做的不是那种"水论文凑数"的生成式,他的研究核心是用生成模型去理解和交互物理世界——从DragGAN的交互式图像编辑,到GAN2Shape用GAN做3D重建,再到最近的世界模型(WORLDMEM)和自动驾驶(Epona),方向在从"生成好看的图"往"理解真实世界"迁移。这个方向现在属于快速上升期,顶会论文数量年年涨,工业界需求也在同步爆发:做这个方向的博士毕业后,直接对接的岗位包括大厂AI研究员、自动驾驶感知算法工程师、AIGC产品研发等,薪资天花板非常高。

挑三篇近期代表作聊聊:

Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold

2023 | SIGGRAPH

这篇就是让他"出圈"的那篇。用户在图上拖几个点,GAN就能按你的意图变形图像。GitHub 36k星不是白拿的,这篇论文证明了他把学术研究做成可交互产品的能力。

WORLDMEM: Long-term Consistent World Simulation with Memory

2025 | NeurIPS

世界模型方向的最新工作,用记忆机制实现长时一致的世界仿真。这篇反映了组里正在往Embodied AI方向发力,未来招生也会优先考虑这个方向的学生。

Alias-free Latent Diffusion Models: Improving Fractional Shift Equivariance of Diffusion Latent Space

2025 | CVPR (Oral)

今年CVPR的oral,解决扩散模型潜空间的等变性问题。讲真,能在CVPR拿oral的工作,理论深度和实验都得过硬。如果你想套磁聊扩散模型方向,这篇是最好的切入点。

如何套磁入组

套磁友好度:🟡 被动接受型

官网写了"drop me an email with your resume",说明他愿意看邮件但不是主动贴招生广告的类型。注意他明确说"Priority will be given to candidates with research experience in Embodied AI, then Generative AI"——优先要Embodied AI方向。由于MMLab的知名度,他收到的套磁邮件数量大概不少,所以邮件质量必须很高才能脱颖而出。

推荐

切入角度一:世界模型+Embodied AI

如果你有强化学习、机器人感知或3D场景理解的经验,直接围绕WORLDMEM这条线聊。邮件里说清楚你做过什么仿真环境或embodied agent的项目,附上代码链接。邮件关键词:world model, embodied AI, 3D scene understanding, simulation

切入角度二:生成式模型理论

如果你有扩散模型或GAN的理论功底,从CVPR oral那篇入手,讨论你对等变性或模型架构改进的理解。最好能附一篇你自己的相关论文或技术报告。邮件关键词:diffusion model, equivariance, latent space, generative model

切入角度三:3D视觉+神经渲染

如果你做过NeRF、3D Gaussian Splatting或神经渲染相关项目,从GAN2Shape或STream3R切入。强调你的3D重建实现能力和对几何表示的理解。邮件关键词:neural rendering, 3D reconstruction, NeRF, 3DGS

避坑提醒:他的主页写了"Due to the volume of emails received, we regret that only shortlisted candidates will be contacted",说明邮件筛选很严格。只说"我对您的研究感兴趣"这种套话基本石沉大海。必须有具体的研究经历和代码/论文链接。清华+港中文的学术血统意味着他对学生的基础功底要求不低。

申请建议

1.学历背景准备:计算机科学、电子工程、自动化、数学等本科或硕士学位。NTU CCDS的PhD项目要求荣誉学位或相当水平的学士学位,硕士学位申请更有竞争力。GRE非必须但优秀成绩加分,雅思6.5或托福85+。NTU PhD提供全额奖学金覆盖学费和生活费。

2.核心技能准备:熟练掌握PyTorch,有深度学习项目开发经验。具体到这个组,优先技能树:扩散模型/GAN训练与调优、3D视觉(NeRF/3DGS)、强化学习/仿真环境搭建(Isaac Gym/MuJoCo)。编程能力要强,GitHub上有可展示的开源项目是重要加分项。数学基础扎实(概率论、优化、线性代数)。

3.申请材料准备:研究计划不需要太长但必须精准,建议围绕"生成式世界模型"或"3D生成与交互"写。推荐信最好找有CV/ML研究经验的导师。最重要的一点:一定要准备好自己的代码库和论文(哪怕是预印本),这个组看重实际产出能力。

谁适合申 / 谁不太适合申

适合的:有计算机视觉/深度学习科研经验、发过顶会论文或有扎实的开源项目、对生成式AI或3D视觉有深入理解、编程能力强且愿意写大量代码、想去工业界大厂AI Lab或者走学术路线的。特别适合本科清北华五+有一篇以上顶会投稿经验的同学。

不太适合的:纯应用层开发背景(只会调API不懂模型原理的)、没有任何CV/ML研究经验的、数学基础薄弱的、不愿意高强度写代码跑实验的、期望轻松毕业的。MMLab的工作强度不小,这点要有心理准备。

家长友好版总结:这个组做的是AI图像生成和3D视觉,毕业后对接的是互联网大厂AI研究员、自动驾驶算法工程师、AIGC产品研发等岗位,起薪在CS细分方向里属于天花板级别,学术路线也完全走得通。

毕业去向速览

潘新刚建组时间不长(约2-3年),第一批独立指导的PhD尚在培养中。但从MMLab@NTU整体来看,实验室的博士毕业生去向非常亮眼:腾讯、字节、商汤等头部公司AI研究员,以及北美和亚太高校的教职/博后。潘新刚本人的DragGAN项目已在工业界有广泛影响力,可以预期其学生在就业市场上有很强的竞争力。他在MMLab的学生曾获ECCV挑战赛第一名、SCSE优秀博士论文奖等。

推荐
上一篇

港科大(广州)招收全奖博士 | 导师担任三大EDA顶会程序委员这样的学生更受欢迎

下一篇

新国立招收全奖博士 | 导师担任国际期刊编委这样的学生更受欢迎

返回顶部