南洋理工招收全奖博士 | 导师获新加坡NRF Fellowship这样的学生更受欢迎

上个月帮一个学生梳理新加坡CS方向的组，翻到MMLab@NTU的时候，我停在了一个名字上——不是因为论文数量，而是因为DragGAN。对，就是那个在GitHub上拿了三万六千颗星的项目。做出这个东西的人叫潘新刚，现在是南洋理工CCDS的Nanyang助理教授。坦白讲，一个2021年才拿到博士学位的人，三年后就拿到新加坡NRF Fellowship，这个速度在NTU的年轻教授里也算相当突出的。

导师背景与组内情况

潘新刚（Xingang Pan），南洋理工大学CCDS Nanyang助理教授（NRF Fellow），本科清华大学（2016），博士香港中文大学多媒体实验室（2021，导师汤晓鸥），博后德国马普所。核心方向是生成式AI、计算机视觉与计算机图形学。他所在的MMLab@NTU是NTU计算机视觉领域的旗舰实验室，由陈变禅（Chen Change Loy）教授领衔。潘新刚独立带组后，已经在CVPR、ICCV、ICLR、SIGGRAPH、NeurIPS等顶会顶刊上发表50余篇论文，Google Scholar引用近6000次。2024年获得新加坡NRF Fellowship，同时担任TPAMI和TVCG副主编、CVPR和ICLR Area Chair。说真的，这个学术履历在同年龄段的AP里属于顶尖水平。

研究方向与赛道判断

生成式AI这个赛道现在到底有多火，不用我多说。但有一说一，潘新刚做的不是那种"水论文凑数"的生成式，他的研究核心是用生成模型去理解和交互物理世界——从DragGAN的交互式图像编辑，到GAN2Shape用GAN做3D重建，再到最近的世界模型（WORLDMEM）和自动驾驶（Epona），方向在从"生成好看的图"往"理解真实世界"迁移。这个方向现在属于快速上升期，顶会论文数量年年涨，工业界需求也在同步爆发：做这个方向的博士毕业后，直接对接的岗位包括大厂AI研究员、自动驾驶感知算法工程师、AIGC产品研发等，薪资天花板非常高。

挑三篇近期代表作聊聊：

Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold

2023 | SIGGRAPH

这篇就是让他"出圈"的那篇。用户在图上拖几个点，GAN就能按你的意图变形图像。GitHub 36k星不是白拿的，这篇论文证明了他把学术研究做成可交互产品的能力。

WORLDMEM: Long-term Consistent World Simulation with Memory

2025 | NeurIPS

世界模型方向的最新工作，用记忆机制实现长时一致的世界仿真。这篇反映了组里正在往Embodied AI方向发力，未来招生也会优先考虑这个方向的学生。

Alias-free Latent Diffusion Models: Improving Fractional Shift Equivariance of Diffusion Latent Space

2025 | CVPR (Oral)

今年CVPR的oral，解决扩散模型潜空间的等变性问题。讲真，能在CVPR拿oral的工作，理论深度和实验都得过硬。如果你想套磁聊扩散模型方向，这篇是最好的切入点。

如何套磁入组

套磁友好度：🟡 被动接受型

官网写了"drop me an email with your resume"，说明他愿意看邮件但不是主动贴招生广告的类型。注意他明确说"Priority will be given to candidates with research experience in Embodied AI, then Generative AI"——优先要Embodied AI方向。由于MMLab的知名度，他收到的套磁邮件数量大概不少，所以邮件质量必须很高才能脱颖而出。

切入角度一：世界模型+Embodied AI

如果你有强化学习、机器人感知或3D场景理解的经验，直接围绕WORLDMEM这条线聊。邮件里说清楚你做过什么仿真环境或embodied agent的项目，附上代码链接。邮件关键词：world model, embodied AI, 3D scene understanding, simulation

切入角度二：生成式模型理论

如果你有扩散模型或GAN的理论功底，从CVPR oral那篇入手，讨论你对等变性或模型架构改进的理解。最好能附一篇你自己的相关论文或技术报告。邮件关键词：diffusion model, equivariance, latent space, generative model

切入角度三：3D视觉+神经渲染

如果你做过NeRF、3D Gaussian Splatting或神经渲染相关项目，从GAN2Shape或STream3R切入。强调你的3D重建实现能力和对几何表示的理解。邮件关键词：neural rendering, 3D reconstruction, NeRF, 3DGS

避坑提醒：他的主页写了"Due to the volume of emails received, we regret that only shortlisted candidates will be contacted"，说明邮件筛选很严格。只说"我对您的研究感兴趣"这种套话基本石沉大海。必须有具体的研究经历和代码/论文链接。清华+港中文的学术血统意味着他对学生的基础功底要求不低。

申请建议

1.学历背景准备：计算机科学、电子工程、自动化、数学等本科或硕士学位。NTU CCDS的PhD项目要求荣誉学位或相当水平的学士学位，硕士学位申请更有竞争力。GRE非必须但优秀成绩加分，雅思6.5或托福85+。NTU PhD提供全额奖学金覆盖学费和生活费。

2.核心技能准备：熟练掌握PyTorch，有深度学习项目开发经验。具体到这个组，优先技能树：扩散模型/GAN训练与调优、3D视觉（NeRF/3DGS）、强化学习/仿真环境搭建（Isaac Gym/MuJoCo）。编程能力要强，GitHub上有可展示的开源项目是重要加分项。数学基础扎实（概率论、优化、线性代数）。

3.申请材料准备：研究计划不需要太长但必须精准，建议围绕"生成式世界模型"或"3D生成与交互"写。推荐信最好找有CV/ML研究经验的导师。最重要的一点：一定要准备好自己的代码库和论文（哪怕是预印本），这个组看重实际产出能力。

谁适合申 / 谁不太适合申

适合的：有计算机视觉/深度学习科研经验、发过顶会论文或有扎实的开源项目、对生成式AI或3D视觉有深入理解、编程能力强且愿意写大量代码、想去工业界大厂AI Lab或者走学术路线的。特别适合本科清北华五+有一篇以上顶会投稿经验的同学。

不太适合的：纯应用层开发背景（只会调API不懂模型原理的）、没有任何CV/ML研究经验的、数学基础薄弱的、不愿意高强度写代码跑实验的、期望轻松毕业的。MMLab的工作强度不小，这点要有心理准备。

家长友好版总结：这个组做的是AI图像生成和3D视觉，毕业后对接的是互联网大厂AI研究员、自动驾驶算法工程师、AIGC产品研发等岗位，起薪在CS细分方向里属于天花板级别，学术路线也完全走得通。

毕业去向速览

潘新刚建组时间不长（约2-3年），第一批独立指导的PhD尚在培养中。但从MMLab@NTU整体来看，实验室的博士毕业生去向非常亮眼：腾讯、字节、商汤等头部公司AI研究员，以及北美和亚太高校的教职/博后。潘新刚本人的DragGAN项目已在工业界有广泛影响力，可以预期其学生在就业市场上有很强的竞争力。他在MMLab的学生曾获ECCV挑战赛第一名、SCSE优秀博士论文奖等。

本文由 Molly 转载发布在国际教育联盟平台，版权归原作者所有，如有侵权，请直接联系微信进行处理。