我们最近碰到一个学生,本科学机械的,硕士转了计算机视觉,想申香港的全奖博士。他一开始只在看CS系的导师,我们跟他说:你可能漏了一个很重要的选择
这位导师叫孙宇翔(Yuxiang Sun),香港城市大学(City University of Hong Kong)机械工程系的助理教授(Assistant Professor),博士申请全奖方向。他2020年在城大建了自主系统实验室(Autonomous Systems Lab),研究方向覆盖自动驾驶、具身AI和移动机器人。说实话,光看系名你可能以为是做传统机械的——但翻完他的论文列表,你会发现这个组90%的产出都是AI算法。这就是我们说的信息差。
课题组生态速览
香港城市大学机械工程系,QS学科排名全球前列,拥有国家级重点实验室。
组内规模:目前8名在读博士生(2021-2025级各1-2人)、2名博后、1名硕士、1名研究助理、1名访问学生。
发文节奏:近3年年均产出15-20篇,以RAL/ICRA/IROS/TRO/TITS等机器人和智能交通顶刊顶会为主;10篇ESI高被引。
毕业情况:建组5年已有从已毕业4名博士看,约4-5年(2020年建组,2023-2025年已有毕业生)毕业,节奏不算慢。
指导风格信号:年均15-20篇的产出速度+8个博士生的组规模,推测属于中等偏push的指导风格。但3次HKPFS说明学生申请质量高、导师支持力度大
这位导师是谁,为什么值得关注
孙宇翔(Yuxiang Sun),助理教授(Assistant Professor)。合肥工业大学本科→中科大硕士→香港中文大学博士,典型的内地培养+港校深造路径——这个学术路径说明他非常了解内地学生的背景和需求。
核心指标:h-index 37引用4800+(Google Scholar, 截至2026年3月)100+论文
连续4年斯坦福全球前2%高被引科学家,3次获香港博士研究生奖学金(HKPFS)。实验室获得UGC、RGC、国家自然科学基金、华为、百度等多方资助——工业界愿意投钱,说明方向有实际价值。
研究方向:从自动驾驶到具身AI,这个组在转型
我们翻了孙宇翔近三年的论文列表,发现了一个很明显的趋势:2020-2022年,这个组的主要产出集中在自动驾驶场景的语义分割和感知,典型的就是各种LiDAR和相机的分割算法,发在TRO、TITS这些顶刊上。但从2024年开始,论文里密集出现了"Vision-Language""Foundation Model""Embodied AI"这些关键词。
这意味着什么?意味着如果你现在拿着一个纯自动驾驶感知的proposal去套磁,不是不行,但可能不是最对口的。导师现在更感兴趣的,大概率是VLM/LLM驱动的机器人系统。这一点从他主页最新的关键词更新也能看出来——"Vision-Language Action (VLA)""Vision-Language Navigation (VLN)""Open-Vocabulary Mobile Manipulation"这些都是2024年以后新加的。
具体来看几个核心方向:
自主驾驶感知——传统强项,在TRO/TITS等顶刊持续产出。包括语义分割、光流预测、多传感器融合。这个方向仍在做,但已不是唯一重心。对申请者来说,如果有扎实的CV基础,这仍是一个切入点。
具身AI与视觉语言导航——这是2024年以后的核心增长点。用大模型赋能机器人在真实环境中做语义理解和导航。从论文看,2025年的ICRA投稿已经用上了VLM做语义建图。想申这个方向的学生,一定要展示对多模态大模型的理解。
四足/人形机器人——新兴方向,目前产出还不多,但主页已经把它列为核心关键词。这可能意味着未来1-2年会加大投入,也意味着申请这个方向的竞争暂时没那么激烈。
移动机器人自主导航——SLAM、路径规划等,是实验室的基础能力方向。有这个背景的同学申请会比较顺畅。
从论文看这个组的真实状态
从几篇近期论文可以看出这个组的发展脉络:
FMFusion: Instance-Aware Semantic Mapping Boosted by Vision-Language Foundation Models
RAL/ICRA 2025
这篇是实验室转向具身AI的标志性工作——用视觉语言基础模型做实例级语义建图。和之前纯靠标注数据训练分割模型的路线完全不同,体现了组的技术路线正在跟上大模型时代。
Off-Road LiDAR Intensity Based Semantic Segmentation
TRO 2024 | 机器人领域顶刊
越野场景的LiDAR分割,发在IEEE TRO上。这说明实验室在自动驾驶感知这个传统方向仍有顶刊级产出能力,不是简单丢掉老方向去追新热点。
Behind Every Domain There is a Shift: Adapting Distortion-aware Vision Transformers for Panoramic Semantic Segmentation
TITS 2024 | ESI高被引论文
全景图像的域适应分割。这是组内10篇ESI高被引论文之一——说明这个组不只是发得多,被引质量也不错。对申请者来说,这类高被引成果是未来做RA或联合发文的好素材。
你适不适合申这位导师?先看这几点
最匹配的人:
本科/硕士有CV或机器人背景,熟悉PyTorch,有项目或论文经验
对自动驾驶或具身AI有明确兴趣,能说清楚想做什么具体问题
985或海外硕士背景(从组内学生看,清一色985硕士,竞争门槛不低)
希望多发论文、节奏快、有工业界实习机会的学生
最容易误判的人:
看到"机械工程系"就以为是做传统机械设计或制造的(实际做AI算法)
只会做硬件不会编程的——这个组需要强coding能力
想要慢节奏、自由探索型科研的——从产出速度看,这个组节奏偏快
如果要申,最该强调的一点:
你对具身AI方向的理解和热情——这是导师当前最重视的增长方向,也是竞争相对没那么激烈的切入点。
家长关心的几个问题
全奖每月约HK$19,200在香港生活可以覆盖基本开支;标准学制4年;毕业后可走IANG留港,自动驾驶方向在大湾区就业需求旺盛
整体来说,这个方向的就业确定性在工科PhD里属于第一梯队。读博期间经济压力可控,毕业后无论留港还是回大湾区都有明确出路。
我们的判断
综合来看,孙宇翔的自主系统实验室是一个处于快速上升期的课题组。导师年轻、产出高效、方向紧跟前沿(从传统感知到具身AI的转型踩在了点上),而且工业界资金支持充足。建组仅5年就培养了4名博士毕业生,说明体系已经成熟。
但也要看到:这个组规模不小(8个博士生),导师可能无法做到一对一的密切指导。从发文节奏推测,组内科研压力不会太低。适合那种目标清晰、执行力强、想在博士期间积累大量论文和项目经验的学生。
申请策略建议:
套磁切口:直接针对具身AI或VLN方向,展示你对VLM/LLM在机器人中应用的理解,最好附上一个相关项目或复现实验的链接。
Proposal方向:从VLA(Vision-Language Action)或开放词汇移动操作切入,这是实验室最新的关键词,也是竞争相对少的窗口期。
注意事项:导师主页写了不接受没有编程能力的学生。套磁邮件里一定要展示coding能力(GitHub链接、项目经验等)。另外,HKPFS申请截止通常在12月1日,如果成绩够好,建议同时申请。
