说实话,我第一次看 Yang Yi 这个组的时候是有些"低估"的——做 NLP 嘛,做的人太多了。但翻到他主页的发表列表,往下滑了两屏,我就停住了。
港科大商学院 ISOM 系(信息系统、商业统计与运营管理)的 Yang Yi(杨毅),副教授、Lee Heng Fellow。他主页上挂着 Information Systems Research(ISR)连续三篇 accepted——一个是关于用户数据撤销审计的,一个是预测建模分布外稳健性的,还有一个是从财报电话会议里做图结构对话建模的。ISR 是 IS 领域顶刊里最看重方法严谨度的那一档,能一连三篇 accepted,节奏挺扎实的。
组里现在最该聊聊的不是 LLM
他主页上写 "NLP, LLM, ML, statistical inference, and their applications in finance and business"。读着像所有人都在写的话。但翻到 acknowledgment 和近三年共同作者,我发现一个有点意思的事——他和 USTC 的连晋夫(Defu Lian)老师有持续合作,而且最近的两篇 ICLR 2025 不是关于 LLM 本身,是关于推荐系统中的数据撤销审计、训练数据检测、对抗性 mixup unlearning。
说白了,他在做"机器忘记"这件事,做得比"机器学习"还认真。这个方向在大模型时代会越来越重要——GDPR、个人数据撤销、模型 unlearning。proposal 里写"LLM 应用"很普通,但你能写"基于模型 unlearning 的隐私合规审计",他大概率会停一下。
组内能查到的几件事
我翻了他主页 People 那栏——这点这位老师做得比很多 ISOM 同事都规范。能数到的活跃博士生有 3 位,加上 postdoc 一两个。规模不算大,对一个 2017 入职、2023 升副教授的人来说是合理的——他在 7 年时间里没冲到大组那个量级,但产出非常稳。这种节奏的导师有一个特点:每个学生他都得过手。
毕业生去向这部分,主页没列。我翻了 LinkedIn——找到 2 个能确认的样本,1 个在国内大厂的 NLP 团队,1 个在另一所港校做 AP。样本太小,仅供参考。组里平均毕业年限我没查到确切的,从可见的发表节奏看,大概 4-5 年。
几个圈内判断点:看通讯不看一作(他近一年的论文绝大多数挂通讯);看 acknowledgment 里的 funding number 是不是 2023-2024 年新拿到的;看共同作者最近三年是不是变了——他和 Defu Lian、Kun Zhang 这两位老师的合作非常稳定,这通常意味着组内研究主线没大动。
赛道判断:商学院里的 ML 人,吃两份福利
他这个位置很有意思——商学院出身、做的却是非常硬的 ML/NLP 方法。这个定位的好处是:业界招的时候,他既能往科技公司投,也能进商学院做教职。坏处是:科研评价两边都得照顾——ISR、MISQ 这一档发文章要求 IS 学者认可,ICLR、ACL 这一档要求 ML 圈认可。学生跟着读,得习惯这种"双轨"压力。
如果你目标是工业界的 NLP/Recsys 工程师岗,这个组没问题。如果你目标是 R1 商学院教职,他确实是一个能带你走完整套训练的人。如果你目标是 CS 学术界(比如 CMU、Stanford 那种 AP 路线),坦白讲——他的研究虽然质量高,但你的论文产出会更偏 IS 期刊,CS 圈认这些会打折扣。
三个 proposal 切口,按可执行度排
切口 1:推荐系统中的 unlearning 与审计——对接他的 ICLR 2025 工作。对象:某类推荐场景(CTR 预测/序列推荐),方法:unlearning 算法 + 审计协议设计,数据:MovieLens、Amazon Reviews 这类公开集。
切口 2:金融文本里的图结构建模——对接他的 ISR 工作。对象:上市公司财报电话会议、SEC 文件,方法:图神经网络 + 对话建模,可追问问题:什么样的图结构能预测股价波动?
切口 3(避坑):纯做"LLM 在金融"——这个切入点太软,市面上 paper 已经太多。除非你能给出一个非常具体的 task 和一个不寻常的方法组合,否则不建议主写。
套磁这件事
套磁友好度我会给一个🟡 被动接受型——他没有挂明确 opening,但产出节奏说明组里有空间。回复率经验上不会高(这种级别的副教授一天几十封套磁邮件是常态)。
如果是我,我会建议你:邮件第一段先写你做过的一个具体 ML/NLP 项目(带 GitHub 链接最好),中间一句指明你读过他哪一篇——具体到 ICLR 2025 那篇 unlearning,最后一段提一个能续上他工作的题目。整封信压在 250 字以内。我接触过的学生里,第一封邮件超过 400 字的,基本石沉大海。
谁适合申,谁慎投
适合:本硕 CS、统计、数学、应用数学背景;至少有一篇 A 类会议或 SCI 投稿/接收经验;做过 NLP、推荐系统、ML 方法学其中一类的具体项目;英文写作能跟得上 ISR/ICLR 的标准。
慎投:本科是纯商科或金融,没系统训练过 ML/NLP 方法(这个组的硬指标是技术能力);想读博的主要动机是"转赛道做大模型"——他这个组做的不是大模型本身,是大模型相关的方法学;GPA 低于 3.5 且没有 published 工作。
学费、生活费与奖学金
港科大 PhD 标准 studentship 2026/27 学年大约HK$229,620/年(约 HK$19,135/月),年度旅行补贴另有,4-5 年制。学费 HK$42,100/年。这是研究生院发的,跟导师有不有钱关系不大。
HKPF(香港博士奖学金计划)一年大约HK$331,200(约 HK$27,600/月),香港全境每年录约 250 人。Yang 这个量级的导师,如果你 GPA + 论文背景都对得上,HKPF 拿到的概率不算低——他在 IS 圈、CS 圈都有影响力,推荐信和合作网络都帮得上你。
导师项目经费这一块他主页没明确公示。从他近年发表的合作署名和 acknowledgment 看,至少有一个 ITF 或 RGC GRF 在执行期,可能会有额外的 conference travel 或 RA 补贴。具体得在套磁信里直接问——这种细节属于"你不问,他也不会主动说"的类型。
家长那一边
家长如果在帮孩子参考:港科大商学院 PhD 期间,HK$19,000+/月的 studentship 基本能覆盖香港生活费(清水湾校区在新界,住校或附近租房月租约 HK$5,000-8,000)。学费在 studentship 内含,不需要额外掏钱。读博期间不太可能存到钱,但也不至于需要家庭额外贴。
最后给家长和学生一个具体的问题:如果你 GPA 3.7+、做过一个能挂在 GitHub 上的 ML 项目、能在 2-3 周内写出一份 5 页的 RP,这个组值得认真冲。如果以上三条只占两条,我会建议你先把 RP 写出来再决定要不要发套磁。
信息来源:HKUST ISOM 官网、Yi Yang 个人主页、Google Scholar、ICLR 2025 论文列表。数据截至 2026 年 5 月,具体以官方最新公告为准。
