清华大学教授 IEEE 会士 AAAI 会士 人工智能研究院副院长博士招生分析

前几天我又翻了一下他们组今年发的工作,挺有意思的。一边是 Vidu Q1 这种走出去做商业化的视频生成模型,一边还在 ICLR、NeurIPS 上稳定发着扩散模型的理论文章。我把这些事放在一起看了一阵,意识到一件事——这个组今年招博的口径,跟两年前已经不一样了。这不是哪位老师个人风格的事,是这个细分方向本身在变。

先把人交代清楚。这位老师是清华大学计算机系教授,IEEE 会士、AAAI 会士,人工智能研究院副院长,也是清华人智实验室主任。本科和博士都在清华读的,2011 年破格回清华任教,研究方向是机器学习基础理论与高效算法,最近这几年的主要工作集中在扩散概率模型的理论与大规模工程化上。组里参与研制了对标 Sora 的视频大模型 Vidu,2025 年又升级到 Q1 版本,开始做"高可控视频生成"。

说回这件事——口径的变化。我看下来有三个信号。

第一个信号,组里近两年发的论文,"工程含量"明显上来了。早几年这个组的代表作是 PAC-Bayes、最大间隔贝叶斯学习、扩散模型最优方差理论这一类纯理论的东西,引用很漂亮,但落地的痕迹不那么明显。这两年的代表作不一样,UniDiffuser、DPM-Solver、Vidu、ProlificDreamer——每一个名字背后都对应一个能跑起来、能放到产品里的具体系统。这意味着组里有很大一部分博士生的工作内容,已经不只是"证一个 bound",而是"把这个理论做成一个能上线的东西"。

第二个信号,清华人智实验室和生数科技这种双线结构,越来越成熟。这件事我手头查到的公开资料是:实验室继续做理论与开源框架(珠算、天授),公司做模型产品(Vidu)。两条线并不是分开的,组里学生很可能在两边同时投入。说白了,今年进去的博士,大概率不会再是一个"纯学术"的训练路径——你会被同时要求做研究和做产品。

第三个信号,整个生成式 AI 方向在 2025-2026 年的卡位赛。视频生成的窗口只有 12-18 个月,组里今年要做的事,跟 2023 年完全不在一个节奏上。我自己看下来,这种卡位赛会反过来挤压招生标准——他们没时间带一个"还需要从头训练的博士生"。

推荐

这个趋势对申请人意味着什么。我想分两类讲。

第一类,本科或硕士阶段已经有完整一作论文、且发表在 ICML / NeurIPS / ICLR 这种顶会的同学。你的常规判断是"我顶会发得不少,应该有竞争力"——这个判断今年仍然成立,但已经不够了。组里更看的是:你这篇论文背后,是不是你自己处理过一段不算简单的工程——比如你独立训过一个 100M 参数以上的模型,比如你做过完整的 data pipeline,比如你写过能让别人复现的开源代码。光是"我推导了一个 bound 然后跑了 MNIST 验证",今年不容易过初筛。

第二类,本科或硕士阶段论文不多、但工程能力很强的同学。你以为自己没竞争力,其实在今年这种口径下,你的胜率反而比去年高。你需要做的事是:把你的工程经历从"我做了 X 项目"翻译成"我处理过 X 问题"。比如你做过大模型分布式训练,你就要在 RP 里写清楚你在节点通信和显存优化上做了什么;你做过推理加速,你就写清楚是从什么 baseline 改到什么数字。这一类背景的人,今年套磁回信率比想象的高。

慎重考虑的是这种情况:本科 GPA 不错、论文一篇没有、工程也只停留在课程作业层面。这种背景过去几年还能靠"潜力"申进去,今年不太行。不是这个老师对学生不耐心,是组里没有时间从零带。我手头查到的资料是——这个组从 2023 年起,新生入组前几个月就要直接接进行中的项目,没有"先熟悉一年再上手"的缓冲了。

我先把话说在这里——这是我看下来的判断,组里的真实情况以官方公告和与导师本人沟通结果为准。但我建议想申的人这个月做一件事:打开清华大学研究生招生网,搜计算机系 2026 博士招生目录里这个方向有没有;然后读组里今年发的 Vidu 相关的两篇论文,做一个表,列出每篇的对象、数据规模、方法、和你自己能上手的位置。这两件事做完,再决定要不要发邮件。

推荐
上一篇

南方医科大学教授 工程院院士 脑科学中心主任 国家自然科学奖二等奖介绍

下一篇

清华大学交叉信息研究院博士招生分析 图灵奖得主姚期智院长介绍

返回顶部