前几天我又翻了一下浙大计算机学院公开的科研团队介绍材料,又看了下VIPA组主页这两年的publication list,挺有意思的。
浙江大学计算机科学与技术学院的宋明黎教授,博导,视觉感知教育部-微软重点实验室(浙江大学)副主任。这个职务是值得展开说一下的——教育部-微软重点实验室在国内CV圈是有一定历史的几个老牌实验室之一,副主任这个位置意味着他在实验室的方向规划和资源分配上有发言权。他本人2006年浙大计算机博士毕业,攻读博士期间获得过微软学者称号,研究方向是模型驱动的深度学习、计算机视觉、图机器学习。
我看他这两年的工作,方向是从纯CV往"知识引导的学习"上偏的。具体来说——他原来做的是图像分类、检测、识别这类比较经典的CV任务,最近开始更多地把"模型为什么这样判断"这个问题摆到台前。组里有一篇近年的工作我印象比较深,对象是视觉感知任务里的不可解释性,方法上他们提出了一种把因果关系嵌入到深度网络结构里的做法。我看那篇方法部分写得很克制,没有声称解决了可解释性问题,主要是在说他们的网络在某些受控场景下能给出更稳定的归因。
这块儿我多说一句。VIPA组的招生策略,我看下来,跟一些纯刷分的CV组不一样。他们组的论文里,方法论部分通常会有"为什么我们要这样设计"这一层的论述,而不只是"这样设计带来了多少点提升"。这意味着他们对学生的训练里,是有思考"研究问题本身"这一步的,不是单纯地"用更复杂的模型刷一个数据集"。
你要申他的组,邮件第一段别只说做过哪些CV任务。说说你对"模型为什么work"这件事有没有想过。比如你做过一个目标检测项目,你能不能说出来你的模型在哪些类型的样本上系统性地错——是不是因为类别分布、光照条件、或者某个特定语义场景的缺失。这种"反思性"的表达,比你列举一堆SOTA数字更能让VIPA这种组的导师停下来认真看你的邮件。
我有点犹豫的一件事是——他这个组对申请人的代码能力要求其实蛮高的。我看他们近两年学生发的论文里,大多伴随着开源代码,PyTorch代码量都不小。如果你完全没有深度学习框架的实战经历,只有理论课程,那你的研究计划再漂亮,可能在面试环节会被卡住。这一点我没法打包票,因为不同年份的招生节奏不一样,但从他们公开的代码风格看,组里期待的应该是能上手干活的人。
浙大博士的招生节奏说几句。浙大2026年博士招生大部分通过申请考核制,部分专业有硕博连读路径。研究生院的博士招生专业目录通常在每年9-10月发布,申请考核制的报名时间会在11-12月开放,复试在次年3-4月。这个时间表你可以倒推一下,你现在5月底准备,到下半年集中申请是合理的。但如果你的科研经历还没成型,先把这个夏天用来补一段,比急着发套磁信更管用。
关于费用和资助,多说一句。浙大博士的资助构成是国家助学金、学业奖学金、博导课题组的助研津贴几个部分组成。CS方向因为课题组经费普遍较好,博士生月度可支配收入在国内属于中上水平,但具体到VIPA这种组的额度,没有公开数据我也不打包票。你套磁的时候不要直接问钱,要问的话也是问"实验室的项目类型大致是什么"——通过这个间接判断经费充裕度。
不只是宋教授一个人。CV这个方向的几个代表性课题组——浙大、清华、上交、中科院自动化所——这两年招博士的共同点其实蛮明显的。第一,纯刷分的研究计划基本不太受待见了,每个组都在往"研究问题驱动"上靠。第二,开源代码经历对申请有实质性的加分,你Github上有没有一个稍微像样的repo,比CV上多写一行"熟练PyTorch"管用十倍。第三,跨学科背景——比如本科是数学、物理、控制——在CV组里反而是优势,不是劣势。
写到这里我想到一件事,跟你随便分享一下。其实CV这个方向,这两年内的格局变化挺大的。大模型出来之后,传统的视觉task在很多组里被放到一边,新的研究问题——multi-modal、embodied AI、世界模型——开始占据更多论文。宋教授他们组的"模型驱动的深度学习"和"图机器学习"这种偏底层的方向,反而因为不追大模型的热点,看起来更稳一些。你选这种组,意味着你的博士四到五年时间里,做的是相对慢的、更基础的研究问题,而不是踩在最新热点上反复迭代。这件事到底好不好,我自己也判断不了。
最后讲下一步动作。如果你想申宋教授或者VIPA组其他老师,今天能做的具体一件事是:打开浙大计算机学院的官方科研团队介绍页(cs.zju.edu.cn),找VIPA团队介绍表,再去person.zju.edu.cn上找宋明黎教授的个人主页,把他Google Scholar上近两年引用数前五的论文打开,每篇看摘要和方法部分,记下三个问题。这三个问题,是你后面写套磁信和研究计划的底层素材。
一个问题留给评论区:你的CV或者你做过的研究里,最具体的一段"踩坑"经历是什么?模型不收敛、数据集脏、实验复现失败,都算。
