01、招生要求

香港城市大学电气工程系博士项目设有两类申请通道。常规申请与香港博士奖学金计划(HKPFS)均要求申请人满足基础学术门槛:持有认可大学的研究型高等学位,或授课型硕士学位,或具有一等荣誉的学士学位。专业资格及其他学术成就可被视为同等学历。
非英语授课院校毕业生需提交两年内有效的语言成绩——托福网考总分不低于79分(阅读、听力与写作部分之和),或雅思综合分不低于6.5分。电气工程系虽未强制要求申请前联系导师,但强烈建议提前沟通并提交原创研究计划,以提升匹配度与录取概率。
HKPFS申请人需先在香港研究资助局系统完成初始申请,获取参考编号;随后在当日23时59分前,向城市大学在线系统提交完整材料并注明该编号。奖学金提供每月28,400港币津贴(约3,640美元)及每年14,200港币会议差旅津贴,最长持续三年。
第四年学习期间,城市大学继续发放同等额度津贴。此外,每位获奖者首年可获约105,800港币入学奖学金,覆盖学费及校内住宿费用。即便未获HKPFS最终遴选,通过系部初选的申请人仍可获得常规录取资格及全额学生津贴。
02、研究方向

Prof. Kwok Leung CHAN的研究围绕计算机视觉与图像处理核心问题展开,近年工作呈现从基础理论向应用系统延伸的特征。其研究版图可归纳为六个专题:
其一,医学影像精准分割。2025年发表于Medical Physics的论文提出对抗训练结合标签校正策略,针对同步非对比血管造影与斑块内出血MRI序列实现颈动脉自动分割。该方法通过对抗噪声注入提升模型对标注偏差的容忍度,在血管边界模糊场景中降低手动标注误差的影响。
其二,视频动作识别优化。2024年两项研究分别探索了运动保持池化与可变时序长度训练。前者设计可学习的下采样算子,在压缩空间维度的同时保留运动特征的时序完整性;后者突破传统固定片段输入的局限,允许卷积神经网络直接处理不同时长视频序列,提升训练灵活性与识别鲁棒性。
其三,单目三维视觉重建。2023年IEEE Access论文提出单目3D目标检测中的运动特征蒸馏框架,通过二维-三维空间映射将运动线索注入检测器,缓解深度预测的不确定性。同年在IET Image Processing发表的多曝光图像融合工作,利用局部三值模式引导三维模型重建,解决高光与暗区细节丢失问题。
其四,生物特征识别与步态分析。两项2023年Sensors期刊论文构建了多视角步态能量图与姿态图像的渐进式学习框架。第一阶段并行卷积网络分别提取轮廓序列、站立相与摆动相特征;第二阶段采用集成学习融合多源信息,实现性别分类准确率98.1%。该方法通过分阶段监督注入增强特征辨别力。
其五,图像退化抑制与增强。2023年Applied Sciences研究以条件生成对抗网络去除道路场景雾霾,提升下游目标检测性能。同年背景/前景分割工作结合传统背景建模与编码-解码卷积网络,在动态场景中改善分割精度。
其六,微表情识别与域适应。2023年Sensors论文构建双流3D卷积神经网络,融合时空信息识别面部微表情,并引入域适应机制缩小训练数据与真实场景分布差异。
03、有想法
结合导师已有布局与领域前沿,以下四个方向具备可行性与创新潜力:
一、多模态医学图像分割的因果推理增强
现有对抗训练方法虽能校正标注错位,但未显式建模图像采集过程中的因果关系。可引入因果图模型,将不同MRI序列(如T1加权、T2加权)视为干预变量,学习血管结构对序列参数的因果不变性。具体而言,构建序列-对抗-因果三阶段框架:第一阶段用条件生成器模拟不同序列成像特性;第二阶段在潜在空间施加因果约束,滤除序列特异性噪声;第三阶段在标注校正损失中引入因果干预项。此举有望提升模型在未见过的新成像协议下的泛化能力,减少跨设备迁移时的重标注成本。
二、事件驱动型轻量级动作识别系统
当前3D CNN计算开销制约了边缘部署。可转向事件相机数据,利用其低延迟、高动态范围特性。设计混合表示学习模块,将异步事件流转换为稀疏张量,结合导师提出的运动保持池化思想,开发事件-帧双模态协同架构。关键创新在于可学习的稀疏注意力机制——仅在事件累积强度超过动态阈值时触发帧特征提取,实现按需计算。系统目标是在功耗低于5W的嵌入式平台(如NVIDIA Jetson Nano)上实现实时识别,为可穿戴健康监护提供技术基础。
三、单目3D检测的跨视角几何一致性约束
单目3D检测在无人机视角下因高度信息缺失而性能骤降。可借力于多视角几何,在训练阶段利用无人机航拍序列的连续帧构建极线约束。具体设计几何一致性损失:对相邻帧检测出的同一目标,强制其三维中心点在相机坐标系下的投影满足对极几何关系。结合导师的运动特征蒸馏工作,将帧间光流与深度估计联合优化。该方案无需激光雷达,仅依靠视频序列即可自监督学习尺度信息,特别适用于大范围基础设施巡检(如铁路、电网)场景。
四、隐私保护下的联邦步态识别
生物特征识别引发隐私担忧。可在导师步态分析框架上引入联邦学习架构,使数据保留在本地摄像头设备。技术要点包括:设计轻量CNN在边缘端提取步态能量图的特征哈希码;采用差分隐私聚合机制,在中央服务器合并各设备的模型更新而不获取原始图像;引入同态加密保护性别标签等敏感属性。系统应支持跨机构协作训练(如医院、养老院)而不共享原始视频数据,符合GDPR等隐私法规要求。核心挑战在于平衡加密计算开销与识别精度,可通过量化和知识蒸馏降低通信与计算负担。