01、招生要求

香港科技大学(广州)对博士申请者的基本要求包含三个层面。
第一,学历与成绩门槛:申请人需持有认可院校的学士学位,或同等学历资格;博士申请者还需提供杰出学业表现的证明,或曾以全职身份修读至少一年、兼职身份修读至少两年的研究生课程并提交满意的成绩单。
第二,英语语言能力:非英语母语申请者需提交托福iBT 80分、纸笔版550分,或雅思学术类总分6.5(单项不低于5.5)的成绩。若申请人本科阶段授课语言为英语,可豁免此项要求。
第三,学术背景与研究潜力:人工智能学域虽未设定硬性限制,但具备计算机科学、自动化、数学与应用数学、电子工程等相关专业背景的申请者更具竞争力。导师团队尤其看重扎实的数学基础、熟练的编程能力,以及发表过AI领域顶会或顶刊论文的研究经历。
这些要求的核心意图在于筛选出具备快速进入研究状态能力的学生——英语能力确保文献阅读与国际交流无碍,数学与编程功底决定理论推导与实验落地的效率,而研究经历则直接反映学术成熟度。
02、研究方向

Enyan Dai教授的研究围绕可信赖人工智能及其真实场景展开,具体可归纳为四个分支。
其一,可信赖图学习。该方向聚焦图神经网络的公平性与鲁棒性。在公平性层面,Dai教授提出FairGuide框架,通过引入可微分的社区检测伪任务,在不修改原始图结构的前提下,利用元梯度策略识别新增链接以引导图结构向无偏方向发展。在鲁棒性层面,其团队设计了基于混合专家架构(MoE)的统一防御框架RGMoE,通过互信息约束促使不同专家关注差异化邻域结构,并引入鲁棒性感知路由器自适应地将受扰动节点分配至高鲁棒性专家,从而同时抵御后门攻击、边操纵与节点注入等多种对抗威胁。
其二,图学习隐私与安全。Dai教授率先揭示了图神经网络在隐私层面的根本脆弱性——训练图结构可通过模型参数泄露。其团队于KDD '25发表的研究证实,GNN参数与训练图存在强关联,并提出基于图扩散模型与噪声优化的窃取方法,能够从公开模型中高精度重建原始训练数据。此外,针对图提示学习(GPL)这一新兴范式,团队提出TGPA后门攻击框架,在无权重修改的前提下向提示注入隐藏触发器,并设计了抗微调投毒机制以维持攻击有效性。
其三,AI驱动的科学发现。在蛋白质分析领域,Dai教授主导开发了Protap基准系统,系统评估不同骨架架构、预训练策略与领域专用模型在工业级下游任务中的表现。该工作涵盖三个通用任务与两个专门任务(酶催化切割位点预测、靶向蛋白降解),实验揭示大规模预训练编码器在小样本场景下未必优于监督编码器,而结构信息融入可弥补序列预训练的不足。
其四,社交网络与电网异常检测。虽未在最新预印本中详尽展开,但导师主页明确指出虚假新闻检测与电网异常检测是其可信赖AI方法落地的主要场景。前者涉及图结构下的信息传播建模与可信验证,后者需处理时序图数据中的少样本异常识别问题。
03、有想法
基于Dai教授的研究脉络与领域前沿,以下三个博士课题具备高度可行性与创新价值。
课题一:动态金融图谱中的公平性感知链路预测
核心问题:现有FairGuide框架面向静态图,而金融风控场景(如反洗钱、信贷欺诈)中的账户交易网络具有显著时序动态性,且节点/边公平性定义随监管政策演变。
技术路径:将FairGuide扩展为时序版本,设计基于连续时间图神经网络的链路预测器,引入注意力机制动态捕捉公平性敏感特征;在政策变更时,采用元学习快速适配公平性约束而非从头训练。
预期贡献:为香港及大湾区金融监管提供可解释、合规的图学习工具;理论上可证明时序公平性约束的收敛边界。
课题二:蛋白质-配体相互作用预测中的联邦隐私保护框架
核心问题:Protap基准显示结构信息至关重要,但药企数据孤岛效应导致标注蛋白质构象数据稀缺,且直接共享模型存在图窃取风险。
技术路径:构建联邦图学习范式,各药企在本地训练基于结构感知的GNN编码器;全局聚合时采用差分隐私与梯度压缩,防止参与方通过上传梯度反推私有蛋白图;引入Dai教授的图窃取检测机制作为联邦监控模块。
预期贡献:在不泄露核心资产前提下实现跨机构蛋白药物发现协同;方法可扩展至其他分子科学领域。
课题三:抗提示污染的大语言模型增强图问答系统
核心问题:大语言模型(LLM)与图结合(如GraphRAG)已成趋势,但TGPA攻击表明图提示可能被投毒,导致LLM生成不可靠答案。
技术路径:设计双层验证架构——底层利用RGMoE的鲁棒路由机制过滤可疑图提示,顶层通过LLM自身的一致性检验(如采样多个解码路径)识别异常响应;开发图提示 sanitization 工具包,自动检测并修正投毒模式。
预期贡献:提升LLM在知识图谱问答、药物咨询等高风险场景下的可信度;方法具备即插即用特性,可集成至现有GraphRAG框架。
以上课题的共同价值在于精准衔接导师既有技术储备与真实痛点。课题一将静态公平性研究推向动态应用,符合AI治理的演进方向;课题二直面产业数据孤岛与隐私泄露的矛盾,具备明确商业化潜力;课题三则抢占LLM时代图可信研究的先机,有望产出高影响力顶会论文。申请者需在研究计划中展现对导师论文的精读痕迹(如引用其具体定理或实验设置),并明确指出自身背景(数学优化、生物信息学或系统安全)如何填补课题执行中的技能空缺,这能显著提升录取概率。
