招生要求
香港科技大学(广州)数据科学与分析博士项目招生条件如下:
· 学历要求:申请者必须获得认可院校的学士学位,且成绩优异;或者有证据表明已在全日制研究型硕士项目中完成至少一年的学习,或在非全日制项目中完成至少两年的学习。
· 英语能力:申请者需具备优秀的英语写作和沟通能力,满足港科大(广州)的英语语言入学要求。如果申请者的第一语言不是英语,且所获学位不是以英语为教学媒介的机构授予的,则需提供英语能力证明(如TOEFL或IELTS成绩)。
· 研究经历:具有相关领域的研究经验和在期刊或会议上发表的论文将是优势。
· 专业背景:理想的申请者应具有计算机科学、数学或相关领域的强大基础,编程能力出众。
· 学制:全日制博士项目为3年(具有相关研究型硕士学位的申请者)或4年(无相关学位的申请者);非全日制为6年。
· 奖学金:所有录取的博士生将获得全额奖学金(每月约15,000元人民币),学费为每年40,000元人民币。
申请是全年滚动进行的,但名额有限,建议有意向的学生尽早提交申请。
研究方向
陈雷教授是香港科技大学(广州)信息枢纽的院长,数据科学与分析方向的讲座教授,也是IEEE Fellow和ACM杰出科学家。他在数据科学领域贡献卓著,发表论文数量可观(截至2025年已发表639篇论文,其中2019年以来就有400多篇)。
陈教授的主要研究方向包括:
· 数据驱动机器学习:关注如何利用大量数据训练有效的机器学习模型,研究数据准备、压缩及计算图优化等技术。
· 众包数据处理:开创性地将人力与机器学习相结合,通过众包获取高质量数据标注和验证,提高AI系统性能。
· 不确定性与概率数据库:研究处理包含不确定性的数据,开发适应模糊性和随机性的数据管理技术。
· Web信息管理:包括知识图谱构建、链接预测、语义集成等技术,提升网络信息的组织和检索能力。
· 多媒体系统:研究图像、视频等多媒体数据的管理和分析方法。
· 区块链技术:探索区块链在数据安全与隐私保护中的应用。
· 图数据分析:研究复杂网络和关系数据的处理方法,包括图神经网络和图数据库技术。
陈教授的团队曾获得2015年SIGMOD经典论文奖和2022年VLDB最佳研究论文奖,研究成果在学术界和工业界均有重要影响。
有想法
基于陈雷教授的研究方向,以下是几个具有创新性和可行性的研究计划:
1. 自适应众包质量控制框架
研究一个能够自动调整任务分配和质量评估策略的众包系统。通过分析工作者历史表现、任务特性和领域知识,动态优化任务路由和验证机制,同时将众包与机器学习模型训练无缝集成,形成人机协作闭环。该研究可应用于构建高质量医学影像数据集或复杂知识图谱。
2. 多模态知识图谱与大语言模型融合
设计一种将结构化知识图谱与非结构化文本、图像等多模态数据融合的框架,利用大语言模型增强知识图谱的推理能力和覆盖面。重点解决模态间的语义对齐、知识冲突消解和增量更新等关键技术问题,为下一代AI系统提供更全面的知识基础。
3. 隐私保护分布式时空数据挖掘系统
针对智慧城市和物联网场景,开发既能保护个人隐私又能提取有价值洞察的时空数据分析技术。采用联邦学习与差分隐私相结合的方法,在多源异构数据上实现高效的模式发现、异常检测和趋势预测,特别关注数据稀疏性和不确定性的处理。
4. 可解释图神经网络优化框架
研发一套用于优化图神经网络的工具集,特别关注模型的可解释性和鲁棒性。通过集成神经架构搜索、知识蒸馏和可解释性技术,自动为不同图结构和任务定制最优网络结构,同时提供决策过程的透明解释,增强模型在关键应用中的可信度。