香港科技大学(广州)全奖博士项目(Zishuo Ding教授)

一、导师简介

香港科技大学(广州)全奖博士项目(Zishuo Ding教授)

现任香港科技大学(广州)数据科学与分析学域助理教授的Zishuo Ding(丁子硕),2024年于University of Waterloo电气与计算机工程系取得软件工程博士学位,导师为Weiyi Shang教授。智能化方法(ML/DL/LLMs)在软件工程任务中的效能提升构成了Ding教授的研究核心,具体方向涵盖:面向软件工程的自然语言处理技术优化,以及大规模系统的软件性能工程。ICSE、FSE、ASE、TOSEM、EMSE等旗舰会议与期刊发表了其多项成果,ICSE 2020的ACM SIGSOFT Distinguished Paper Award被其收入囊中。

二、近期文章和项目解析

香港科技大学(广州)全奖博士项目(Zishuo Ding教授)

Ding教授近期学术活动集中于大型语言模型(LLMs)与软件工程的交叉地带,日志分析、性能工程及代码表征学习构成其三大主攻板块。

推荐

日志分析领域,Defects4Log基准数据集的构建工作尤为关键。该数据集系统评估了LLMs对日志代码缺陷的检测与推理能力。研究发现揭示了一个重要现象:直接基于源代码的缺陷检测,LLMs表现受限;然而,一旦引入结构化知识——如缺陷模式的详细场景描述——检测准确率便实现10.9%的显著提升。这一发现的价值在于,它指明了领域知识显式注入对LLM在特定软件工程任务中鲁棒性增强的关键作用。

性能工程维度,LLM4Perf项目开辟了新的技术路径。传统性能测试长期面临人工设计测试用例成本高昂、覆盖率受限的双重困境。Ding教授的研究表明,LLMs具备通过历史性能数据分布学习,生成高错误检测潜力测试输入的能力。这一发现为自动化性能测试提供了可行性基础。

代码表征学习方面,Ding教授在TOSEM发表的"Towards Learning Generalizable Code Embeddings using Task-agnostic Graph Convolutional Networks"提出了创新性解决方案。基于任务无关图卷积网络的通用代码嵌入学习方法,通过捕捉代码结构依赖关系,生成可迁移至多种下游任务(缺陷预测、代码搜索等)的表征向量。该方法有效缓解了传统预训练模型在跨项目场景中的性能衰减难题。

三、未来研究预测

综合Ding教授现有研究轨迹及软件工程学科演进趋势,其未来研究可能沿以下维度深化:

多模态软件工程(Multi-modal Software Engineering)有望成为首要突破方向。当前LLMs主要处理文本形式的源代码,但软件系统还包含执行轨迹、性能指标、日志序列等异构数据。Ding教授或将探索融合代码文本、运行时日志及系统度量的多模态表征学习,构建更全面的软件系统理解框架。

AIOps中的因果推理(Causal Inference in AIOps)构成第二个潜在增长点。现有AIOps研究多基于相关性分析进行异常检测与根因定位,但在复杂分布式系统中,相关性往往不等于因果性。鉴于Ding教授在性能工程领域的深厚积累,因果推断方法的引入值得期待——从海量监控数据中识别性能退化的根本原因,而非仅停留在症状识别层面。

LLM驱动的软件性能优化自动化构成第三个演进方向。软件系统规模的持续扩张,使得性能瓶颈识别与优化愈发依赖专家经验。基于LLM的智能体(Agents)开发,实现从性能瓶颈定位、优化策略生成到代码重构的全流程自动化,可能成为Ding教授降低性能工程人力门槛的突破口。

推荐
上一篇

美本、美研、美博申请时间线对比

下一篇

“我是美籍竟被算作国际生!”你属于哪个美本申请池划分标准早就定好了……

返回顶部