香港科技大学（广州）全奖博士项目（Zishuo Ding教授）

一、导师简介

现任香港科技大学（广州）数据科学与分析学域助理教授的Zishuo Ding（丁子硕），2024年于University of Waterloo电气与计算机工程系取得软件工程博士学位，导师为Weiyi Shang教授。智能化方法（ML/DL/LLMs）在软件工程任务中的效能提升构成了Ding教授的研究核心，具体方向涵盖：面向软件工程的自然语言处理技术优化，以及大规模系统的软件性能工程。ICSE、FSE、ASE、TOSEM、EMSE等旗舰会议与期刊发表了其多项成果，ICSE 2020的ACM SIGSOFT Distinguished Paper Award被其收入囊中。

二、近期文章和项目解析

香港科技大学（广州）全奖博士项目（Zishuo Ding教授）

Ding教授近期学术活动集中于大型语言模型（LLMs）与软件工程的交叉地带，日志分析、性能工程及代码表征学习构成其三大主攻板块。

日志分析领域，Defects4Log基准数据集的构建工作尤为关键。该数据集系统评估了LLMs对日志代码缺陷的检测与推理能力。研究发现揭示了一个重要现象：直接基于源代码的缺陷检测，LLMs表现受限；然而，一旦引入结构化知识——如缺陷模式的详细场景描述——检测准确率便实现10.9%的显著提升。这一发现的价值在于，它指明了领域知识显式注入对LLM在特定软件工程任务中鲁棒性增强的关键作用。

性能工程维度，LLM4Perf项目开辟了新的技术路径。传统性能测试长期面临人工设计测试用例成本高昂、覆盖率受限的双重困境。Ding教授的研究表明，LLMs具备通过历史性能数据分布学习，生成高错误检测潜力测试输入的能力。这一发现为自动化性能测试提供了可行性基础。

代码表征学习方面，Ding教授在TOSEM发表的"Towards Learning Generalizable Code Embeddings using Task-agnostic Graph Convolutional Networks"提出了创新性解决方案。基于任务无关图卷积网络的通用代码嵌入学习方法，通过捕捉代码结构依赖关系，生成可迁移至多种下游任务（缺陷预测、代码搜索等）的表征向量。该方法有效缓解了传统预训练模型在跨项目场景中的性能衰减难题。

三、未来研究预测

综合Ding教授现有研究轨迹及软件工程学科演进趋势，其未来研究可能沿以下维度深化：

多模态软件工程（Multi-modal Software Engineering）有望成为首要突破方向。当前LLMs主要处理文本形式的源代码，但软件系统还包含执行轨迹、性能指标、日志序列等异构数据。Ding教授或将探索融合代码文本、运行时日志及系统度量的多模态表征学习，构建更全面的软件系统理解框架。

AIOps中的因果推理（Causal Inference in AIOps）构成第二个潜在增长点。现有AIOps研究多基于相关性分析进行异常检测与根因定位，但在复杂分布式系统中，相关性往往不等于因果性。鉴于Ding教授在性能工程领域的深厚积累，因果推断方法的引入值得期待——从海量监控数据中识别性能退化的根本原因，而非仅停留在症状识别层面。

LLM驱动的软件性能优化自动化构成第三个演进方向。软件系统规模的持续扩张，使得性能瓶颈识别与优化愈发依赖专家经验。基于LLM的智能体（Agents）开发，实现从性能瓶颈定位、优化策略生成到代码重构的全流程自动化，可能成为Ding教授降低性能工程人力门槛的突破口。

本文由 Molly 转载发布在国际教育联盟平台，版权归原作者所有，如有侵权，请直接联系微信进行处理。