一、导师简介

Jiheng ZHANG教授现任香港科技大学工业工程与决策分析系系主任,同时兼任数学系教授。2009年获Georgia Institute of Technology工业工程博士学位后,其研究始终聚焦于Operations Research与Applied Probability的交叉地带。值得注意的是,这种双重院系任职结构为博士生提供了独特的跨学科支持通道——既能在传统运筹学框架下打磨理论工具,又可借助数学系的计算资源处理大规模随机系统。
从发表记录看,ZHANG教授近五年在Operations Research、Manufacturing & Service Operations Management等顶刊保持年均1-2篇产出,同时高频出现在ICML、KDD、NeurIPS等机器学习会议。这种发表节奏反映出研究策略:将排队论、随机控制等经典方法注入区块链、在线服务等新兴场景,再用ML算法解决传统OR中假设过强、维度过高的痛点。
二、近期文章和项目解析
2.1 分布式系统的运营理论
该方向集中体现于2020-2024年主持的RGC项目"Modeling and Analysis of Decentralized Service Systems"。对应论文呈现清晰的逻辑链条:Gong等(2024) Operations Research提出加权随机块改进区块链一致性边界,从概率角度量化PoW机制的最终性;He等(2023) Manufacturing & Service Operations Management则引入安全顾虑下的最优决策框架,将攻击成功率建模为马尔可夫过程,求解矿工的纳什均衡策略。
2025年发表于IEEE Transactions on Computers的CP-ABE研究转向元宇宙数据共享,从运筹视角看,这实际是将访问控制策略转化为带约束的优化问题——如何在去中心化前提下最小化密钥滥用风险。该文与区块链研究共享同一内核:分布式环境中的协调效率损失。ZHANG教授团队的处理方式不依赖密码学创新,而是建立效用函数衡量"去中心化程度"与"系统性能"的帕累托前沿。
技术纵深解释:递归降维(RDR)方法为这类分析提供工具。传统多优先级排队系统面临状态空间指数爆炸,RDR通过引入忙期转移将m维无限状态链递归化简为一维,使区块链分叉选择、交易池优先级排序等复杂问题获得可计算解。ZHANG团队虽未直接使用RDR术语,其对多智能体竞争的建模思路与此一致——用概率生成函数捕捉高维交互的聚合效应。
2.2 服务运营的智能化
2024年Operations Research发表的"On-Demand Ride-Matching in a Spatial Model with Abandonment and Cancellation"处理动态匹配中的双边放弃行为。该模型突破传统排队论"顾客单方面放弃"假设,引入司机取消率的时空异质性。这种现实复杂性倒逼方法论革新:Wang等采用流体近似将离散随机匹配转化为连续时间最优控制,求解最小化乘客等待与司机空驶的均衡策略。
客户服务中心研究(Long等, 2024 Manufacturing & Service Operations Management)同样处理一般分布的服务时间/耐心时间。该文证明广义c/μ规则在异构服务器池中的渐近最优性,但关键贡献在于证明过程——不依赖指数分布的无记忆性,转而使用剩余工作量 hazard rate 构建动态优先级指数。这为后续机器学习改造留出接口:当服务时间分布未知时,可用生存分析实时估计hazard rate,替代理论假设。
两个在研项目揭示下一步方向。参与的"Machine Learning-Based Queueing Priority Rules"项目(2024-)试图用深度强化学习直接从数据中学习优先级函数,绕过解析推导。流体模型文献显示,过载多服务器系统若采用FCFS路由,流量分配存在非唯一性。ML方法可自适应发现最优路由模式,但需解决样本效率问题——这正是参与项目的关键挑战。
2.3 学习算法的理论基础
强化学习论文显示两条主线。Fan等(2024)研究独立函数逼近下的马尔可夫博弈,关注样本复杂度上界改进。理论贡献在于证明:局部访问模型下,智能体无需探索对手策略空间,仅通过自身状态-动作对的乐观估计即可达到均衡。这在去中心化系统中有直接应用——矿工或验证节点无需知晓他人私有成本结构。
Liang等(2024)的"Single-Trajectory Distributionally Robust RL"处理非稳态环境。传统RL假设环境固定或缓慢变化,但该文仅依赖单条轨迹构建置信域,通过Wasserstein球刻画分布偏移。这与在线广告项目(2025-)直接相关。Han等(2024)在PMLR的"Optimal Contextual Bandits with Knapsacks"提出基于回归预言机的算法,将资源约束融入探索-利用权衡,电商广告竞价、网约车动态定价均可归为此框架。
独特分析:非平稳性本质在于最优策略的时间不一致性。传统方法如动态后悔要求环境变化有界,但实际广告点击率可能突现季节性跳变。ZHANG团队的路径选择是——不建模环境变化过程,而是构建鲁棒优化使策略对任意分布偏移保持稳定。这比跟踪变化参数更契合工业界需求:在线系统无法频繁重启训练。
三、未来研究预测
方向一:随机模型的"可微化"改造。传统排队网络分析依赖映射法、分解法,所得策略为静态规则。在研项目显示团队正将神经网络嵌入仿真优化框架,使服务率、路由矩阵成为可微参数。此方向学生需掌握流体力学与反向传播的结合技巧。
方向二:DeFi协议的经济安全分析。当前区块链研究聚焦共识层,未来可能延伸至应用层——如流动性池的激励相容性、跨链桥的抢跑攻击防护。这需要将博弈论与随机过程耦合建模,博士生可尝试在"Economic and Stochastic Models of Novel Financial Technologies"项目基础上拓展。
方向三:生成模型在运营仿真中的应用。Han等(2022)用WGAN模拟多资产价格,暗示该方法可推广至需求预测、服务时间分布估计。与单纯数据驱动预测不同,运营场景要求生成样本满足物理约束(如库存非负、容量有限),这需在建模阶段注入约束条件,属于新兴交叉点。
