【全奖】香港城市大学博士导师介绍(陈祥发教授)

招生要求

香港城市大学电子工程系博士项目的招生要求主要包括以下几个方面:

1.1 学术背景要求

·持有认可大学的一级荣誉学士学位(或同等资格)

·持有认可大学的硕士学位(或同等资格)

·或为香港城市大学的硕士研究生,申请转为博士候选人

1.2 英语能力要求

非英语为教学语言的大学毕业生必须满足以下最低英语水平要求:

·TOEFL成绩至少为563分(纸基考试)或85分(网考)或62分(修订版纸基考试,阅读、听力和写作部分总分)

·或其他被视为等同于上述TOEFL成绩的考试分数

1.3 奖学金情况

·香港城市大学为录取的全日制博士生提供每月17,800港币(约2,282美元)的奖学金

·表现优秀的候选人可获推荐申请香港博士研究生奖学金计划(HKPFS),该奖学金提供每月27,100港币(约3,474美元)的津贴

·部分学院/系还提供额外的奖学金和资助

1.4 申请流程

·申请者需先通过香港博士研究生奖学金计划电子系统(HKPFSES)在线提交初步申请,获取HKPFS参考编号

·申请者可选择最多两个学校或两个学院/部门的博士项目

·申请者须符合所选大学和项目的录取要求

研究方向

【全奖】香港城市大学博士导师(陈祥发教授)

陈祥发教授是香港城市大学电子工程系的副教授,他的主要研究方向包括以下几个方面:

2.1 语音与音频编码

·宽带码激励线性预测(Wideband Code Excited Linear Prediction):研发基于CELP的低比特率语音编码器,已应用于多个工业应用中

· 宽带谐波+噪声编码(Wideband Harmonic+Noise Coding):2015年发表了《A harmonic+noise coder with improved transient speech performance》,优化了瞬态语音性能

· 多通道参数无损音频编码(Multi-Channel Parametric Lossless Audio Coding):专注于高质量音频压缩技术

2.2 语音分析与增强

·基于模型的人工带宽扩展(Model-Based Artificial Bandwidth Expansion):扩展窄带CELP编码语音的技术

·利用语音动态特性进行鲁棒降噪(Robust Noise Suppression by Exploring Speech Dynamics):2013年发表《Incorporating dynamic track information for all-pole parameter estimation in noise》,研究参数估计技术

2.3 3D声音处理

· 头相关传递函数建模与定制(Modelling and Customization of Head-Related Transfer Functions):多篇研究论文集中在这一领域,包括:

  • 2015年发表《Continuous function modeling of head-related impulse response》
  • 2015年发表《Quaternion common factor decomposition of head-related impulse response》
  • 2013年发表《Two-dimension common factor decomposition of head-related impulse response》

·基于声束形成的虚拟环绕声(Virtual Surround Sound with Acoustic Beam Forming)

· 使用分数阶微积分的音乐物理建模(Physical Modelling of Music Using Fractional Calculus):2020年发表《Exponential sum approximation for Mittag-Leffler function and its application to fractional Zener wave equation》

2.4 声音检测与分类

·人类/非人类声音检测(Human/Non-Human Sound Detection)

·安全监控异常声音检测(Abnormal Sound Detection for Security Monitoring)

陈教授的研究成果已被广泛应用于消费电子产品和安防监控行业。1994年,他共同创立了"远眼"公司(TeleEye),该公司开发创新的语音和图像压缩技术,并于2001年5月8日在香港创业板上市。

Mason博士有想法

基于陈祥发教授的研究方向,以下是几个高质量可行的创新研究计划想法:

3.1 基于深度学习的头相关传递函数个性化定制方法

研究背景:目前的头相关传递函数(HRTF)建模方法大多基于传统的信号处理技术,如陈教授提出的"Two-dimension common factor decomposition"和"Quaternion common factor decomposition"等。然而,这些方法在个性化定制方面仍有局限性。

研究目标:开发一种基于深度学习的HRTF个性化定制方法,仅通过几张用户头部和耳朵的照片,就能预测其个人化的HRTF。

研究方法:

1.建立一个包含不同人种、年龄、性别的大型多模态数据库,包括3D头部扫描模型、耳朵形状参数和相应的HRTF测量数据

2.设计并训练一个深度神经网络,将从图像中提取的头部和耳朵特征映射到HRTF参数空间

3.应用陈教授的四元数分解方法,降低HRTF表示的维度,简化网络学习任务

4.开发移动应用程序,允许用户上传自拍照,获取个性化的HRTF配置文件

预期成果:该研究将显著提高3D音频体验的个性化程度,使其更加准确且易于获取,为VR/AR应用提供更身临其境的声音体验。

3.2 分数阶微积分在语音信号建模中的应用

研究背景:陈教授在2020年发表的论文中探讨了Mittag-Leffler函数在分数阶Zener波方程中的应用。分数阶微积分具有描述复杂系统记忆特性的优势,但在语音信号建模中的应用仍然有限。

研究目标:探索分数阶微积分在语音信号建模中的应用,开发新的语音分析、合成和处理方法。

研究方法:

1.研究分数阶微分方程在描述人类发声机制中的应用

2.开发基于分数阶微积分的语音参数化模型,捕捉语音信号的长时间相关性和非线性特性

3.将该模型应用于低比特率语音编码,特别是改进现有的谐波+噪声编码框架

4.开发基于分数阶微积分的语音增强算法,特别针对非平稳噪声环境

预期成果:该研究将为语音信号处理提供新的数学工具,有望在低比特率语音编码、语音增强和语音合成领域取得突破,特别是在处理非平稳和高度非线性语音信号方面。

3.3 多模态安防监控系统中的音频事件检测与分类

研究背景:陈教授在安全监控异常声音检测方面有研究经验,也与TeleEye公司有产业联系。随着安防监控系统的智能化,音频事件检测与分类变得越来越重要。

研究目标:开发一种融合音频和视频信息的多模态异常事件检测系统,特别针对城市安全、老人看护和智能家居应用场景。

研究方法:

1.建立一个大型多模态数据集,包含各种正常和异常事件(如玻璃破碎、呼救、争吵等)的音频和视频数据

2.开发一种时空注意力机制,有效融合音频和视频特征

3.设计轻量级神经网络架构,适用于边缘设备部署

4.开发主动学习框架,减少标注数据的需求,提高系统在新环境中的适应性

5.实现实时处理和报警系统,与现有安防平台集成

预期成果:该研究将大大提高安防监控系统的智能水平和准确性,减少误报率,为城市安全、智能家居和老人看护提供更可靠的解决方案。与陈教授的产业背景结合,这一研究有很好的商业化前景。

【竞赛报名/项目咨询+微信:mollywei007】

上一篇

澳门大学计算机学系PhD博士招生中!(导师Prof. WU)

下一篇

新加坡国立大学全奖博士项目 (Vanessa Luna Banta教授)

你也可能喜欢

  • 暂无相关文章!

评论已经被关闭。

插入图片
返回顶部