大会议程 AGENDA

音频技术

10.24 14:00-17:40

出品人:谢磊

14:00-14:35

极端环境中的语音信号获取与传输

声信号获取与处理技术不仅是语音通信和人机语音交互系统的基石,也可以用于灾害(如地震、矿难、火灾等)等极端环境中协助完成很多挑战性的任务。但和日常的语音通信和人机交互环境相比,极端场景下的声信号获取与传输面临很多不同的挑战,不仅涉及到弱信号(信噪比远远小于0分贝)的感知、还涉及到平台的设计与平台噪声控制等诸多问题。在这个报告中,我将简要介绍麦克风阵列的设计与处理方法,然后讨论如何利用麦克风阵列来实现灾难场景下微弱声信号的获取、参数估计以及信号和参数的传输问题。

14:35-15:10

汽车音频新风口下的机遇和挑战

新能源时代的到来为百年汽车行业带来了前所未有的变革,造车理念的转变引发了人们对座舱体验的全新思考和定义,而其中声音体验逐渐成为尤其重要并受到广泛关注的环节。汽车音频技术也因此迎来了新风口下的发展机遇。此次演讲会具体分析汽车音频新机遇的产生原因,并且展开介绍新的体验驱动思路下音频技术在汽车领域的应用场景以及面临的多种技术挑战。希望在此过程中抛砖引玉,引发业内同仁的关注和思考,在新能源汽车大背景下推动音频技术的普及应用。

演讲提纲:
1.汽车音频技术发展历史
2.汽车音频新机遇的形成
3.汽车音频技术应用场景
4.汽车音频技术挑战及展望

15:10-15:45

音频AIGC在喜马拉雅的研发以及落地

随着神经网络以及大模型技术的兴起,多模态以及语音大模型技术也成为了研究热点。本次分享主要介绍喜马拉雅语音大模型技术,包括语音生成以及风格转换的大模型的研究以及落地。同同时介绍多模态情感识别大模型在语音交互中的应用。

演讲提纲:
1. 语音生成大模型
2. 多模态情感识别
3. 音频AIGC在喜马拉雅的落地应用

15:45-16:20

声网凤鸣AI引擎:AI音频降噪、AI回声消除和3D空间音频算法的实现与应用

声网凤鸣AI引擎包含了AI降噪、AI回声消除、空间音频等在内的声网新一代智能音频技术。其中凤鸣·AI降噪采用均衡的损失函数组合方案来兼顾强降噪与高保真,采用噪声抑制和远场去混响一体化模型在强降噪的同时实现远场混响抑制;凤鸣·AI回声消除采用均衡的损失函数组合方案来兼顾非线性回声抑制和近端语音保护,实现高保真音频体验;凤鸣·空间音频通过纯软件算法方案,模拟头部球面区域立体声场,利用范围音频、人声模糊、空气衰减模拟等能力,模拟现实听觉感受。

演讲提纲:
1. 凤鸣AI引擎在解决音频领域多个核心问题上的价值
2. 基于传统信号处理的音频算法在实际应用中的问题
3. 基于人工智能的音频降噪算法的研究与应用
4. 基于人工智能的回声消除算法的研究与应用
5. 基于3D空间音频技术的研究与应用
6. 总结与展望

16:20-16:55

游戏场景下的音频内容生成式技术

随着深度学习技术的发展,语音技术逐渐在生活的各个应用场景落地生根。在本次报告中,将结合游戏场景下,音频内容生成的需求与实际问题,分享网易伏羲在生成式音频技术上的经验与成果。同时,对未来游戏场景下,音频内容生成式技术的趋势进行展望。

演讲提纲:
1. 游戏剧情音频内容生成
2. 游戏实时语音生成玩法
3. 实时语音转换技术
4. 游戏场景下,音频技术尚未解决的需求

16:55-17:30

声反馈系统的技术实践

音频类的产品是一项系统性工程,从硬件的器件选型、腔体结构设计、芯片、功耗等等,各个方面都影响着整体产品的表现。本次报告,将会结合蛙声在音视频硬件研发过程中的积淀,聚焦远程和本地会议协作场景,针对客户实际使用场景中的各种痛难点需求,分享蛙声在音频硬件研发过程中的实践经验,相关的软硬件技术,以及对未来行业应用前景的展望。

演讲摘要:
1. 音频类产品在不同用户场景下的痛点和需求
2. 音频类产品研发的硬件选型策略
3. 音频类产品前端音频信号实时处理技术
4. 行业应用与未来展望