发布信息

【展会动态】大象声科亮相 GAIC,硬核分享端侧 AI 语音技术创新应用

作者:本站编辑      2026-05-18 19:26:10     0
【展会动态】大象声科亮相 GAIC,硬核分享端侧 AI 语音技术创新应用

前言

5 月 14 日,2026全球人工智能终端展暨第七届深圳国际人工智能展览会(GAIC)在深圳会展中心成功举办。在其「端侧 AI 与智能硬件生态大会」分论坛上,大象声科研发总监闫永杰受邀发表主题演讲端侧 AI 智能语音技术的创新应用》,围绕端侧 AI 的发展趋势、智能语音交互面临的真实场景挑战,以及大象声科在 AI 语音前端算法、芯片、模组和行业落地中的实践进行了硬核分享。

随着端侧推理能力、低功耗芯片和智能硬件形态的持续成熟,AI 正在从云端走向每一台终端。对于用户来说,智能体验不再只取决于模型有多强,也取决于设备能否在真实场景中,实时、稳定、低功耗地完成感知与交互。

而语音,正是其中最基础、同时也最接近人的交互入口之一。

01

AI 发展趋势

语音 AI,正在从“一个功能”变成“基础设施”

在演讲中,闫永杰提到,过去语音更多被理解为智能硬件上的一个功能,比如语音助手、语音搜索、语音控制等。它通常依赖云端处理,体验容易受到网络环境、噪声环境和设备性能的影响。

但在端侧 AI 时代,

语音的角色正在被重新定义。

它不只是一个“能不能说话”的功能,而是智能硬件的入口、多模态交互的入口,也是未来 AI Agent 被触发和调用的重要入口。只要设备需要和人进行自然交互,就绕不开语音能力。

这也意味着,语音技术的价值不再只体现在“识别一句话”,而是要帮助终端在复杂环境中真正听清、听准,并进一步理解人的意图。

02

智能语音交互场景挑战

真实世界的声音,远比实验室复杂

要让设备听清人说话,并没有想象中简单。

在真实场景里,声音环境往往非常复杂:多人同时说话、背景噪声干扰、突发噪声、回声、混响……这些问题都会直接影响语音唤醒率、识别率、通话清晰度,以及后续大模型交互的体验。

闫永杰在演讲中强调,语音前端信号处理,是智能语音交互体验的第一环。

如果前端没有处理好,后面的语音识别、自然语言理解、大模型交互和语音合成都很难稳定发挥。换句话说,终端能不能“听清楚”,决定了后续智能体验能不能真正成立。

传统音频处理方法在规律性噪声下有一定效果,但面对突发噪声、多声源、动态环境和非目标人声时,往往会遇到瓶颈。比如拍掌声、咳嗽声、鸣笛声,或者旁边人的说话声,都可能干扰设备对目标人声的判断。

更智能的终端,需要的是一种更接近人类的听觉能力:知道什么是目标人声,什么是噪声,应该关注谁的声音,又应该过滤掉哪些干扰。

03

大象声科的解法

大象声科的解法:

深度神经网络 DNN+计算听觉场景分析

针对这些问题,大象声科将深度神经网络 DNN 与计算听觉场景分析结合,利用AI对复杂声音进行实时分析和处理。

在输入端,真实环境中的声音可能同时包含目标人声、环境噪声、干扰人声、突发噪声、混响与回声。大象声科的 AI 语音前端技术,则通过模型训练和场景分析,将目标人声与复杂背景声进行有效区分,在消除噪声的同时,尽可能保留人声的自然度。

它解决的是两个不同的问题,一个是提升通话清晰度,让人听得更清楚;一个是提升 ASR 语音识别质量,让机器听得更清楚,从而提升用户的人机交互体验。

目前,大象声科已经形成了完整的 AI 语音前端算法链条,覆盖 AI 语音降噪、深度回声消除、深度啸叫抑制、定向波束形成、深度去混响、声源定位、语音唤醒、声纹识别与提取等能力。

这些能力背后对应的,不只是单个算法点,而是一整套面向端侧设备的语音感知系统。

04

端侧 AI 语音需要系统工程能力

从算法到芯片、模组,

端侧 AI 语音需要系统工程能力

端侧 AI 语音的落地,

并不只是把算法放进设备里那么简单。

不同终端的算力、功耗、麦克风结构、声学空间和应用场景都不一样。手机、耳机、PC、车载、会议设备、AI 眼镜,对语音处理能力的要求也各不相同。

因此,端侧语音能力的落地,

需要算法、芯片、声学、

硬件工程化等的协同。

在本次演讲中,闫永杰介绍了大象声科在多种产品形态上的布局:既可以提供软核算法,也可以提供 AI 语音处理芯片和多麦语音处理模组,支持从 GPU、CPU 平台到蓝牙主控芯片等不同资源条件下的部署。

其中,大象声科 DX1750 系列 AI 语音处理芯片面向端侧语音处理需求,具备 AI 降噪、AEC、深度啸叫抑制、定向拾音、伴声分离等能力,并集成 I2S、I2C、UART 等接口,方便与各类音频和控制外设连接。

同时,大象声科 M 系列多麦语音处理模组支持多麦克风接口,可覆盖 AI 拾音、唤醒交互、定距、对讲、音幕、AEC 等不同算法组合,并具备低功耗、即插即用和尺寸可定制等特点。

这也体现出端侧 AI 语音的一个关键趋势:未来竞争的不只是单点算法,而是围绕终端产品定义、声学结构、芯片平台、系统集成和场景体验的整体能力。

05

端侧语音正在进入更多真实场景

从手机、耳机到车载、AI 眼镜,

端侧语音正在进入更多真实场景

大象声科的 AI 语音技术已经在多个终端品类中落地,包括手机、平板、耳机、PC、车载以及 AI 眼镜等场景。

比如蓝牙耳机领域,大象声科服务了除Apple之外,全球蓝牙耳机出货量排名top 5的耳机品牌客户,覆盖TWS, OWS, 头戴,颈挂等多个产品形态。截至目前,搭载大象声科Vocplus耳机AI通话降噪技术的耳机出货量累计超过1亿台

车载场景中,大象声科 Vocplus 车载智能语音方案已在多款高端智能电动车型中量产,并在2022年凭借创新的六音区分离交互方案获得理想汽车“年度技术贡献奖”。大象声科也与德赛西威在多个智能座舱项目中展开合作,并获得了德赛西威 2025 合作伙伴大会“综合采购奖

随着 AI 眼镜等新型智能硬件的兴起,端侧语音能力也迎来了新的应用空间。

 AI 眼镜为例,用户在佩戴设备时,既需要清晰私密的通话,也需要在同声翻译、语音唤醒、语音交互等场景中准确拾取目标声音。大象声科针对 AI 眼镜推出了AI通话降噪、定向拾音、语音唤醒与交互等核心功能,并在多款智能眼镜上成功量产落地。

端侧 AI 语音并不是一个孤立的技术模块,

而是智能硬件迈向下一阶段体验升级的

底层能力。

总结

未来,每一台智能硬件都需要在真实世界中听得清、听得准、听得懂。大象声科将持续围绕芯片、算法与场景应用,构建端侧 AI 语音底座,和客户一起紧密合作,让更自然、更稳定、更可靠的人机交互体验进入更多终端设备。

 往期精彩回顾↓↓

SAIIA

关于协会

深圳市人工智能行业协会(简称:SAIIA)成立于2017年,经深圳市民政局核准注册登记,由与人工智能有关的企事业单位自愿发起的非营利性社会团体组织,是全国首家人工智能行业协会,被深圳市民政局评为5A级社会组织。协会致力于加速人工智能技术成果转化,构建人工智能应用生态体系,推动人工智能技术和应用的发展,并规范行业行为、推动行业自律提供行业服务、保障行业良性发展。

协会荣誉

5A级社会组织、2025年广东省“四好”商会建设优秀案例、2025深圳标杆商会、联合国大学(UNU)全球人工智能网络成员、“AI ALLIANCENET WORK”创始单位、首批广东省智能制造生态合作伙伴、深圳市高技能人才培训基地“数字经济”专项基地、深圳市人大常委会立法联系点、知识产权保护工作站、公平贸易工作站、海智工作站、深圳行业协会商会高质量100

 入会、合作咨询

 请添加小助理微信号

 saiia2020

相关内容 查看全部