展会信息

【展会动态】大象声科亮相 GAIC,硬核分享端侧 AI 语音技术创新应用

 作者：本站编辑  2026-05-18 19:26:10  6

前言

5 月 14 日，2026全球人工智能终端展暨第七届深圳国际人工智能展览会（GAIC）在深圳会展中心成功举办。在其「端侧 AI 与智能硬件生态大会」分论坛上，大象声科研发总监闫永杰受邀发表主题演讲《端侧 AI 智能语音技术的创新应用》，围绕端侧 AI 的发展趋势、智能语音交互面临的真实场景挑战，以及大象声科在 AI 语音前端算法、芯片、模组和行业落地中的实践进行了硬核分享。

随着端侧推理能力、低功耗芯片和智能硬件形态的持续成熟，AI 正在从云端走向每一台终端。对于用户来说，智能体验不再只取决于模型有多强，也取决于设备能否在真实场景中，实时、稳定、低功耗地完成感知与交互。

而语音，正是其中最基础、同时也最接近人的交互入口之一。

AI 发展趋势

语音 AI，正在从“一个功能”变成“基础设施”

在演讲中，闫永杰提到，过去语音更多被理解为智能硬件上的一个功能，比如语音助手、语音搜索、语音控制等。它通常依赖云端处理，体验容易受到网络环境、噪声环境和设备性能的影响。

但在端侧 AI 时代，

语音的角色正在被重新定义。

它不只是一个“能不能说话”的功能，而是智能硬件的入口、多模态交互的入口，也是未来 AI Agent 被触发和调用的重要入口。只要设备需要和人进行自然交互，就绕不开语音能力。

这也意味着，语音技术的价值不再只体现在“识别一句话”，而是要帮助终端在复杂环境中真正听清、听准，并进一步理解人的意图。

智能语音交互场景挑战

真实世界的声音，远比实验室复杂

要让设备听清人说话，并没有想象中简单。

在真实场景里，声音环境往往非常复杂：多人同时说话、背景噪声干扰、突发噪声、回声、混响……这些问题都会直接影响语音唤醒率、识别率、通话清晰度，以及后续大模型交互的体验。

闫永杰在演讲中强调，语音前端信号处理，是智能语音交互体验的第一环。

如果前端没有处理好，后面的语音识别、自然语言理解、大模型交互和语音合成都很难稳定发挥。换句话说，终端能不能“听清楚”，决定了后续智能体验能不能真正成立。

传统音频处理方法在规律性噪声下有一定效果，但面对突发噪声、多声源、动态环境和非目标人声时，往往会遇到瓶颈。比如拍掌声、咳嗽声、鸣笛声，或者旁边人的说话声，都可能干扰设备对目标人声的判断。

更智能的终端，需要的是一种更接近人类的听觉能力：知道什么是目标人声，什么是噪声，应该关注谁的声音，又应该过滤掉哪些干扰。

大象声科的解法

大象声科的解法：

深度神经网络 DNN+计算听觉场景分析

针对这些问题，大象声科将深度神经网络 DNN 与计算听觉场景分析结合，利用AI对复杂声音进行实时分析和处理。

在输入端，真实环境中的声音可能同时包含目标人声、环境噪声、干扰人声、突发噪声、混响与回声。大象声科的 AI 语音前端技术，则通过模型训练和场景分析，将目标人声与复杂背景声进行有效区分，在消除噪声的同时，尽可能保留人声的自然度。

它解决的是两个不同的问题，一个是提升通话清晰度，让人听得更清楚；一个是提升 ASR 语音识别质量，让机器听得更清楚，从而提升用户的人机交互体验。

目前，大象声科已经形成了完整的 AI 语音前端算法链条，覆盖 AI 语音降噪、深度回声消除、深度啸叫抑制、定向波束形成、深度去混响、声源定位、语音唤醒、声纹识别与提取等能力。

这些能力背后对应的，不只是单个算法点，而是一整套面向端侧设备的语音感知系统。

端侧 AI 语音需要系统工程能力

从算法到芯片、模组，

端侧 AI 语音需要系统工程能力

端侧 AI 语音的落地，

并不只是把算法放进设备里那么简单。

不同终端的算力、功耗、麦克风结构、声学空间和应用场景都不一样。手机、耳机、PC、车载、会议设备、AI 眼镜，对语音处理能力的要求也各不相同。

因此，端侧语音能力的落地，

需要算法、芯片、声学、

硬件工程化等的协同。

在本次演讲中，闫永杰介绍了大象声科在多种产品形态上的布局：既可以提供软核算法，也可以提供 AI 语音处理芯片和多麦语音处理模组，支持从 GPU、CPU 平台到蓝牙主控芯片等不同资源条件下的部署。

其中，大象声科 DX1750 系列 AI 语音处理芯片面向端侧语音处理需求，具备 AI 降噪、AEC、深度啸叫抑制、定向拾音、伴声分离等能力，并集成 I2S、I2C、UART 等接口，方便与各类音频和控制外设连接。

同时，大象声科 M 系列多麦语音处理模组支持多麦克风接口，可覆盖 AI 拾音、唤醒交互、定距、对讲、音幕、AEC 等不同算法组合，并具备低功耗、即插即用和尺寸可定制等特点。

这也体现出端侧 AI 语音的一个关键趋势：未来竞争的不只是单点算法，而是围绕终端产品定义、声学结构、芯片平台、系统集成和场景体验的整体能力。

端侧语音正在进入更多真实场景

从手机、耳机到车载、AI 眼镜，

端侧语音正在进入更多真实场景

大象声科的 AI 语音技术已经在多个终端品类中落地，包括手机、平板、耳机、PC、车载以及 AI 眼镜等场景。

比如蓝牙耳机领域，大象声科服务了除Apple之外，全球蓝牙耳机出货量排名top 5的耳机品牌客户，覆盖TWS, OWS, 头戴，颈挂等多个产品形态。截至目前，搭载大象声科Vocplus耳机AI通话降噪技术的耳机出货量累计超过1亿台。

在车载场景中，大象声科 Vocplus 车载智能语音方案已在多款高端智能电动车型中量产，并在2022年凭借创新的六音区分离交互方案获得理想汽车“年度技术贡献奖”。大象声科也与德赛西威在多个智能座舱项目中展开合作，并获得了德赛西威 2025 合作伙伴大会“综合采购奖”。

随着 AI 眼镜等新型智能硬件的兴起，端侧语音能力也迎来了新的应用空间。

以 AI 眼镜为例，用户在佩戴设备时，既需要清晰私密的通话，也需要在同声翻译、语音唤醒、语音交互等场景中准确拾取目标声音。大象声科针对 AI 眼镜推出了AI通话降噪、定向拾音、语音唤醒与交互等核心功能，并在多款智能眼镜上成功量产落地。

端侧 AI 语音并不是一个孤立的技术模块，

而是智能硬件迈向下一阶段体验升级的

底层能力。

总结

未来，每一台智能硬件都需要在真实世界中听得清、听得准、听得懂。大象声科将持续围绕芯片、算法与场景应用，构建端侧 AI 语音底座，和客户一起紧密合作，让更自然、更稳定、更可靠的人机交互体验进入更多终端设备。

往期精彩回顾↓↓

SAIIA

关于协会

深圳市人工智能行业协会（简称：SAIIA）成立于2017年，经深圳市民政局核准注册登记，由与人工智能有关的企事业单位自愿发起的非营利性社会团体组织，是全国首家人工智能行业协会，被深圳市民政局评为5A级社会组织。协会致力于加速人工智能技术成果转化，构建人工智能应用生态体系，推动人工智能技术和应用的发展，并规范行业行为、推动行业自律提供行业服务、保障行业良性发展。

协会荣誉

5A级社会组织、2025年广东省“四好”商会建设优秀案例、2025深圳标杆商会、联合国大学(UNU)全球人工智能网络成员、“AI ALLIANCENET WORK”创始单位、首批广东省智能制造生态合作伙伴、深圳市高技能人才培训基地“数字经济”专项基地、深圳市人大常委会立法联系点、知识产权保护工作站、公平贸易工作站、海智工作站、深圳行业协会商会高质量100

入会、合作咨询

请添加小助理微信号

saiia2020

下一篇： 展会反馈|青岛聚会手记——一场临时起意的难忘奔赴
上一篇： 教育部高等教育工业设计专业教指委主任何人可教授一行莅临指导我院2026届毕业工作

展会信息

【展会动态】大象声科亮相 GAIC,硬核分享端侧 AI 语音技术创新应用

相关内容查看全部 

【线上展览】“巧

展会结束回到店里

最后2天!2026广州

CPHI展会现场D1

2027福州中国跨境

深圳616——618展

东站展销会结束,

凭实力走了一天,

展会快讯|聚力有

2026年中国(广州)

【展会动态】大象声科亮相 GAIC,硬核分享端侧 AI 语音技术创新应用

相关内容 查看全部 

相关内容查看全部 