2月20日,搭载地平线自主研发的增强语音抽取(Enhanced Speech Extraction,ESE)方案的小米小爱触屏音箱在京发布。小米小爱触屏音箱是小米的首款带屏智能音箱,在发布会One more thing的环节推出,是小米在AIoT领域的枢纽级产品。地平线为该产品提供了完整的设备端语音前端信号处理和唤醒解决方案,让小爱触屏音箱能听见更能听清。
地平线为小米小爱触屏音箱量身打造的智能语音前端,采用地平线自主研发的ESE方案,仅用双麦克风即可在强噪声干扰条件下有效抽取语音信号。测试结果表明,地平线ESE方案能够显着弱化家居生活场景中的常见噪声,比如电视、厨房、洗衣机以及其他人声的干扰,保证较高的唤醒率。
同时,考虑到误唤醒对用户体验的影响,地平线还在前端针对唤醒做了深度算法优化,保证了极低的误唤醒率。据项目负责人介绍,在测试条件下,搭载地平线ESE方案的小爱触屏音箱可实现在48小时连续测试中实现零次误唤醒,远超业界普遍认可的产品化标准。经过算法优化,搭载地平线ESE方案的小爱触屏音箱可在复杂的噪声环境中实现随时打断、随时唤醒,打造流畅自然的人机交互体验。
小米小爱触屏音箱
地平线创始人兼CEO余凯表示:“很高兴地平线和小米首次开展合作。成立三年多以来,地平线致力于成为边缘人工智能芯片和计算平台的全球领导者,让各种智能终端Horizon Inside,让每个人的生活更安全,更美好。这次地平线和小米的重量级合作落地,标志着地平线朝着这个方向又迈进一步。未来,地平线将继续发挥在语音与视觉等领域的技术优势,深耕边缘人工智能,将软件与芯片硬件深度融合,探索开发出性能更加强悍的AI芯片,以及更多软硬结合的边缘计算产品。”
地平线在语音领域能够提供包含前端信号处理、唤醒、语音识别、语义理解以及语音合成的全链路解决方案。方案采用最新的深度学习算法,通过有效的“端”“云”结合,能够更好地解决复杂场景下的语音识别问题。除智能家居外,在车载领域,地平线亦可以提供全车音频解决方案,包括车载降噪、识别、多模交互、分区拾音、分区播放以及车内增强通信等。
地平线一直践行的“算法+芯片”的软硬结合策略同样体现在语音交互领域。地平线语音交互产品从研发之初就在算法层面考虑到芯片化的需求。目前语音算法在内存和计算效率都面向芯片实现了针对性优化,以满足低功耗、低成本、易集成等要求,并且在地平线第一代人工智能芯片上进行了算法验证。
人工智能时代,多模交互可以更好地提升用户体验,而地平线拥有业界顶尖的语音和图像算法团队。小米小爱音箱在小米生态中有着重要的战略地位。本次牵手小米,也标志着地平线智能语音技术在国内市场实现重量级合作落地。
在AI技术广泛应用的图像和语音处理领域,端云结合已成为必然趋势。未来,地平线将在语音和图像深度融合上进一步发力,开发功能更加强大的AI芯片及产品,助力客户打造更完美的智能化终端,为智能设备用户提供更加舒适人性化的交互体验。