听觉智能延展技术及其产业化

听觉智能延展技术及其产业化项目着眼于人工智能深度检测技术和非线性自适应信号处理技术的突破,研发出基于麦克风阵列处理和智能学习模型的异常声音检测、声源定位、噪声消除和远距离拾音等技术,并应用于监控和安防摄像头产品、辅助听力穿戴产品等,产生重大技术革新和突破,具有千亿级的广阔市场前景。

听觉智能延展技术及其产业化

 

项目介绍

本项目研发基于人工智能和麦克风阵列的机器听觉技术和系列产品,主要产品有:

1. 智能麦克风阵列安防监控系统(可与摄像头配套使用);

2. 智能穿戴辅助听力设备(可供正常人和听力障碍人士使用)。

现有的安防监控摄像头都是只有视频和图像处理,并没有声音处理(就像人只有眼睛没有耳朵一样),特别是没有检测异常声音、定位声源、消除噪声和远距离拾音等处理,但是实际中很多场景下必须要监控声音的,譬如砸玻璃声、尖叫呼救省或枪声、爆炸声、或咳嗽声(检测疾病)、禁止人员地方的脚步声等等。虽然逻辑上将以上声音处理的功能与视频结合起来是未来的趋势且具有的巨大市场,不过由于技术难度较大,现在还没有看到将声音与视频有机结合起来的产品。

现在的观点是助听器(聚焦于面对面交流对像的声音)都为听力障碍人士所专用的,而且与蓝牙耳机(聚焦于用户自己嘴巴讲话的声音)是分离使用的。但是,一方面,障碍人士也需要用手机打电话、听音乐、看视频等;另一方面,普通人在很嘈杂的情况下(如酒吧、KTV、餐馆等)难以听清楚对面人的讲话内容,需要辅助听力功能来增加交流的顺畅性。只是目前还没有看到两者相结合的产品。另外,现在有不少人在马路上走路都戴着耳机边听音乐边走路,这其实很危险,每年都造成众多交通事故,检测和定位危险声音(如汽车由远及近行驶声等)也成为辅助听力功能中重要的一项。能将上述功能有机地集成起来的穿戴设备会大大增加其使用范围,也是发展的大趋势,有着广阔的市场前景。

 

技术关键点及创新点

主要技术:麦克风阵列+压缩感知+深度学习+芯片

1. 基于分布式传感器阵列的人耳反向工程的精密建模,结合创新的自补偿深度学习算法等技术,解决各种异常、突发和特殊声音检测的难题。国际同行至今也尚未解决好。

2. 基于相干非高斯声学模型和深度学习的复杂噪声建模,解决信噪比很低或者风雨声很大情况下的消噪难题。国际领域首次应用。

3. 结合自适应非线性分维分形理论的远距离拾音技术。同行至今也未解决。

4. 毫米级的微型麦克风阵列消噪技术突破,使得对于不想要的声音进行抑制,同时对于想要的声音进行有效放大,使得用户听起来更舒适,更利于用户的健康和情绪平稳。

5. 智能化耳骨道反射听力检测技术和自适应调节技术的突破,无需专业医生对于用户进行有效听力检测,并且得到比现有技术和产品更好的结果,从而大大降低成本、缩短检测和调试的时间。

6. 结合算法和软件及应用的半导体芯片设计和集成能有效地减低成本、体积和能耗。

项目中研发出的多项算法和技术,为业内首次提出和应用。

 

项目优势

目前,项目已经拥有一支初始创业团队,团队包含3名博士在内的技术团队(领域涉及人工智能、声学、信号处理、软件/嵌入式研发、硬件设计和结构设计等),还有经验丰富的营销人才和企业营运人才。

在技术研发方面,对于核心算法和关键技术已经研发出来,正在进行大量的实际试验验证和技术优化。处理结果如下表,性能均明显优于现有的技术和产品。

后续规划中,将聚焦于人工智能自适应麦克风阵列的处理技术和非线性自我调节技术的突破,结合创新的深度学习技术的声音检测、声学定位和消噪以及远距离拾音技术,开创听觉智能领域的技术和应用先河,并推动听觉智能延展技术的产业化和市场开拓。

免费获取更多专业资讯
0571-89712782

您选择信任,我待以真诚!

x

一对一服务