白皮书-智能一切和麦克风阵列的升起

Tung Shen Chew是Vesper Technologies,Inc的集成工程师

10多年以前,一个主要的智能手机厂家开发了带10个麦克风阵列一个手机演示。它能挑选出和听见嘈杂环境的某个人的声音-这是一个了不起的功能,它有明显的潜在的市场。但是这家公司预计这样的手机在现场使用的6个月之内有90%的机会失效。10个麦克风复合的脆弱性就此概念扼杀,这也是一个无情的提示:麦克风从根本上就是一个机械器件.

曾经的挫败的想法,现在来看是不可避免了。随着电子变得更加智能和无处不在,过去10年来,基于屏幕的用户介面并不落后。即将发生的大规模的“智能一切”的产品-智能手机,音箱,电视,穿戴式/听到式,灯泡,厨房电器,互联/自主车,机器人,无人机,虚拟/增强现实和整栋大厦-都需要一种交互不需要那么强迫的,且比小和大屏幕更加直觉的。语音介面是明显的候选人,麦克风阵列是核心器件。

但是我们如何才可避免早期演示机可能出现的问题?我们如何才使得这些阵列保持在良好的状态?第一步就是明白电容式MEMS麦克风关系其基础架构的天生的问题。只有转向压电式MEMS麦克风才能真正地革除这样的问题。

一,阵列和人耳

像大多数哺乳动物一样,我们有两只耳朵,它们的形状和位置使得我们能找到我们周边的声音源。这是如此的自然当我们听到意外的声音时,我们会转动身体来帮助我们定位源头。这些立体声学能力对帮助保护我们的生命是一个恒久不变的协助。它们是方向性音频确定的证明。

高级MEMS麦克风对自然加以改良。我们可以用复杂的处理算法来构建非常大的麦克风阵列,来精确定位音源,在一个特定的源上锤炼(比如某个人的语音)或直言不讳地忽略不想要的声音(比如排风扇通风筒的吵闹声)。这些麦克风阵列给到我们非常丰富的声学体验,对我们的环境更加地了解和对环境更多的控制。

这是如何工作的呢?由于声音是在有限的速度下移动的,一个声波的软波表通过一个阵列麦克风可能会有到达每个麦克风的少许的时间差。我们可以利用这个时间差来三角测量声音的源头。假如狗在我的左侧叫,我的左耳会更快听到狗叫声,且比我的右耳的声音更大。人的大脑自然地解码这些信号来破译狗的位置。

图1:双耳的指向性听觉(左图)和两个麦克风(右图)

我们可以得利用这个原理增加到更大的麦克风阵列,从亚马逊的Echo 的7颗到Squarehead公司的AudioScope的300+颗。这AudioScope是一个超灵敏,圆盘状的阵列,安装于一个紧凑的篮球场的30英尺之上,它能拾取在人群中的助理教练的吹泡泡糖的声音。

图2:SquareHead Technology的AudioScope阵列(图左)和控制界面(图右)

麦克风阵列的使用远不止于提升我们的听觉。每个主要的技术公司都在深入地投资在计算语言学领域-教育我们的互联设备来懂得自然的人类发音。但是为了像我们那样懂得语音,它们也必须像我们那样清晰地听到。它们必模仿我们本能的方向性,长距听力。

想象一个“阵列电话”- 一款未来的产品,它布满了麦克风,功能强大且便携,每个人都手持它。你将会每天如何用它?

1,你可以整装后离开你的房间,阵列电话位于10英尺开外,你的双手忙不开,但是你有问题要问,有事情要做。今天天气多冷呀?今天会下雨吗?我要会见谁?当你离开了,灯关了吗?门锁好了吗?

2,你在一个吵闹的房间和朋友们在聊天,你不能在人群中听清楚Ta们,你插入你的耳机到阵列电话,告知它来降低背景噪声。它发现并澄清你的同伴的语音,和外面的世界隔离开来。

3,你的车发出奇怪的声响,你觉得驾驶它有危险。你打开引擎盖,开启你的阵列手机。它告知你车的哪个零件在发声,且建议你如何修理它。

图3:亚马逊echo(左),clearone波束成形麦克风阵列(中),GFal声学摄像头(右)

所有这些场景都不是科幻小说。图3显示了真实的产品来满足每一种需求。它们可能粗糙,笨重或昂贵,但是其潜力是真实的,且技术正在提升。麦克风阵列在电脑化我们的世界中是一个核心的角色。

二,电容式硅麦克风只能做平庸的阵列

一个主要的阻碍停顿了带大麦克风阵列的智能设备的不可避免的爆发。在过去15年主宰市场的电容式MEMS麦克风会被普通的环境污染物比如水,灰尘和微粒物轻易地破坏。

在单一数量或者小的阵列是有用的,但是在大的阵列就会加重其问题,由于下述原因。

1,堆积的可能性:单一电容式硅麦克风的失效率是可接受的,一个10麦克风阵列中坏1颗的机会以是显著高很多的。一个阵列依赖于每颗麦克风功能工作的一致性,一颗不良麦克风会使其性能出错。

2,明显的失效;假如一个灰尘的小颗粒进入了单麦克风系统中的一个麦克风,它将会降级麦克风的灵敏度。大多数的系统会通过增加增益来补偿-这会产生更高的底噪-但是其失效率是不明显的。但是,大的阵列通常将灵敏度变化看作是指向性的信号。一个大的阵列的附加功能(比如定位声源)就会被极大地损害。

3,机械要求:大多数的产品设计了麦克风来自机械破坏的屏蔽。为了安装更多的麦克风在同样的空间,必须在它们的位置和朝向上面做折衷。大的阵列波束成形通常要求将麦克风放置在更脆弱的位置,比如手机的转角。这就会增加它们失效的机会。

所有这些因素导致了令人沮丧的总结:“假如我们兜售人们喜爱的这个极好的技术,它会很早且经常失灵。

这并未停止使用了阵列电容式硅麦克风的产品的销售,因为阵列是太有用了而不能忽视它。相当大量的折衰和变通方案被要求用来保护电容式硅麦克风的水和尘,这些包括:

图4:亚马逊Echo麦克风阵列&麦克风网罩的放大图(图左),iPhone 6S后麦克风&麦克风网罩的放大图(图右)

1, 使用网罩:通过用网罩遮盖其声孔,一个麦克风可变得更加防尘,就是将麦克风暴露到外面世界的那个孔。假如网罩足够致密,它会极大地减速液体进入声孔,因为液体的表面张力会使得它和网罩混乱,只能慢慢地湛漏。

网罩可以满足最小的可靠性要求,它不是一个长期的解决方案。灰尘和污垢聚积在网罩表面,堵住声孔,降低了麦克风灵敏度。非常细的颗粒(微米级)不会被一个粗糙的网罩所阻挡,它能通过堵住麦克风之间的静电板而杀死一个麦克风,包括肥皂水和清洁剂-能无阻碍地流过一个网罩

网罩保护可以通过增加其密度变得更加高效。但是,这会有不想要的麦克风灵敏度降低效应,和信噪比SNR的减少。一个防水网罩甚至在灰尘堵住之前会降级SNR至6dB。这个在防护和性能之间的折衷是网罩保护的一个根本性的缺陷。


(南频:麦克风阵列用在声音"可视化",实时频率分析,视觉化两个理发剪的声音开启和关闭)

2)使用一个软膜

保护麦克风更直接的办法是用一个膜来密封它。此膜是由软材料(比如硅橡胶)做成,且是足够大和柔软使得声波的通过。它可以提供长期的保护,只要膜片有稳定的机械特性。

这种方法有个主要的短处。每只麦克风需要一个大的,厚的膜片,这就复杂化了产品的工业设计。膜片的硬度和共振也严重地折衷了麦克风的信噪比和频响。在高性能应用中,保护性膜片不合适。

图5:密封了软膜的硅麦克风的剖面图

3)使用一个更小的阵列:智能手机厂商制作了带6个,8个和10个麦克风的概念机,更多的麦克风是一个切实的改善。仍然没有人出售大阵列的手机。厂商的犹豫可能是由于电容式硅麦克风的脆弱性。更少数量的麦克风意味着更低的失效统计机会,和更多空间来仔细地放置和保护每只麦克风。更小的阵列-避免使用高级的波束成形-是此保守主义的结果。不易坏的麦克风是更能干的,大的阵列的促成技术.

图6: iPhone7上面的硅麦克风的位置

4)将阵列限制在室内环境:现在的用大阵列来在整个房间响应语音命令的产品。它们引领了一个新的种类的免提语音介面产品,但是它们只在室内工作。便携式的去任何地方带语音介面的产品也存在,但是它们只有一个麦克风,且只有数英尺的听觉距离。紧凑的阵列,可以用在我们去的任何地点,必须能够应付更脏的,更少控制的环境。电容式硅麦克风的脆弱性限制了阵列能够布局的地方。


(南频:Amazon的Tap电池驱动的智能音箱用单颗麦克风如图正上方金黄色方块)

这些变通方案是必须用来将电容式硅麦克风硬塞入麦克风阵列中。电容式MEMS麦克风和ECM驻极体电容式麦克风依赖于同样的工作原理,这在1916年就开始使用了。它们的工作原理正是它们脆弱性的根源。

图7: 亚马逊Echo用在远距离(图左),亚马逊Tap用在手上(图右)

图8显示了形成一个电容式硅麦克风的背极和振膜的剖面图。振膜是被声压而形变的,改变其和背极的间隙(和电容)。这就产生了一个代表声音的电信号。

图8:电容式硅麦克风的顶视图(左)和剖面图(右)

此间隙是电容式硅麦克风的产生功能的必不可少的,但它也是产生很多失效模式的原因,这些包括:

1,灰尘伤害:细小灰尘能进入到间隙中且聚集,最终堵住振膜的运动.

2,由于水的粘附的伤害:假如麦克风进水了,它会形成一个薄层,将振膜拉向背极。随着水的蒸发,这个拉力变得更强大,直到振膜和背极永久地粘附在一起

3,由于机械冲击或声学过载的粘附:瞬间的加速度或大的声音(声学过载)能将膜片扔向背极。它们由于接触而静电吸附在一起,直到重启和破坏柔细的保护涂层之后,麦克风就失效了。

可怜的电容式MEMS麦克风的可靠性是其基础架构的直接结果。产业是敏锐地知道这些问题,产品设计师在积极地寻找一个更好的选项。怎样才能做一个无间隙的麦克风?

图9:电容式MEMS麦克风的不同的失效模式:正常(左上);灰尘/颗粒伤害(右上);进水(左下);粘附失效(右下)。 

三,压电硅麦使能高级波束成形

Vesper Technologies公司展示了一个此问题的全新的方案。在密西根大学进行的研究,我们发明了VM1000-首个商业化的压电式MEMS麦克风。

图10:VESPER压电MEMS麦克风的顶视图(右)和剖面图(右)

图10显示了VM1000的结构,背极和振膜由一个单层的软板所代替。声压的改变导致此板形变和产生应力。由于此板是由压电材料的一个三明治制成的,应力就产生了电荷,这就使得对声音的直接测量。这就发明了一个不需要背极的麦克风

通过省去了背极,VM1000对于麦克风的可靠性是个翻天覆地的改变。这里不再有窄的,脆弱的间隙来导致灰尘和液体的困住。其结果就是一个天生的防尘和防水麦克风,使用在高可靠性阵列中,就不需要变通方案和办法开辟。由于粘附失效现在不可能了,由于加速度,大声音(声学过载)或机械冲击的麦克风失效也更低风险了。

图11:响应于声音压力的压电板应力

在MEMS中使用压电材料并不新鲜:今天生产的每台智能手机能包含数10个压电射频滤波器。此RF滤波器产业是市值数10亿美金的。它的巨大的利润率驱动了高级晶圆厂工具的研发,来制造压电MEMS。


图12:?压电式硅麦克风(左)和电容式硅麦克风(右)的声学过载的对比

这就是VESPER公司使用的基础架构来批量生产首个市场上的压电MEMS麦克风。我们对于可靠的可重复的制造工具的使用,使得我们制造的麦克风具备出色的灵敏度匹配和随着时间过去的稳定的性能-这两项对于麦克风阵列都是必要的。


(南频:两款知名手机在纽约地铁里做的声学过载测试对比,右图的柱状图动态范围不够就饱和了-紧挨红色区域,不能再录制大声音场景,比如足球场粉丝尖叫,小孩尖叫,关车门,演唱会声音,户外的风声.相反,未饱和失真的麦克风还有很大的余量来录制更大声压级的声音,图右侧的动态跳跃的柱状图-一直处在绿色区域)

四,灰尘,水,油和声学过载 -?一个硅麦克风的严厉测试

图13:VESPER压电硅麦组装到测试板上,IP5X灰尘测试之前(图左)和之后(图右)

图13显示了一个实验的设置,用来对比麦克风对灰尘和颗粒的抵抗力。细沙(75微米或更小)吹进测试腔总共8小时。麦克风在腔里面装配,在测试中沙在每个麦克风的内部聚集。我们在测试的前和后测试了麦克风的频率响应,来观察灰尘的效应

图14:电容式硅麦克风的灰尘测试图片和结果,是通过进声孔看到的(上图),压电式MEMS麦克风的灰尘测试图片和结果(下图)是通过进声孔看到的。(南频:二者麦克风内部的MEMS机械件上面都有灰尘)

图14显示了此灰尘测试的结果,电容式硅麦克风有灰尘困在其背极和振膜之间,继而丢失掉了90%的灵敏度。在阵列中,此丢失的灵敏度是在麦克风之间不均衡地产生的(南频:也就是说,每一个麦克风的进灰尘程度不一样,继而其灵敏度丢失比率也不一样),因为麦克风们不再匹配了,使得阵列失效。同时,压电式硅麦克风是完全不受影响的。(南频:测试前后的两条频响曲线重合)

图15显示了一个测试麦克风防水的装置。每只麦克风都被浸入肥皂水,在一个密封的容器里,且是被施压成一个15米的深度,这样持续了24小时,和灰尘测试一样,我们测试了浸水测试之前和之后的麦克风的频率响应

图15:图左麦克风的水压设备,图右将声孔朝下(南频:确保麦克风接受最大的水压)的麦克风测试

图16:电容式(左)和压电式(右)的水测试结果

图16显示了水测试的结果。电容式硅麦克风被严重地影响,丢失了其55%的灵敏度。和灰尘测试一样,此降级会在阵列中不平衡地影响每一颗麦克风(南频:也就是说,每一个麦克风的进水程度不一样,继而其灵敏度丢失比率也不一样),由于很差的匹配而导致失效。压电硅麦克风是不受水测试而影响的-这是和IPX8评级等同的,指出了此麦克风能在连续的浸水中存活

厨房油污测试

图17:沉积油在麦克风表面的装置,带了盖子(图左)且螺丝固定到一个油腔中(图右)[南频:箭头所指上面两颗是电容式,下面两颗是压电式]

超越麦克风可靠性的标准测试,我们也发明了一种方法来用烹饪油对麦克风作负荷测试。图17显示了一个装置用来沉积玉米油直接到数个麦克风的表面。这是一个对于麦克风们使用在厨房的现实的场景,这种语音介面免提的优势是被高度评价的。

图18:电容式麦克风油测试和结果(上图),压电硅麦的油测试图片和结果(下图)

图18显示了此油测试的结果,以及通过声孔拍到的MEMS的照片.(南频:电容式下跌比例没有标示,但是明显看到蓝色和红色线的距离,而压电式则两条线重叠)

压电硅麦克风也能承受非常高的声音而不会损坏。图19显示了一个声学过载测试的结果,麦克风是在受到非常高的声压级之前和之后进行测试了的。

电容式硅麦在承受了136dBSPL的声压级之后不能恢复:它由于粘附而停止了工作。相比之下,在承受了一个150dBSPL的声压级之后的压电式硅麦克风快速地优美地恢复,这就指出VESPER压电硅麦克风不会由于大声音(比如关车门)的偶发的失效。

图19:电容式(蓝色线)和压电式(橙色线)的声学过载测试结果(南频:参考2017年02月20日本公众号www_dwintech_tech的智能手机录音之视频)

这些结果展示出单一压电硅麦克风在一系列的恶劣环境条件下的耐用性。在电容式MEMS麦克风降级或损坏的情况下,压电式MEMS麦克风还会保持恒定的性能。

五,耐用的麦克风产生耐用的阵列

麦克风阵列和语音介面能连接,知悉和保护我们。这些技术不可置疑的是消费类电子的前沿,且要求大数量的,坚强的,稳定的和匹配良好的麦克风。但是,这样的麦克风还未大量地变得可能。在这个间歇期,产业就依赖于电容式MEMS麦克风,而不顾它们的许多可靠性问题。

电容式MEMS麦克风容易被灰尘,水和机械冲击所损坏。在阵列中使用的多麦克风,这些可靠性问题变得更糟。阵列越大,失效率更高:非常大的阵列是简直不能使用的

有变通方案来改善电容式MEMS麦克风的可靠性,但是它们所有都有不利之处。只用于临时的保护会成本增加和牺牲性能。一个更强壮的,便宜的,更好的方案需要使用天生就强壮的,具备超高的环境顺应力的麦克风。

压电MEMS麦克风有天生的防尘,防水和防油。它们具备出色的匹配和稳定性,且对粘附失效具备免疫。它们对构建大的,可靠的麦克风阵列是完美的。要保护它们不需额外的成本,它们在长期的恶劣环境下维持其性能。

压电麦克风不仅仅是对现在技术的一个坚强的替代。它们了不起的可靠性使能了以前并不存在的新应用。在一个防水和声学过载的极限测试中,VESPER麦克风被挂在移动轮船的侧面,浸入海水。除了化学性强的水和波浪的湍流之外,此麦克风还能录制附近鲸鱼的鸣声。(南频:本视频早期有发布过,已经看过了请忽略)

VESPER麦克风的阵列也用在于枪击检测系统中,通过了弹的声间被分析来定位射手,保护战士。如同其替换的超昂贵的军工级麦克风(几百美金1颗),VESPER麦克风不会由于超声波步枪的冲击波而损伤。这可以做足够便宜的枪击检测系统来防卫城市,警察和公众。

这些种类的麦克风应用在先前是不能想象的,但现在看起来明显会随着压电式硅麦克风的普及而成为完全的主流。压电MEMS麦克风是一个主要的驱动者来将普遍渗透的语音互动带给大众。


(南频:Vesper Technologies公司的麦克风自动测试仪的视频)

Feb 04, 2017 SmartEverything and the rise of the microphone array

白皮书PDF 英文 中文


VesperMEMS天生防水防尘人体汗液的免疫;耐腐蚀;不用编程的灵敏度一致性;高温至车规标准150度;

VM1010麦克风:6uA全球最低功耗用于always-on;关键字唤醒;

VM2000:真差分麦克风,非Pseudo,极好的PSR特性


VM1000


VesperMems压电硅麦的样品&购买&参考设计&技术支持 请联系代理商:

座机 0755-82565851 

邮件 dwin100@dwintech.com 

手机 156-2521-4151

网站 http://www.dwintech.com/vespermems_faq.html

深圳市南频科技有限公司


长按此二维码,识别并关注此公众号来获得售前售后支持,以及最新器件发布,应用手册,参考设计视频,白皮书和成功案例的信息


首页home 产品product 新品发布news 参考设计ref.d 联系contact 应用笔记app note

D-Win Technology(HongKong) Co.,Ltd 深圳市南频科技有限公司