服務熱線
13430557816
一、研究背景:
隨著智能機器人技術迅猛發(fā)展,基于聲學傳感器的人機交互(HMI)在促進機器人實現(xiàn)自然高效通信方面扮演著至關重要的角色。然而,如何準確識別和跟蹤全向聲源,特別是在嘈雜的環(huán)境中實現(xiàn)該目的,仍然是一個亟待解決的難題。
二、文章簡介:
針對上述問題,北京納米能源與系統(tǒng)研究所王杰研究員團隊成功研發(fā)出一種具有全向聲音識別和跟蹤能力的自供電摩擦電立體聲傳感器(SAS),為解決這一問題提供了創(chuàng)新性的解決方案。SAS采用了具有高電子親和力和低楊氏模量的多孔振動膜,使其具有高靈敏度(3172.9mVppPa-1)和寬頻率響應范圍(100-20,000 Hz)。利用其的聲音識別能力和可調的諧振頻率特性,SAS即使在嘈雜的環(huán)境中也能精確識別所需的音頻信號,平均深度學習準確率達到約98%。該傳感器的研發(fā)不僅解決了智能機器人在復雜環(huán)境中聲音識別的難題,還為其在多個領域的應用開辟了廣闊前景。例如,在輔助會議系統(tǒng)中,SAS可以同時識別多個個體的聲音,提高會議效率;在自動駕駛汽車領域,它能夠在背景音樂下準確識別駕駛命令,確保行車安全。這些應用展示標志著基于語音的人機界面系統(tǒng)取得了顯著進步。相關研究成果發(fā)表于Advanced Materials上。作者為北京納米能源與系統(tǒng)研究所博士喬文艷,通訊作者為北京納米能源與系統(tǒng)研究所周靈琳副研究員和王杰研究員
三、研究內(nèi)容:
1.傳感器結構及工作原理 在探索更高效、更自然的人機交互(HMI)系統(tǒng)的進程中,聲學傳感器扮演著至關重要的角色。作為機器人的“聽覺"裝置,聲學傳感器能夠精準地識別人類的指令、語音內(nèi)容及語調,極大地促進了機器人與人類之間的社會互動。本文提出了一種創(chuàng)新的SAS,通過在3D打印的立體框架上集成五個層狀結構的自供電摩擦電聲音傳感器(TAS),實現(xiàn)了對聲音信號的全向捕捉與高效識別。TAS的工作原理主要包括兩個方面:聲波引起的FEP膜變形,膜的振動將聲信號主動轉化為電信號。
通過分析公式(1)、(2)和(3)和圖1可以清楚的知道影響TAS靈敏度的關鍵指標是電壓(U);通過調節(jié)參數(shù)楊氏模量(E)、半徑(r)和薄膜厚度(t)可以改變TAS的振動位移進而改變TAS的電壓輸出調節(jié)器件的靈敏度,另外這三個參數(shù)也可以調節(jié)TAS的諧振頻率(f0)。為了實現(xiàn)從噪聲環(huán)境中多方向的聲音識別和實時跟蹤聲源,作者引入了一種3D打印設計的SAS,具有均勻分布的五個表面腔,每個表面都集成了單個TAS?;谌蚵曇糇R別和可調諧振頻率特性,SAS顯示了在嘈雜環(huán)境中拾取目標聲音的能力,這已經(jīng)在自動駕駛HMI車輛中得到了證明。為了證明SAS的原理,模擬了不同聲源入射條件下TAS和SAS的位移響應。當聲源正對TAS時,該TAS具有的信號響應,當聲源在兩個TAS之間時,相鄰的兩個TAS具有相同的且的信號響應,基于這些特征,可以根據(jù)SAS的響應情況來判斷聲源的方位和角度。
四、總結與展望:
作者提出了一種自供電的SAS,該傳感器采用了的立方體設計,賦予了其全向聲音響應與精準跟蹤的雙重能力。通過結合低E的多孔振動膜,SAS具有高靈敏度(3172.9 mVppPa-1),寬頻率響應范圍(100-20,000 Hz)。利用SAS的全向聲音識別和跟蹤能力,以及其對不同聲源和方向的差異化諧振頻率響應,實現(xiàn)了從嘈雜背景中高效提取目標信號的目標。在深度學習的輔助下,SAS對目標信號的識別準確率平均達到了約98%。更重要的是,SAS的出現(xiàn)打破了多人同時與機器人互動的局限性。此外,SAS成功地展示了其在輔助會議系統(tǒng)、聲音跟蹤和自動駕駛系統(tǒng)(特別是在帶有背景音樂的環(huán)境中準確識別駕駛命令)中的表現(xiàn)。這項研究凸顯了自供電摩擦電技術在基于語音的人機界面系統(tǒng)中的深遠優(yōu)勢。
來源:傳感器專家網(wǎng),轉載此文是為傳遞更多信息,如有侵權請聯(lián)系刪除