可聽(tīng)戴設(shè)備有望成為科技領(lǐng)域的新熱點(diǎn)。此類可穿戴設(shè)備包括增強(qiáng)現(xiàn)實(shí)眼鏡、智能耳機(jī)和智能助聽(tīng)器,它們或許能夠徹底改變?nèi)藱C(jī)交互的方式。這些設(shè)備的市場(chǎng)正在迅速擴(kuò)張,根據(jù)Market Research Future公司預(yù)測(cè),到2032年,這一市場(chǎng)的規(guī)模將達(dá)到1196億美元[1]。
然而,用戶界面是當(dāng)前一代可聽(tīng)戴設(shè)備面臨的重大挑戰(zhàn)。許多此類設(shè)備都需要通過(guò)很小的按鈕或觸摸傳感器來(lái)操作,這對(duì)于手部活動(dòng)能力受限或患有視力障礙的用戶而言是非常不便的。這些可用性和功能性方面的限制,促使專家們開(kāi)始研究是否能將動(dòng)作控制作為解決方案。

當(dāng)前可聽(tīng)戴設(shè)備的用戶界面技術(shù)
傳統(tǒng)可聽(tīng)戴設(shè)備的用戶界面方案,在實(shí)際使用場(chǎng)景中往往難以滿足需求。舉例來(lái)說(shuō):當(dāng)您正在跑步時(shí),想要調(diào)整音樂(lè)播放或者接聽(tīng)電話。這是一個(gè)很常見(jiàn)的場(chǎng)景。目前許多設(shè)備的解決方案,需要你摸索著找到手機(jī),或者嘗試精準(zhǔn)地點(diǎn)擊耳機(jī)上一個(gè)很小的按鈕——這遠(yuǎn)遠(yuǎn)算不上好的解決方案。
為此,有些廠商引入了力傳感器來(lái)改善普通按鈕難以操作的問(wèn)題。這些傳感器可以檢測(cè)作用于表面上的壓力,因而能夠區(qū)分輕觸與按壓,理論上可以支持更豐富的操作指令。然而,力傳感器方案需要用戶學(xué)習(xí)并記住各種功能對(duì)應(yīng)的觸控模式,這種認(rèn)知負(fù)擔(dān)會(huì)削弱可聽(tīng)戴設(shè)備追求的無(wú)縫使用體驗(yàn)。
此外,按鈕與力傳感器在潮濕或低溫環(huán)境下都可能遇到問(wèn)題,因?yàn)橛脩舸藭r(shí)很可能戴著手套或者觸覺(jué)敏感度較低。這些場(chǎng)景凸顯了開(kāi)發(fā)更通用、更穩(wěn)健的用戶界面解決方案的迫切需求。
動(dòng)作識(shí)別在可聽(tīng)戴設(shè)備中的應(yīng)用
動(dòng)作控制為與可聽(tīng)戴設(shè)備交互提供了更自然、更直觀的方式,例如只需在耳邊輕輕滑動(dòng)即可暫停音樂(lè)。這些交互方式利用了人體的自然動(dòng)作,使可聽(tīng)戴技術(shù)更加易于使用。部分設(shè)備,如蘋果的AirPods Pro,已經(jīng)實(shí)現(xiàn)了基本的動(dòng)作控制功能:將手指從AirPod底部滑動(dòng)至頂部,音樂(lè)音量增大;雙擊耳機(jī)柄,下一首歌曲開(kāi)始播放。
然而,這項(xiàng)技術(shù)的潛力遠(yuǎn)不止于音量調(diào)節(jié)和播放/暫停功能。先進(jìn)的動(dòng)作識(shí)別技術(shù)可以實(shí)現(xiàn)更廣泛的控制功能,并將頭部和手部動(dòng)作都納入到可識(shí)別的范圍內(nèi)。頭部動(dòng)作可提供直觀的控制方式,如點(diǎn)頭接聽(tīng)電話或搖頭拒接電話,而手部動(dòng)作可以提供更廣泛的可能性。手部動(dòng)作更加豐富多樣,可以實(shí)現(xiàn)更復(fù)雜、更細(xì)微的輸入,使用戶能夠?yàn)g覽播放列表、調(diào)節(jié)音量、激活語(yǔ)音助手,甚至控制智能家居設(shè)備。頭部和手部動(dòng)作識(shí)別的結(jié)合大大擴(kuò)展了可用的輸入選項(xiàng),從而能夠?qū)υO(shè)備功能進(jìn)行更復(fù)雜、更差異化的控制。
目前,開(kāi)發(fā)人員已在使用人工智能(AI)和機(jī)器學(xué)習(xí)(ML)來(lái)使動(dòng)作控制更加高效。為了訓(xùn)練ML算法,開(kāi)發(fā)人員使用通過(guò)加速度計(jì)或陀螺儀收集的數(shù)據(jù)來(lái)識(shí)別頭部動(dòng)作和方向。
例如,F(xiàn)raunhofer IMS開(kāi)發(fā)了一套系統(tǒng),能夠?qū)?D微機(jī)電系統(tǒng)(MEMS)傳感器與神經(jīng)網(wǎng)絡(luò)配對(duì)[2]。這樣,傳感器就可以學(xué)習(xí)各種各樣的輸入,例如在空中畫出的數(shù)字。學(xué)習(xí)完成后,經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)就可以在幾毫秒內(nèi)識(shí)別出所學(xué)習(xí)的動(dòng)作。
動(dòng)作控制在可聽(tīng)戴設(shè)備中的潛在應(yīng)用非常廣泛。在醫(yī)療保健領(lǐng)域,動(dòng)作控制的助聽(tīng)器可讓用戶以更安全的方式調(diào)整設(shè)置。對(duì)于運(yùn)動(dòng)和健身愛(ài)好者而言,動(dòng)作控制可以在運(yùn)動(dòng)鍛煉期間實(shí)現(xiàn)免提操作。在專業(yè)環(huán)境中,采用動(dòng)作控制的耳機(jī)可幫助用戶與數(shù)字助理和通信系統(tǒng)流暢交互。
傳感器技術(shù)助力動(dòng)作識(shí)別
可聽(tīng)戴設(shè)備中的動(dòng)作控制依賴于多種傳感器技術(shù),包括加速度傳感器、陀螺儀傳感器、光學(xué)傳感器、電容式傳感器和MEMS傳感器,它們能夠捕捉并解讀用戶動(dòng)作,實(shí)現(xiàn)流暢、直觀的交互體驗(yàn)。
加速度和角度傳感器
推動(dòng)動(dòng)作控制發(fā)展的技術(shù)多種多樣,其中加速度計(jì)和陀螺儀尤為關(guān)鍵。通過(guò)檢測(cè)線性加速度和角速度,它們能夠捕捉各種頭部和手部運(yùn)動(dòng),供可聽(tīng)戴設(shè)備解讀并執(zhí)行相應(yīng)指令[3]。
近年來(lái),這些傳感器的精度顯著提升,現(xiàn)代MEMS加速度計(jì)甚至能檢測(cè)到很輕微的頭部?jī)A斜。這樣的高靈敏度使動(dòng)作識(shí)別系統(tǒng)能夠支持豐富的動(dòng)作詞匯,用戶只需通過(guò)非常小的物理動(dòng)作,就能執(zhí)行多種指令。
光學(xué)傳感器
基于激光或LED技術(shù)的光學(xué)傳感器可用于檢測(cè)手部動(dòng)作或設(shè)備附近的其他動(dòng)作。這些傳感器通過(guò)透鏡測(cè)量物體反射的光線,并根據(jù)入射角確定物體的距離和位置。借此,可聽(tīng)戴設(shè)備就能夠檢測(cè)附近發(fā)生的動(dòng)作,并將其轉(zhuǎn)換為對(duì)應(yīng)指令。
光學(xué)傳感器在小型化方面的新進(jìn)展使得這項(xiàng)技術(shù)能夠集成到可聽(tīng)戴設(shè)備的緊湊形態(tài)中。這些傳感器可以生成耳部周圍區(qū)域的低分辨率“圖像”,使設(shè)備能夠識(shí)別頭部附近執(zhí)行的復(fù)雜動(dòng)作。
電容式傳感器
電容式傳感器在可聽(tīng)戴設(shè)備中的優(yōu)勢(shì),在于其能夠穿透非導(dǎo)電材料,即使設(shè)備被頭發(fā)或較薄衣物覆蓋,仍能實(shí)現(xiàn)動(dòng)作識(shí)別。這一特性提升了動(dòng)作控制在實(shí)際使用場(chǎng)景中的靈活性。
此外,電容式傳感器具有出色的靈敏度,可檢測(cè)微小的距離變化,是識(shí)別細(xì)微動(dòng)作的理想選擇。這種高靈敏度、低功耗的特性,尤其適合可聽(tīng)戴設(shè)備中始終處于活動(dòng)狀態(tài)的動(dòng)作檢測(cè)。與光學(xué)傳感器不同,電容式傳感器不受環(huán)境光線條件影響,不論在明亮的戶外還是昏暗的室內(nèi),都能保持一致的性能。
MEMS傳感器
MEMS是可聽(tīng)戴設(shè)備中的另一個(gè)關(guān)鍵元器件。這些微型傳感器結(jié)合了機(jī)械和電氣元件,對(duì)可聽(tīng)戴設(shè)備的動(dòng)作識(shí)別至關(guān)重要。它們可用于多種應(yīng)用,包括頭部追蹤、多點(diǎn)觸控檢測(cè)和主動(dòng)降噪。
通過(guò)MEMS技術(shù)實(shí)現(xiàn)的微型化對(duì)于可聽(tīng)戴設(shè)備尤為重要,因?yàn)檫@些設(shè)備中的空間極其寶貴。這些傳感器可以集成到設(shè)備中,同時(shí)不會(huì)顯著增加其尺寸或重量,因而能夠維持用戶對(duì)現(xiàn)代可聽(tīng)戴設(shè)備所期望的舒適性和美觀性。
用于動(dòng)作識(shí)別的信號(hào)處理和ML
如果沒(méi)有AI,現(xiàn)代場(chǎng)景下的數(shù)據(jù)處理會(huì)是一件難以想象的事情。比如,在嘈雜的工業(yè)環(huán)境中,兩名員工試圖通過(guò)耳機(jī)相互交談。傳感器可以從這個(gè)場(chǎng)景中收集大量數(shù)據(jù),但只有一小部分是有用的,因而必須靠AI算法識(shí)別出哪些數(shù)據(jù)需要過(guò)濾(如各種機(jī)器發(fā)出的環(huán)境噪聲)、哪些數(shù)據(jù)是需要使用的(如對(duì)話和語(yǔ)音指令)。
動(dòng)作控制面臨的一大關(guān)鍵挑戰(zhàn),在于區(qū)分有意為之的動(dòng)作和無(wú)意的動(dòng)作。通過(guò)分析用戶行為模式,算法能夠?qū)W會(huì)區(qū)分刻意的動(dòng)作指令與行走或跑步時(shí)自然產(chǎn)生的頭部動(dòng)作。
此外,在設(shè)備中集成具有情境感知的AI,可以顯著提升用戶體驗(yàn)。例如,系統(tǒng)可以學(xué)習(xí)到某些動(dòng)作更可能在特定環(huán)境或活動(dòng)中使用,從而對(duì)用戶輸入做出更細(xì)微、更符合情境的響應(yīng)。
電源管理與小型化
節(jié)能運(yùn)行是在可聽(tīng)戴設(shè)備中實(shí)現(xiàn)動(dòng)作控制的關(guān)鍵。為滿足這一需求,先進(jìn)的電源管理技術(shù)需要做到:
-
采用低功耗MEMS傳感器,保持活動(dòng)狀態(tài)以便檢測(cè)動(dòng)作,同時(shí)盡可能降低功耗
-
實(shí)施自適應(yīng)算法,根據(jù)用戶活動(dòng)調(diào)整傳感器輪詢率
-
采用高效信號(hào)處理技術(shù),盡可能降低計(jì)算開(kāi)銷
這些策略有助于延長(zhǎng)電池續(xù)航時(shí)間,同時(shí)不犧牲動(dòng)作控制提供的先進(jìn)功能。
對(duì)此,一種頗具前景的方法是事件驅(qū)動(dòng)感知,就是讓大部分動(dòng)作識(shí)別系統(tǒng)處于低功耗狀態(tài),直至檢測(cè)到可能代表指令的動(dòng)作。與持續(xù)感知和處理相比,這種方法可以顯著降低功耗。
要盡可能經(jīng)濟(jì)高效地運(yùn)行可聽(tīng)戴設(shè)備并延長(zhǎng)續(xù)航時(shí)間,還需要采用合適的電池技術(shù)。可聽(tīng)戴設(shè)備通常采用鋰離子(Li-ion)或鋰聚合物(Li-Po)電池[4],它們具有能量密度高、壽命長(zhǎng)、自放電率低的特點(diǎn),非常適合可聽(tīng)戴設(shè)備。隨著可聽(tīng)戴設(shè)備越來(lái)越小巧輕便,電池的小型化也成為了必須考慮的因素。
固態(tài)電池技術(shù)的新進(jìn)展為可聽(tīng)戴設(shè)備的未來(lái)發(fā)展帶來(lái)了希望。與傳統(tǒng)鋰離子電池相比,固態(tài)電池具有更高的能量密度和安全性,有望實(shí)現(xiàn)更長(zhǎng)續(xù)航時(shí)間和更小體積。此外,還可以研究通過(guò)能量收集技術(shù),將頭部運(yùn)動(dòng)的機(jī)械能轉(zhuǎn)化為電能,從而為動(dòng)作控制的可聽(tīng)戴設(shè)備提供額外電源,進(jìn)一步延長(zhǎng)工作時(shí)間。
結(jié)語(yǔ)
越來(lái)越多的可聽(tīng)戴設(shè)備,正借助先進(jìn)的傳感器技術(shù)、AI驅(qū)動(dòng)的識(shí)別能力和高效的電源管理,實(shí)現(xiàn)動(dòng)作控制功能。這種趨勢(shì)正在改變此類設(shè)備的市場(chǎng)格局。這些新型用戶界面增強(qiáng)了可聽(tīng)戴設(shè)備在消費(fèi)電子、醫(yī)療保健、專業(yè)環(huán)境等各類應(yīng)用中的可用性、功能性和設(shè)計(jì)感。
展望未來(lái),動(dòng)作控制無(wú)疑將繼續(xù)在優(yōu)化可聽(tīng)戴設(shè)備性能、提高用戶滿意度方面發(fā)揮關(guān)鍵作用。傳感器技術(shù)、ML算法和電源管理解決方案的持續(xù)進(jìn)步,為新一代直觀易用、響應(yīng)迅速、功能強(qiáng)大的可聽(tīng)戴設(shè)備鋪平了道路,這些設(shè)備終將完全融入到我們的日常生活中。 |