言語(yǔ)交流是進(jìn)行社交互動(dòng)的重要方式。正常的說(shuō)話過(guò)程要求臉部和頸部的大量關(guān)節(jié)肌肉協(xié)調(diào)收縮。
包含與說(shuō)話活動(dòng)相關(guān)的電生理信息的表面肌電圖(sEMG)信號(hào)通常被視為自動(dòng)語(yǔ)音識(shí)別的替代輸入。
由中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究所(SIAT)陳世雄教授領(lǐng)導(dǎo)的研究小組提出了一種高密度(HD)sEMG技術(shù),該技術(shù)使用密集的單個(gè)電極陣列在相對(duì)較大的區(qū)域進(jìn)行肌肉活動(dòng)具有豐富的信息以進(jìn)行適當(dāng)?shù)倪\(yùn)動(dòng)分類(lèi)。
在基于sEMG的語(yǔ)音識(shí)別系統(tǒng)中,用于記錄sEMG信號(hào)的電極位置是影響自動(dòng)語(yǔ)音識(shí)別分類(lèi)性能的主要因素。但是,在以前的研究中,電極的放置取決于各個(gè)研究人員的知識(shí),而無(wú)需事先進(jìn)行定量分析或基準(zhǔn)標(biāo)準(zhǔn)。
Chen的團(tuán)隊(duì)在用英語(yǔ)和中文分別對(duì)口語(yǔ)任務(wù)中的日常單詞進(jìn)行分類(lèi)時(shí),分析了sEMG信號(hào)在面部和頸部肌肉左右兩側(cè)之間的貢獻(xiàn)。
在他們的研究中,高清sEMG信號(hào)由表面電極記錄,該電極有來(lái)自八名受試者的面部和頸部肌肉的120個(gè)通道。
從面部和頸部肌肉左側(cè)和右側(cè)的電極陣列記錄下來(lái),與高清sEMG記錄的信號(hào)相比,在識(shí)別說(shuō)話任務(wù)時(shí)獲得了分類(lèi)精度。
結(jié)果表明,使用高清sEMG記錄從頸部的左側(cè)和右側(cè)獲得了相似的分類(lèi)精度。相反,在使用來(lái)自左右面部肌肉的信號(hào)之間的分類(lèi)準(zhǔn)確性上出現(xiàn)了顯著差異。
陳教授說(shuō):“來(lái)自頸部對(duì)稱位置的高清sEMG信號(hào)在語(yǔ)音識(shí)別中的作用是一致的,而面部信號(hào)則不同。”