微軟推出新一代全雙工語音互動技術 可預測人類即將說的內容

類別: 互聯網

微軟(亞洲)網際網路工程院宣佈率先推出新一代的語音互動技術:全雙工語音互動感官(Full-duplex Voice Sense),並已完成產品化落地。與既有的單輪或多輪連續語音識別不同,這項新技術可實時預測人類即將說出的內容,實時生成迴應並控制對話節奏,從而使長程語音互動成為可能。

此外,採用該技術的智慧硬體裝置,將不再需要使用者在每輪互動時都說出喚醒詞,僅需一次喚醒,就可以輕鬆實現連續對話,將語音互動的自然度推進到一個新的層次。

7d0476a5770f6ba

目前,該技術已首先在微軟小冰全球產品線中落地。其中在中國市場,除落戶中國科技館的小冰電話亭外,微軟還與小米公司進行合作將該技術應用於米家生態鏈Yeelight語音助手的市售硬體產品上。這是全球首個搭載全雙工語音互動感官的智慧裝置,也是內建微軟小冰的首個“雙AI”智慧裝置。在日本市場,小冰凜菜已通過該技術實現在直播平臺中的落地,首個車載智慧專案也已開始路試。微軟計劃於未來六個月內,完成該技術在更多產品線中的覆蓋。

語音互動是對話式人工智慧及智慧硬體裝置的基礎之一。對此,微軟小冰全球研發負責人周力博士表示:“從已落地的產品資料和使用者反饋中,我們觀察到一個普遍現象:使用者一旦使用過微軟小冰的全雙工語音互動感官之後,再與其他語音助手互動時,他們普遍會開始感到不習慣,甚至會頻繁忘記要對其他語音助手說喚醒詞——新技術促進擬人自然度的顯著提升,使人們對過去單輪或多輪連續語音互動體驗的滿意度迅速下降。這種新老交替的現象,符合我們的研發預期。”



微軟推出新一代全雙工語音互動技術 可預測人類即將說的內容原文請看這裡