你聽不懂我的言語?SkypeTranslator現場翻譯

2015-04-14 10:08 來源:電子信息網綜合 作者:龍貓傘

隨著交通的越來越便利,人們能踏足的地方也越來越遠,但五花八門的語言使人們望而卻步。然而幾天之前微軟旗下的Skype宣布,具備實時語音翻譯技術的翻譯器SkypeTranslator中文預覽版正式在中國市場推出。使問題慢慢得到了解決。

作為一項長久愿望,在此前數十年時間,語音實時翻譯的發(fā)展一直受到錯誤率高,麥克風敏感度差異,噪音環(huán)境等因素阻礙。但近些年來,由于大數據的涌現,這項技術取得了不錯的進展。而SkypeTranslator更是凝聚了微軟在語音識別,自動翻譯和機器學習等多領域的成果。

簡單地說,SkypeTranslator的翻譯邏輯主要分為三步:將你的實時語音轉成文字;將文字翻譯成另一種語言的文字;將文字轉成語音。其中,識別實時語音并轉成文字是最棘手的部分。

如你所知,精確的實時語音翻譯有賴于強大的機器學習——也就是軟件學習訓練數據的能力。這些訓練數據包括翻譯的網頁,配有字幕的視頻,以及預先翻譯且轉錄成文字的一對一談話。事實上,已有不少人分享了他們過去的對話記錄。SkypeTranslator通過記錄對話來分析文本并訓練系統(tǒng)更好地“學習”語言——當準備好的數據錄入系統(tǒng)后,機器學習軟件會在這些對話和環(huán)境涉及到的單詞中搭建一個統(tǒng)計模型,當你說話時,軟件會在統(tǒng)計模型中尋找相似內容,然后應用到預先“學到”的轉化程序中,得以讓語音轉換為文本,再從文本轉換成另一種語言。

值得一提的是,與程序設定一般的朗誦不同,人會一邊思考一邊說話,會犯錯,這種犯錯在口語表達中的體現就是打磕巴,停頓,重復,或者頻頻出現如“嗯”“啊”“呃”之類的語氣助詞,針對于此,SkypeTranslator的機器學習模型也會處理這些停頓。在預覽版中,用戶可以看到部分語氣詞停頓被移除,而未被移除的部分則可能通過用戶反饋進行再優(yōu)化。

目前看來,實時語音翻譯技術并不完美,它是一項不斷優(yōu)化的技術。每個國家的語言,時刻都在變化,哪怕同一國家,因地域不同也有不同口音。這些問題可以通過更大范圍的數據解決么?也許能,但還需要時間。

SkypeTranslator

相關閱讀

暫無數據

一周熱門