口譯員可能被取代?Microsoft Translator更新,可支援多人多語言翻譯!

對於「個人通用翻譯器」,團隊決定利用業已廣泛採用的移動設備,而不再開發專用的翻譯硬件。Microsoft Translator團隊項目經理Tanvi Surti說:「眼下,智慧型手機隨處可見,幾乎人手一支。」Surti負責領導Microsoft Translator現場翻譯功能的開發。
該團隊開發了一項技術,讓現有的Microsoft Translator手機應用與網站形成了一個整體。「我們花了很多時間思考用戶體驗設計」Surti 說。「比如我們倆說著兩種不同的語言,我們如何做到快速對接以便有更多的時間和注意力用於考慮交談內容?」
新功能使用起來非常簡單。首先,用戶通過手機或網站登錄這項服務,選擇自己的語言並發起新會話。這一過程將生成一個代碼以及一個QRCODE,其他參與者可以輸入這代碼或掃描QRCODE加入,然後選擇自己的語言,談話就可以開始了。
交談一方在發言時要按下鍵盤空格鍵或螢幕上的虛擬按鈕,就像使用對講機一樣。幾秒鐘後,他們所說話語的翻譯文本就出現在其他對話參與者的設備螢幕上,當然是以其各自的母語呈現。對於部分語言,系統還提供有聲的語音翻譯。

(image source:Microsoft Translator)
深層神經網路
機器翻譯技術本身是由運行在雲端中的算法所驅動的,通過使用基於深層神經網絡的翻譯技術,與先前所謂的「統計型機器翻譯」相比,它能夠提供更流暢、聽起來更有「人味」的翻譯。
兩種方法都涉及根據早前經專業人士翻譯的文檔文本數據對算法進行訓練,以便讓系統了解一種語言中的單詞和短語如何用另一種語言來表達。然而,統計型方法局限在由一兩個鄰近詞語形成的上下文範圍內對某個單詞進行翻譯,這可能會導致翻譯出來的語句笨拙而迂回。
「神經網路」受到了掌握多門語言的人類在翻譯過程中大腦中發生的模式識別過程的啟發,實現了更自然的語音翻譯。
例如,在非神經世界中,「一群貓」和「一只貓」被視為不同的實體;而人類大腦以及神經網絡則把這兩者視為密切相關的詞。神經網路也可以解析「住宿」和「星宿」兩個詞中「宿」字的含義區別。Menezes解釋說:「單詞已經不再被視為它所代表的事物,而是一個包含500個維度的向量,其本質是500組數字,而每一個數字都反映了這個單詞的某一個方面。」
神經網路在開始翻譯之前,首先用1000個維度的向量對每個單詞在整個句子語境下的含義進行建模,無論這句話有5個詞還是20個詞都是這樣處理的。這一包含1000個維度的模型(而非單詞)隨後被翻譯成另一種語言。
此外,Fontana表示,隨著該技術被使用的次數越多,翻譯的質量也會不斷提高。他希望看到Microsoft Translator能被包括旅行者、導游、教師和社會工作者在內的廣泛的用戶群體所採用。
在兒童福利會供職的Simmonds-Read說,他已經可以預見到這項技術的多種用途,包括陪同非英語移民和難民一道參加與政府官員和潛在雇主的會面等。
「人們在不能溝通的時候幾乎是被隔絕的」他說。
支持多人、多語言、跨設備的Microsoft Translator現場翻譯功能已通過現有的 Windows、iOS和Android版本Microsoft Translator應用程序更新發布。
文章來源:Tech2ipo,未經同意請勿轉載。