時間:2018-03-18 來源:互聯網 瀏覽量:
微軟AI研究團隊近日於官方的部落格公布AI機器翻譯係統的一大進展,微軟加入新的訓練方法,AI係統的中翻英能力已經達到專業翻譯的水準
微軟AI研究團隊近日於官方的部落格中表示,微軟的AI機器翻譯係統可以將中文的新聞文章翻譯成英文,透過雙語專業人員評估,AI機器翻譯係統的表現與人類相當,微軟表示,中文和英文有較充足的詞彙資料庫,透過新聞的常見詞彙搭配深度學習演算法,再加入新方法模仿人類翻譯的流程,不斷地調整,讓機器翻譯係統產出的結果更加準確。
特別的是,微軟的研究團隊在AI機器翻譯係統中,加入雙重學習(Dual learning)的機製,也就是說,係統將中文的新聞文章翻成英文後,會再將英文的翻譯結果翻成中文,重新比對兩者的相似性,並讓係統從錯誤中學習。除此之外,該AI機器翻譯係統還加入了審議網路(Deliberation network),係統會學習研究員翻譯句子的過程,模擬人類一次次編修文字的過程。
而為了確保翻譯結果的準確性,微軟加入聯合訓練方法(Joint training),透過中翻英和英翻中2個係統交互學習,英翻中的係統可以提供新的中文句子,與原文的中文句子形成一組資料集,增加訓練集的資料量,中翻英也是如此,將2個係統互相學習時,即可以改善各自的準確率。
另外,微軟也嚐試采用一致性正規化(Agreement regularization)的方法來加強翻譯結果的準確性,簡單來說,AI機器翻譯係統從左到右,或是從右到左閱讀語句,翻譯出來的結果必須一致,微軟相信,係統若產生相同的翻譯結果,是比較準確的。
在微軟負責語音、自然語言和機器翻譯的技術團隊成員Xuedong Huang表示,這項成果是自然語言處理任務中,非常重要的裏程碑,機器翻譯達到人類的水準一直是團隊的目標,他表示,沒想到這麼快就能實現。
過去幾十年來,機器翻譯一直是研究員想要解決的問題之一,許多語言專家也認為機器翻譯不可能達到人類的水準,這項成果雖然是重要的裏程碑,但是不代表機器翻譯的問題已經解決,微軟亞洲研究院副院長周明表示,還有許多挑戰和問題,像是在即時新聞上測試機器翻譯係統,他期待,這項成果可以應用在不同的語言,甚至是不同的AI研究領域中。