時間:2018-03-15 來源:互聯網 瀏覽量:
3月15日報道(編譯:福爾摩望)
一組微軟研究團隊於本周三宣布,他們已經創造了第一個能夠將中文新聞翻譯成英文的機器翻譯係統,精確度與人類譯者一致。該公司表示,它通過來自各種在線報紙的約2000條語句樣本對這一係統進行了反複測試,並將測試結果與人類譯者的翻譯進行了比較,它還甚至聘請了外部的雙語顧問來進一步驗證機器的精確度。
這一被稱為newstest2017的樣本集已於去年秋天在研究會議WMT17上發布。
令人感到驚訝的是研究人員能夠如此快速的達到這一裏程碑,尤其是機器翻譯是人們幾十年來一直在試圖解決的問題。
微軟指出,許多人甚至認為達到與人類相同水平的目標可能永遠無法實現。
負責微軟語音、自然語言和機器翻譯工作的技術專家黃學東,在微軟的一篇博文中表示:“在機器翻譯任務中達到人類水平是我們所有人的夢想,我們隻是沒有意識到能夠這麼快實現這一目標。”
讓機器在這一規模上理解語言遠比語音識別複雜得多。AI和語音識別的進步讓語音助手能夠嵌入我們的智能手機之中,幫助消費者處理日常計算任務,控製智能家居設備以及用於新聞和娛樂目的。
但是要求機器對網頁或新聞文章進行翻譯往往會出現難以理解的單詞混亂,雖然可以讓你對所說的內容有一個大致的了解,卻無法進行深度的理解。
要真正理解長篇文章中的內容,你需要人的幫助。
但不同的人工翻譯會以一種稍微不同的方式來翻譯一個句子。
“機器翻譯要比單純的模式識別任務複雜得多,”微軟亞洲研究院助理總監兼自然語言處理小組負責人周明說道。“人們可以使用不同的單詞來表達相同的意思,但你無法判斷哪一種更好。”
微軟還指出,最近在AI方麵取得的進展,為研究人員實現這一裏程碑作出了貢獻。
深度神經網絡——一種訓練AI係統的方法,允許研究人員創造更加流利自然的翻譯,並考慮到更廣泛的內容背景,這一超前的方法被稱之為統計機器翻譯。
微軟的研究人員還在係統中增加了他們自己的訓練方法,以提高其精確度。這些方法類似於人們如何重複自己的工作時間,並再次確認是否正確的過程。
研究人員表示,他們使用的方法包括雙重學習的事實檢查翻譯;審議網絡,進行重複翻譯和改進;聯合訓練等新技術,以迭代促進英到中和中到英翻譯係統;以及協議正規化,即通過左到右和右到左閱讀語句來生成翻譯。
周明表示,用於實現這一裏程碑的技術不會局限於機器翻譯。“這是機器翻譯研究可以應用於人工智能研究全部領域的領域,”周明表示。
此外,它可以在未來讓其他語言的翻譯更加準確和自然。研究人員表示,這一係統尚未在實時新聞報道中測試過,在該技術被商業化到微軟產品前還有其他的挑戰需要解決。
但是你可以在微軟的網站上使用這一新的翻譯係統:https://translator.microsoft.com/neural。
係統將顯示一個中文(簡體)句子,然後以兩種方式進行翻譯,右邊的翻譯會更加完善以表明這一技術的先進性。
機器翻譯是穀歌的研究人員一直致力於研究的內容,包括使用穀歌的機器學習技術進行中英文查詢。這些進展已經付諸實施,以改進穀歌麵向消費者的產品,比如穀歌翻譯應用,以及穀歌搜索的整合。
本文來自獵雲網,如若轉載,請注明出處:http://www.lieyunwang.com/archives/420312
AD:進擊•融合 獵雲網&AI星球2018年度人工智能產業峰會 將於4月17號在深圳大中華希爾頓酒店舉行。這裏有最深度的思考,最有價值的投資建議,以及最酷的黑科技展示,精彩不容錯過。