時間:2017-08-22 來源:互聯網 瀏覽量:
微軟今天宣布,其會話語音識別係統的誤率達到了5.1%,是目前為止最低的。
這一數據超過了微軟人工智能和研究團隊去年5.9%的誤差率,並將其準確性與專業的人類轉錄者相提並論,後者擁有類似於聽幾次文本的能力。
兩項研究都記錄了總機語料庫的錄音,這是自上世紀90年代初以來,研究人員用來測試語音識別係統的約2,400個電話交談的集合。
這項新研究是由微軟人工智能和研究團隊的一組研究人員完成的,目標是達到與一組人類轉錄者一樣的準確度,他們能夠聽他們幾次轉錄的內容,了解他們的談話內容,並與其他轉錄員一起工作。
總的來說,最新研究的研究人員通過改進微軟語音識別係統的神經網絡聲學和語言模型,將錯誤率降低了約12%。
值得注意的是,他們還讓自己的語音識別器使用整個對話,讓它根據上下文調整文本,預測接下來可能出現的單詞或短語,就像人類在與他人交談時所做的那樣。
微軟的語音識別係統用於Cortana、演示文稿翻譯和微軟認知服務等服務。