時間:2017-07-24 來源:互聯網 瀏覽量:
談到人工智能,我們首先要思考的一個問題就是,人類的智慧是如何產生的?《人類簡史》中就提到,兩百萬年前地球就已經出現了和人一樣腦容量的生物,但直到七萬年前,智人才開始走向全球統治世界。其中有一個非常重要的原因就是語言的出現。
智人由於在語言方麵取得了突破,首先可以傳遞相互之間的信息,生存條件、狩獵條件得到了極大提升;其次可以反饋社會信息,組成群體;第三就是傳遞概念的信息,而現在的企業、法律、宗教無不是建立在人們之間形成並且達成共識的概念之上。
基於此,因為有了語言,人類的知識才開始沉澱,於是有了文化的傳承,這個時候,人類的智慧開始湧現。
在整個IT技術的發展浪潮中,人機交互處在怎樣的位置上?從大型機到小型機,從PC到移動互聯網……人機交互技術起到了非常重要的作用。
早期我們與大型機和小型機的溝通方式是紙帶打孔,然後鍵盤出現了,再到後麵視窗操作係統。這是一個機器不斷小型化、不斷進入更多家庭,並且人機交互的過程不斷優化和便捷的過程。再後來,蘋果將觸屏技術做到了突破和實用,以智能手機為代表的智能終端進入我們的口袋。
1、語音:人機交互現在時
現在,我們正在迎接一個語音交互為主、其他交互為輔的時代。
評價機器說話的技術在業界有一個5分製的標準,其中最關鍵的是自然度,5分是播音員水平,4分是普通人說話的水平。1995年,機器合成的聲音很像卡通片裏的機器人,一個字一個字地蹦出來,雖然聽得懂,但沒有達到自然的程度。當時采用了單詞拚接技術,詞之間的能量、時長、音高等一係列複雜參數很難解決。
到了2001年,取得了很大的進展,但仍能聽出是機器在說話,沒有真人發聲時的抑揚頓挫。而現在的語音合成效果自然度達到了4.5分,已經超過了普通人,進步十分明顯。
除了中文,我們在多語種合成方麵也取得很大進展,從2006年開始,我們就在全球語音合成大賽暴風雪競賽中一直囊括各項指標的第一名,先後比的是英文、印地語,朗誦小說、故事等。機器可以合成各種聲音,就可以被用到生活和工作的諸多方麵,比如解決輔助閱讀、輔助教學、導航等。
而在語音識別方麵,大家已經越來越感受到這項技術帶來的便利了——除了訊飛輸入法這樣的日常應用之外(語音識別準確率已達97%以上),語音識別技術在許多重要的誠都有應用,比如安全、防詐騙這樣的2B領域。
也許大家認為,語音識別就是嘴巴對著手機講話,但對我們來說這隻是語音交互技術的一小步——因為我們人和人之間的交互場景並不如此。比如在車載環境,高噪音、高複雜的情況下的識別問題。現在,基本全國所有的主流車廠和國際的著名車廠都在跟訊飛合作。在2015年的寶馬評測裏,我們比全球第二名的係統大概高出了12%的識別準確率。現在,我們在車載這種高複雜環境下,識別正確率已經可以做到90%以上。
其實,在國內能夠使用這種技術的場景非常多,舉個例子,醫生在給病人看病的時候,他們的雙手是很忙碌的,這時候寫病曆很麻煩而且不及時,我們就可以通過語音技術把它實現。還有法院、家電、機器人、玩具等等眾多領域。
現在訊飛輸入法已經擁有了4億的用戶,大部分都是通過口碑傳播。不過,雖然語音產品為人所熟知,實際上人機交互絕對不僅限於語音,還包括手寫、圖像、OCR。訊飛輸入法連續手寫識別準確率已達驚人的98%;對學生手寫體的OCR識別,準確率已達到95%以上。
訊飛在人工智能領域已取得明顯成果,舉兩個教育領域的例子。一是口語作文的評測。現在大家越來越重視學生聽、說的能力。傳統普通話、英語口語考試模式是老師對學生口語進行封閉測聽,但老師的水平本身層次不齊,每天情緒不斷變化,評分難免會不客觀、不標準,而機器的準確度和平均誤差都要比人工好很多。現在中文普通話評測已經全國全麵機測,英文正在從廣東高考、江蘇中考成功應用的基礎上向全國大規模推廣。
第二,就是機器的自動閱卷已經達到了專家的水平。長期以來,閱卷都是老師拿筆批閱,後來,選擇題可以用答題卡掃描,但對於大量的主觀題、閱讀理解等仍然沒法解決。而現在,這個問題也可以通過人工智能解決了,機器通過學習可以去評判英語作文、中文作文。機器可以從詞彙、語法、篇章結構等方麵全麵評估,並且更客觀、更快速。
未來有兩個大的發展機遇,一個是以語音為主、鍵盤為輔的人機交互時代的到來;第二是人工智能像水和電一樣進入到每一個行業,深刻地改變這個世界。
同時我們也看到,人工智能的概念在今年非常熱,甚至出現了一些十分誇張的說法,我認為有些過了。人工智能可以幫助解決我們很多問題,讓我們可以更自然、更輕鬆地處理一些事情。
2、人工智能隻是社會演進的過程
人工智能的發展有三個階段:計算智能、感知智能、認知智能。
1997年IBM“深藍”計算機下贏了國際象棋世界冠軍卡斯帕羅夫,裏麵就使用了計算智能,它的計算能力和儲存能力都足夠強大。感知智能就是機器能夠像人一樣具備感知的能力,這種能力了其實在很多方麵已經超過了人類。比如聽的角度,人的耳朵隻能聽到很小的波段,而機器能夠聽到超聲波、次聲波;視覺方麵,人隻能看到可見光,而機器可以看到紅外線、紫外線——所以機器在感知智能方麵超過人類是必然的。
未來機器可以幫助我們聽懂世界上任何語言,人與人之間的信息溝通沒有障礙。更具挑戰的是機器向認知智能的進步,就是讓機器具備理解、會思考的能力。為什麼AlphaGo能贏得了柯潔,圍棋是算不完的,但人工智能的發展使機器能夠學習人類有史以來的所有棋譜,進行邏輯推理,並且做出決策和判斷。除了圍棋之外,它的應用空間非常得廣闊。
人工智能的到來的確比我們想象得更快。有報告稱,許多工作可以被機器自動化。我們也在思考這個問題,人工智能與人之間是什麼關係?我並不認為這是一個崗位是否會被替代的問題,這應該是一個人與機器融合、結合的過程。
也就是說,機器並不獨立於我們存在,而是經由我們設計、開發、生產出來,為我們服務的。所以我們所做的所有工作,都是為了我們的人類生活的更美好。機器究竟是善是惡?汽車的出現一定將馬車顛覆了,但它又產生了許多新的職業;計算機的產生替代了許多工作,但又出現了一大批新的職業,我覺得這隻是社會演進的過程。而機器作為人的工具朋友,這一屬性是不會變的。這也契合科大訊飛的企業文化——用人工智能建設美好世界。
孫正義曾提出一個複合方程式“生產性×勞動人口=競爭力”,日本在生產性和勞動人口兩方麵均處劣勢,競爭力下降也就在所難免。他認為,日本若能導入3000萬台可24小時工作(3倍於正常人)的產業機器人,就相當於增加了9000萬製造業勞動人口,而支付給每台機器人的“平均月薪”僅為1.7萬日元。這無疑將讓日本一舉兩得地扭轉在生產性和勞動人口方麵的劣勢。我們一定要對這個趨勢保持高度的關注。
隨著人工智能時代的到來,在這樣此起彼伏的浪潮中會產生怎樣的創新,商業模式會出現什麼樣的變化,這些都值得我們好好去思考。