時間:2018-01-06 來源:互聯網 瀏覽量:
2018-01-06 07:05 | 浙江新聞客戶端 | 記者 張留
前不久,杭州蕭山一家初創企業在世界頂級機器閱讀領域比賽——SQuAD機器閱讀挑戰賽中,力壓穀歌、微軟、騰訊等世界科技巨頭,獲得實時第二名的好成績。
這場國際級比賽,向來是微軟、穀歌、Facebook、阿裏巴巴等頂級科技公司的兵家必爭之地。而這個名叫“一知智科”人工智能的團隊,2017年7月才在蕭山成立,團員都是30歲以下的年輕博士。
這場比賽究竟是什麼?這支不到10人的隊伍,如何挑戰世界頂級科技公司百人乃至千人的科研團隊?1月4日,記者走進了位於蕭山開發區杭州灣信息港的杭州一知智能科技有限公司。
世界頂級科技公司的角鬥場
一知智科參加的比賽叫SQuAD機器閱讀挑戰賽,是行業內公認的機器閱讀理解工程能力標準水平測試,被譽為機器語義理解領域賽事之首。
怎麼比?“有點像做英文閱讀理解,參賽係統模型通過閱讀文章,回答若幹給定的問題,通過回答準確率來評定模型的先進程度。”團隊中的浙江大學博士江舟說。
挑戰賽並非固定時間舉辦,而是實時更新成績,隨時可提交參賽模型。穀歌、Facebook、微軟亞洲研究院、騰訊以及斯坦福大學、清華大學等知名企業、高校都是參賽者。
江舟告訴記者,人工智能產業近年來十分火爆,而語義理解目前處於技術積累階段,即將迎來爆發點,任何一家頂級科技公司都想掌握主動權,贏得進入市場的先機,而SQuAD機器閱讀挑戰賽就是最佳角鬥場。
挑戰賽中,一知智科始終走在世界第一梯隊。
從2017年5月起,一知智科多次提交參賽模型,獲得世界排行榜前三。
2017年12月24日公布的single model評測結果中,一知智科提交的“EAZI”係統模型,拿到78.003分,獲得第二名,而人類在SQuAD機器閱讀挑戰賽中的得分是82.304分。
一知智科預測,兩三個月內各大公司提交的參賽模型就能超過人類得分。“可以預見,如果機器能夠準確識別人類語言的意義,人工智能產業鏈條上,語義理解相關產品就會迎來爆發式增長。”江舟說。
一知智科攻克的是什麼?
當你對著手機上Siri說“給某某打電話”時,Siri可以準確執行。但你說“打電話給某某”時,Siri可能會回應“我不懂你在說什麼”。
這就是人工智能目前在語義理解上遭遇的窘境——機器不能精準識別人類語言的意思。
一知智科所攻克的,正是讓機器快速閱讀和理解文本的含義,將中文語義分析的準確度提升到商業應用級別。
江舟用通俗的語言還原了係統模型的運行過程:通過海量數據庫,讓機器更加了解每個單詞的組成,接著機器發揮注意力和記憶網絡的交互作用,不斷強化學習,提高答案命中率。
江舟給記者發送了他們最新開發的、可以寫詩的微信公眾號:發送關鍵詞,選擇藏頭詩、自由詩或雅韻詩,機器就會給出一首完全“原創”的古詩。“一個人可能一輩子都讀不了6萬首詩,但機器一天就能讀完,然後通過強化學習並理解單個詞語的意思,組合出來的就是全新的古詩了。”
或先行一步走向市場
技術,最終需要進入市場服務生產生活。
一知智科已經成為頂尖企業和投資方眼中的“香餑餑”——在知識庫構建上,一知智科與阿裏巴巴、網易有合作;在閱讀理解與語義檢索上,一知智科與騰訊、同花順、微軟有合作……隨著精度提高,他們的研究或將最快進入市場。
進入市場後,一知智科通過什麼與人們的生活產生關係?
舉個簡單的例子,“如果你想知道姚明的身高,在搜索引擎輸入關鍵字後,搜索引擎會給出一係列網頁。但是具備語義理解的搜索引擎,將直接給出精準答案,無需再從海量信息中自行辨別。”江舟說。
一知智科認為,當機器的語義理解能力超過人類之後,會有很多產品推出。“機器要取代人類,而不是輔助人類,才能更受歡迎。”一知智科介紹,他們的技術,將應用於更多場景:語音助手、智能客服、智能家居、智能導診……或許用不了多久,機器人時代就會來臨。
欣喜於一知智科成果的同時,也驚奇於這樣一個年輕的企業成長於杭州蕭山。
江舟介紹,蕭山經濟技術開發區管委會給出了保姆式的服務,辦公場地、人才公寓在幾個小時之內就搞定。反之,一知智科也提升著這座城市人工智能產業的競爭力。
未來3年,一知智科將為蕭山開發區引進人工智能博士15名,全力儲備人工智能“智庫”,助力蕭山、杭州、讓浙江繼續走在人工智能產業第一梯隊。