時間:2017-04-02 來源:互聯網 瀏覽量:
人工智能也是2017年IT峰會的核心議題,在“人工智能:中國機遇與挑戰”的對話中,騰訊董事會主席兼首席執行官馬化騰和微軟全球執行副總裁沈向洋就數據分享問題表達了自己的看法。
以下為對話實錄:
主持人吳鷹:有沒有可能把數據分享出來,讓這些創業公司來用?
馬化騰:我們現在觀察到很多的AI所謂的“大拿們”,他們更關注怎麼落地,能不能把畢生研究成果能夠體現出來,所以在我們內部在吸引人才的時候,往往也會說你們微信、手機QQ裏麵的平台數據能不能給他們用,但是事實上大家都知道,BG、部門裏麵的平台他們也很希望近水樓台先得月,數據就在我身邊流動,我為什麼不能招人先研究一把,為什麼給你呢。
我們現在還處在內部怎麼把數據分享出來這個階段。
這裏麵還有一個很複雜的信息安全個人隱私脫敏,你不知道能不能根據數據倒推到哪一個人做了什麼事情,我們要把這些處理幹淨才能往下一步談。轉成什麼模式,數據清理用什麼標簽,才能給其他部門、包括外部合作夥伴怎麼用。
同時有很多數據來自合作夥伴,業界其他公司,這樣業界還要有一個標準,互惠互利交換,這是一個大方向,還有很長的路要走。
沈向洋:我也想分享一下在微軟的工作經驗,你說叫這些公司把數據拿出來,讓初創公司或者其他公司去用,我覺得不見得很現實、不見得很容易。
Pony剛才解釋的很好,但是我想鼓勵大家,很多的數據如果我們願意花時間、花精力做一點處理,比如Pony剛才講的,然後讓研究人員去用,完全是可以做到的。
我們微軟出了兩個數據集,一個是計算機視覺標準方麵的集,這樣可以做數據分割、物體分割。另外一個數據集是在自然語言,希望做問題問答。
大家在標準集下,不斷把標準集數據越做越多。我們做的方法是用搜索引擎數據,非常小心處理過,包括很多隱私的問題等等。
拿出一些數據讓大家做研究是非常實際的,完全可以做到。