時間:2017-09-13 來源:互聯網 瀏覽量:
談起矽穀,我們可能想到“The Future is Here"(未來在這裏)”的著名金句,一個位於美國加州的一片狹長地帶,蘊藏著這世界上最前沿的互聯網技術與創新想法,自然吸引了諸如阿裏、騰訊、百度、小米、京東等中國企業前來朝聖。
而北京作為中國的矽穀,也吸引了不少跨國公司前來駐足,1995 年 IBM 中國研究院設立於北京,1998 年英特爾設立中國研究院,2001 年微軟將中國研究院更名為“微軟亞洲研究院”,國際知名科技巨頭紛紛前來貢獻並享受中國飛速發展的紅利。
那麼外企科技公司在國內創建研究中心,與中國企業在美國創立實驗室,身在其中的架構師會有怎樣的經驗與思考?
在此次 12 月份的 ArchSummit 全球架構師峰會北京站上,InfoQ 中國團隊邀請了京東矽穀研究院主任研究員李維(博士)與微軟亞洲研究院的首席研究經理 Kevin Zeng 前來分享,如果大會上有你感興趣的話題,不妨識別下方二維碼或點擊文末閱讀原文了解更多的內容,在這裏我們簡單分享在大會上你可能感興趣的內容。
自動深度語法分析是自然語言應用的核武器
李維博士現任京東矽穀研究院主任研究員,領導 Y 事業部矽穀 NLP(文本自然語言處理)團隊,研發自然語言深度分析平台及其 NLP 應用,目前聚焦於大數據情報和輿情挖掘,以及智慧供應鏈應用。
NLP 是人工智能的重要方向,是繼圖像和語音處理技術(感知技術)突破之後的一個令人期待的關涉認知技術的核心環節。
迄今為止的自然語言應用大多局限於淺層分析或者端對端的係統,並沒有做到語言的結構分析和語義理解,而後者才是自然語言表達信息的奧秘所在。自然語言深度分析的技術正在成熟,已經到了顯示威力的前夕。
在此次分享中,李維博士將結合知識圖譜和大數據輿情挖掘,來展示深度語法分析(deep parsing)的原理和威力。
負責互聯網媒體與計算組的 Kevin Zeng
首席研究經理 Kevin Zeng 在微軟亞洲研究院負責互聯網媒體與計算組,在此之前,他在密蘇裏大學擔任了 14 年全職教授,2000 年到 2003 年 Kevin Zeng 在 PacketVideo 擔任 CTO Staff。
如果你對圖像/錄像等處理與計算的問題,歡迎前來此次大會上與 Kevin Zeng 有更多的交流。
Uber 如何使用深度學習優化司機和乘客的體驗
在 Uber 內部,個性化團隊的工程經理 Yefei Peng 所在的團隊被稱為 Personalization,使命是為合適的乘客在合適的時間提供最優的產品體驗。
目前基於 Uber 的大數據基礎設施,Uber 的深度學習解決方案 “learns” 和 “adapts” 可以清晰的知道乘客的個人偏好,並且隨時可以在後台工作,采用各種辦法讓乘客有更愉悅的體驗。
目前該深度學習的實踐方案仍在 Uber 內快速迭代中,一年已經提供了四代解決方案,在此之前 Uber 使用了基於規則的處理方法,之後采取了基於機器學習的排序,Yefei Peng 將分享這段經曆中的架構設計和迭代思路。
Twitter 實時流係統 Heron 的異常檢測和恢複
吳惠君博士,現任 Twitter 工程師,致力於實時流處理引擎 Heron 的研究和開發,是 Apache Heron 的 committer。
應近年來大規模實時分析的需求,很多流處理係統被開發出來。Twitter Heron 開源係統就是其中的代表項目之一。
這類係統要求在軟件或者硬件失敗的極端情況下能有較好的服務水平。為了達到這種要求,Twitter Heron 係統添加了 Dhalion 異常檢測和恢複框架來保障 Heron 係統的服務水平。
Dhalion 異常檢測和恢複框架使用 polocy(策略)來整合 detector(檢測器)和 resolver(執行器)模塊。整個係統非常靈活,通過替換 policy 或者 detector 或者 resolver 能進行各種檢測和恢複任務,包括檢測 back pressure(反壓)指標並進行擴容,和檢測負載指標並重新調度容器等等,Dhalion 框架的應用給 Heron 係統帶來了初步的自行規範調整機製。
百度 MPP 數據倉庫 Palo 開源架構解讀與應用
牟宇航在百度擔任大數據部工程架構團隊經理,先後領導過數據平台團隊,OLAP 團隊、在線數據團隊。
麵對業務量增加,數據量翻番,並且需要處理數百 TB ~ PB 級別的數據量,且是結構化數據,並達到毫秒 / 秒級分析,在這種情況下應該尋求哪種解決方案選型,並且采取怎樣的工程來實現?
百度目前采取的技術選型在技術特性上可以支持 MySQL、高並發小查詢、大查詢高吞吐、高容錯、列式存儲、物化視圖、在線表結構修改等特征需求,如果做到的?歡迎前來交流。
從零到千萬在線後台服務的演進之路與黑產對抗
黃斯亮在騰訊音樂擔任後台技術總監,目前在騰訊 9 年多互聯網產品研發經驗。
在這次分享中,黃斯亮計劃講述全民 K 歌從零到千萬在線的產品發展過程中,後台服務架構的演進。
通過對 UGC 係統、流媒體上傳下載體係、道具禮物體係、注冊登陸係統、排行係統等核心模塊的不斷優化與重構,已經適應了快速增長的用戶規模,從根本上保證了產品的高速增長。
同時在產品發展過程中麵對層出不窮的黑色產業模式,業務應該如何與各式各樣的黑產做對抗,為用戶提供了一個相對安全,幹淨,公平的平台,保障用戶的利益,黃斯亮將解釋其中的對抗細節。
在中國享有互聯網聖地的北京屆時會迎來哪些重磅嘉賓和技術分享?ArchSummit 還會提供怎樣的精彩活動?敬請期待。
需要特別注明的是,每年 ArchSummit 大會門票都會在開幕前售罄,及早預定可提前確保席位,並享受更低折扣。此次大會的 8 折報名優惠 即將結束,團體購票(5 人及以上)將享有更多優惠,詳請谘詢大會票務經理豆包(微信:aschina666),或直接致電 15201647919。