時間:2019-06-11 來源:互聯網 瀏覽量:
引發爭議的數據庫名為MS Celeb,發布於2016年。“Celeb”取自“名人(Celebrity)”,顧名思義,微軟從名人名單中選擇了流行度靠前的10萬人,並利用搜索引擎為每個名人提供大約100張照片,從而產生了大約1000萬照片。
圖自微軟官網。數據對人臉識別技術的發展至關重要。微軟官網介紹顯示,MS Celeb的發布旨在促進學術研究,鼓勵研究人員開發最好的人臉識別技術。由於數據庫中包含大規模的真實人臉照片,研究人員可以用它來訓練和評估自己的人臉識別算法。
據《金融時報》報道,微軟是通過知識共享許可協議(Creative Commons license)抓取和收錄這些照片的。按照知識共享許可協議,照片的版權所有者許可後,微軟可以將照片用於學術研究。
版權所有者許可,並不等同於照片中的被拍攝者許可。有分析人士指出,人臉照片屬於生物識別數據,按照歐盟GDPR的規定,處理此類數據須征得當事人的明確同意。因此,微軟的數據庫麵臨法律上的風險。
不僅如此,有研究人員發現,MS Celeb數據庫所收錄的已不僅僅是名人照片,還有一些普通人的照片。據《金融時報》報道,信息安全記者Kim Zetter、技術作家Adam Greenfield、負責消費者隱私保護事務的原美國聯邦貿易委員會專員Julie Brill等人都在其中。
《金融時報》稱,這些人完全沒有意識到自己的人臉照片被收錄到了微軟的數據庫中。Adam Greenfield對《金融時報》表示,這說明微軟無法保證其研究人員的誠信。“我並不是公眾人物,沒有任何道理放棄自己的隱私權。”他說。
“微軟拓展了'名人'一詞的含義,僅僅在網上工作並擁有數字身份的人也被納入了'名人'的範疇。”研究人員Adam Harvey在接受《金融時報》采訪時表示。
針對質疑,微軟回應《金融時報》稱,MS Celeb僅被用於學術用途。但公開資料顯示,多家公司使用過MS Celeb進行算法訓練,如英偉達、IBM、鬆下、日立等。
雖然微軟表示已經刪除MS Celeb,但Adam Harvey指出,這些數據並不會完全消失。他說,一旦數據被發布、被下載,它就存在於全世界的硬盤上,微軟無法阻止人們根據自己的目的發布和使用數據。
微軟亞洲研究院公開資料顯示,其人臉算法已經在微軟的諸多產品上得到應用,包括Windows 10 Hello 人臉登錄、微軟認知服務 Face API,Xbox、Office、必應搜索、微軟小冰、Seeing AI等等。
事實上,微軟高層在近幾年中一直表態稱要限製人臉識別技術的使用。2018年7月,微軟總裁Brad Smith在博客中稱,政府應考慮如何規範人臉識別技術;12月,微軟呼籲立法監管人臉識別軟件。另微軟計劃於今年在其公司內部實施防止人臉識別技術濫用的道德準則。
編譯、綜合:南都記者 馮群星