對於一些視力缺陷者來說,日常生活的衣食住行中會存在相當多的麻煩。而現在,微軟推出了一款名叫 Seeing AI 的應用,可將視覺世界變成一種可聽見的語音體驗,這款應用或許能夠為他們提供一定的幫助。
Seeing AI 支持人物、短文、文本、條形碼以及場景的識別,用戶隻需要拿住 iPhone 設備在四周移動,應用會通過神經網絡技術,將這些信息轉化為語音,讓用戶可以「聽到」周圍的環境情況,從而為視力缺陷者進行服務,Seeing AI 大大方便了視力障礙者的日常生活。
下載地址見文末
人物及周圍環境的掃描
對人物的識別是微軟利用圖像識別工具提供更深入的圖片解釋。識別人物之後,Seeing AI 不僅可以判斷此人的性別以及大概的年齡,甚至可以對此人的外貌以及麵部表情進行表述。看看下圖 Seeing AI 對小哥的描述:一位滿頭黑發表情自然的男士,識別結果還是很準確的。
此外,使用 Seeing AI 對周圍環境進行掃描,還能了解到周圍有多少人,這些人所在的位置以及與你的距離,當然還可知道這些人的麵部表情。Seeing AI 還有一個新奇之處,你可以教 Seeing AI 去識別某個特定的人物。進入「臉部識別」功能,對某個人物的臉部進行三次拍攝,並做相應的姓名標注即可完成該人物信息的錄入,當你再次識別此人時,Seeing AI 就會說出他的名字。
短文內容的自動識別
短文識別功能簡單來講就是哪裏看不清拍哪裏,這個功能結合了圖像識別技術與自然語言處理技術,將文本信息轉化為語音信息。這一功能可以幫助視障人士獲得對圖像的準確描述,還可能幫助那些需要圖像信息卻無法直接看到圖像的人——比如正在開車的司機。
在測試的過程中挖 App 君發現,在 Seeing AI 在「朗讀」文本的過程中,如果攝像頭捕捉到了更加清晰的文本圖像,那麼 Seeing AI 會從頭開始「翻譯」這段文本。經過測試會發現 Seeing AI 識別效果很好,在識別讀出內容的過程中幾乎沒有錯誤。但在語言係統方麵有些遺憾,應用目前隻可以識別英文和阿拉伯數字,並不支持中文及其他語言的識別。
文件和條形碼的探測
文件識別的操作相對複雜一些,將攝像頭對準文本,Seeing AI 會引導你的手機放置,直到所選取的文本周圍出現邊緣,聽到「Hold steady」的聲音,然後拍攝進行文本識別。在文本識別之後,還可以使用 VoiceOver 功能對文本進行操作。
將手機攝像頭對準條形碼則可以對其進行識別,在掃碼的一瞬間會聽到嗶嗶的聲音,條形碼檢測成功後,Seeing AI 會說出產品的名稱。如果你想了解更多有關產品的信息,則可選擇點擊右下角的按鈕進行詳細的了解。
複雜場景的描述
場景的識別是讓計算機用更加人性化的方式去描述圖像,Seeing AI 會對識別的場景進行詳細的描述。比如下圖,Seeing AI 不僅會告訴你這是一台筆記本電腦,它還會告訴你這台電腦是以打開的狀態放置在桌上這樣詳細的描述。不過場景識別的功能目前還處於測試階段,所以場景識別的結果並不總是正確的,相信微軟之後會完善這個功能。
小結
Seeing AI 實現了「語音世界的魔法」,利用手機攝像頭將文字、人物、商品、場景等信息轉化為語音,讓更多的弱視群體盡可能的「獨立」,有助於為視障人士營造更公平的環境,與正常生活縮小差距。Seeing AI 的出現會在一定程度上讓更多的人利用人工智能技術來造福人類。
Seeing AI 的部分應用可在離線狀態下使用,但是在語音方麵暫時隻支持英文係統,對該應用感興趣的小夥伴可以前去美區 App Store 下載體驗。
下載地址:iOS
相關資訊
最新熱門應用
金貓交易所app
其它軟件223.89MB
下載熱幣全球交易所官網安卓版
其它軟件175.43 MB
下載ceo交易所app
其它軟件45.59MB
下載比特港交易所app蘋果手機
其它軟件287.34 MB
下載歐聯交易平台app安卓
其它軟件273.24MB
下載熱幣交易所app官方安卓版
其它軟件175.43 MB
下載比特兒交易平台官網蘋果手機
其它軟件292.97MB
下載本體交易所最新版
其它軟件223.89MB
下載滿幣交易所app官網
其它軟件21.91MB
下載以太亞洲交易所app安卓
其它軟件225.08MB
下載