來源:實搜網(wǎng)絡(luò) 2016-06-24
谷歌(微博)多名研究人員日前發(fā)博客透露,谷歌想要為復(fù)雜圖片開發(fā)一種能夠提供自動字幕的技術(shù),其可精準描述圖片中的內(nèi)容,而且他們正接近實現(xiàn)這個目標。
谷歌的機器學(xué)習(xí)系統(tǒng)可以“看到”照片,然后自動生成描述和相關(guān)說明。這套系統(tǒng)通過識別圖片上不同對象以及它們之間的互相關(guān)系,對圖片上的內(nèi)容進行更深層次的解讀,最后翻譯成更為自然的描述。
谷歌研究員奧利奧爾·溫雅爾斯(Oriol Vinyals)、亞歷山大·托舍夫(Alexander Toshev)、薩米·本吉奧(Samy Bengio)以及杜米特魯·艾爾罕(Dumitru Erhan)等人寫道:“這種系統(tǒng)最終可以幫助視障人士了解照片,在世界上移動連接速度很慢的部分地區(qū)提供替代文本,使用戶更容易在谷歌上搜索圖像。”
谷歌團隊的關(guān)鍵創(chuàng)新是,將計算機視覺系統(tǒng)(在圖片中將對象分類)與自然語言程序模式結(jié)合起來,當這套系統(tǒng)看到圖片后,可以直接生成語句描述它。
谷歌研究人員承認,這套系統(tǒng)依然有許多工作需要改進。他們稱:“我們將繼續(xù)研發(fā)這套系統(tǒng),期望它能夠讀取照片,并能生成足夠好的自然語言描述。”(風帆)
實搜網(wǎng)絡(luò)為您提供網(wǎng)絡(luò)推廣,網(wǎng)絡(luò)營銷,網(wǎng)站建設(shè),SEO優(yōu)化,微信開發(fā),網(wǎng)站托管等服務(wù),服務(wù)熱線:0311-66697360