行業(yè)分享 2020-04-15 系統(tǒng)開(kāi)發(fā) 人臉檢測(cè)算法系統(tǒng) 檢測(cè)算法系統(tǒng)開(kāi)發(fā)

人臉檢測(cè)算法系統(tǒng)開(kāi)發(fā)徹底改變圖像搜索

早在2001年，兩位計(jì)算機(jī)科學(xué)家Paul Viola和Michael Jones就引發(fā)了計(jì)算機(jī)人臉檢測(cè)領(lǐng)域的一場(chǎng)革命。經(jīng)過(guò)多年的停滯，他們的突破是一種可以實(shí)時(shí)識(shí)別圖像中的面部的算法。實(shí)際上，所謂的Viola-Jones算法非常快速和簡(jiǎn)單，很快就被內(nèi)置到標(biāo)準(zhǔn)的傻瓜相機(jī)中。

人臉檢測(cè)mg(1).jpg

他們的部分訣竅是忽略面部識(shí)別中更加困難的問(wèn)題，而只關(guān)注檢測(cè)。他們也只關(guān)注從正面看的面孔，忽略了從一個(gè)角度看到的任何面孔。鑒于這些界限，他們意識(shí)到鼻梁通常形成一條垂直線(xiàn)，比附近的眼窩更亮。他們還注意到眼睛經(jīng)常處于陰影中，因此形成了較暗的水平帶。

因此，Viola和Jones構(gòu)建了一種算法，該算法首先查找可能是鼻子的圖像中的垂直亮帶，然后查找可能是眼睛的水平暗帶，然后查找與臉相關(guān)的其他一般模式。

由他們自己檢測(cè)，這些特征都沒(méi)有強(qiáng)烈暗示面部。但是當(dāng)它們?cè)诩?jí)聯(lián)中一個(gè)接一個(gè)地被檢測(cè)到時(shí)，結(jié)果是圖像中的面部的良好指示。因此，這個(gè)過(guò)程的名稱(chēng)：探測(cè)器級(jí)聯(lián)。由于這些測(cè)試都很簡(jiǎn)單，因此生成的算法可以快速實(shí)時(shí)運(yùn)行。

但是，雖然Viola-Jones算法對(duì)于從正面看到的面部是一種啟示，但它無(wú)法從任何其他角度精確地發(fā)現(xiàn)面部。這嚴(yán)重限制了它如何用于面部搜索引擎。

這就是雅虎對(duì)此問(wèn)題感興趣的原因。今天，加利福尼亞州雅虎實(shí)驗(yàn)室的Sachin Farfade和Mohammad Saberian以及斯坦福大學(xué)附近的Li-Jia Li，揭示了一種解決問(wèn)題的新方法，即使在部分遮擋的情況下也可以在某個(gè)角度發(fā)現(xiàn)面部問(wèn)題。他們說(shuō)他們的新方法比其他方法更簡(jiǎn)單，但卻達(dá)到了先進(jìn)的性能。

Farfade和co使用一種根本不同的方法來(lái)構(gòu)建他們的模型。他們利用近年來(lái)在一種稱(chēng)為深度卷積神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)上取得的進(jìn)步。我們的想法是使用大量帶注釋的示例數(shù)據(jù)庫(kù)來(lái)訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)，在這種情況下，從多個(gè)角度拍攝人臉照片。

為此，F(xiàn)arfade和co創(chuàng)建了一個(gè)包含200,000張圖像的數(shù)據(jù)庫(kù)，其中包括各種角度和方向的面部以及另外2000萬(wàn)張沒(méi)有面部的圖像。然后他們?cè)?0,000次迭代中以128個(gè)圖像批量訓(xùn)練他們的神經(jīng)網(wǎng)絡(luò)。

結(jié)果是一種算法，即使在部分遮擋的情況下也可以從各種角度發(fā)現(xiàn)面部。它可以非常精確地在同一圖像中發(fā)現(xiàn)許多面部。

該團(tuán)隊(duì)稱(chēng)這種方法為Deep Dense Face Detector，并稱(chēng)它與其他算法相比較。“我們使用其他基于深度學(xué)習(xí)的方法評(píng)估了所提出的方法，并表明我們的方法可以獲得更快，更準(zhǔn)確的結(jié)果，”他們說(shuō)。

更重要的是，他們的算法在顛倒時(shí)能夠更好地識(shí)別面部，其他方法還沒(méi)有完善。并且他們說(shuō)，使用包含更多顛倒面的數(shù)據(jù)集可以做得更好?！拔覀冇?jì)劃使用更好的采樣策略和更復(fù)雜的數(shù)據(jù)增強(qiáng)技術(shù)，以進(jìn)一步提高所提出的檢測(cè)遮擋和旋轉(zhuǎn)面部方法的性能?！?/p>

這是一項(xiàng)有趣的工作，展示了人臉檢測(cè)的快速進(jìn)展。深度卷積神經(jīng)網(wǎng)絡(luò)技術(shù)本身只有幾年的歷史，已經(jīng)在對(duì)象和人臉識(shí)別方面取得了重大進(jìn)展。

這種算法的巨大希望在于圖像搜索。目前，可以直接搜索在特定地點(diǎn)或特定時(shí)間拍攝的圖像。但很難找到特定人物拍攝的照片。這是朝這個(gè)方向邁出的一步。在不遠(yuǎn)的將來(lái)，這種能力不可避免地會(huì)伴隨我們。

當(dāng)它到來(lái)時(shí)，世界將變得更小。這不僅僅是將來(lái)可以搜索的圖片，而是數(shù)字化圖像的整個(gè)歷史，包括大量的視頻和CCTV鏡頭。無(wú)論如何，這將成為一股強(qiáng)大的力量。

下一篇電商類(lèi)網(wǎng)站系統(tǒng)定制開(kāi)發(fā)

閱讀
下一篇

熱點(diǎn)新聞

小程序開(kāi)發(fā)費(fèi)用小程序外包開(kāi)發(fā) 河北小程序開(kāi)發(fā)

人臉檢測(cè)算法系統(tǒng)開(kāi)發(fā)徹底改變圖像搜索

最新案例 查看更多

最新案例查看更多