
隨著安防行業(yè)的快速建設(shè)與發(fā)展,目前全國(guó)攝像機(jī)的總量已達(dá)到億級(jí)規(guī)模,每天有海量的視頻資源不斷產(chǎn)生,公安機(jī)關(guān)辦案需要對(duì)大量的視頻錄像進(jìn)行觀看研判。當(dāng)前視頻圖像建設(shè)應(yīng)用工作是構(gòu)建立體化現(xiàn)代化社會(huì)治安防控體系的重要組成部分,也是深入推進(jìn)“警務(wù)大數(shù)據(jù)”工程的重要抓手。人像識(shí)別作為視頻圖像應(yīng)用的新方法新手段,在公安實(shí)戰(zhàn)中具有重要價(jià)值。
回顧過(guò)去十年來(lái)人工智能的發(fā)展,一切都是有意義的,不過(guò)最好的還沒(méi)有到來(lái)。隨著2018年的到來(lái),還會(huì)有很多激動(dòng)人心的進(jìn)展出現(xiàn),特別是在人工智能視頻監(jiān)控方面。迄今為止,人工智能的成就一直都是趣味性大于實(shí)用性。不過(guò),時(shí)代在變化,人工智能除了在醫(yī)療和衛(wèi)生領(lǐng)域取得了重大突破外,在安全行業(yè)也看到了積極的進(jìn)展,尤其是視頻監(jiān)控領(lǐng)域的改善。
人們希望新型的人工智能監(jiān)視系統(tǒng)能夠?qū)崟r(shí)監(jiān)控犯罪行為。例如,Movidius系統(tǒng)可以發(fā)現(xiàn)無(wú)人看管的對(duì)象,實(shí)際應(yīng)用在機(jī)場(chǎng)或火車(chē)站——攝像頭可以識(shí)別無(wú)人看管的包,追蹤遺落的時(shí)間并發(fā)出警告,讓現(xiàn)場(chǎng)的安全人員檢查可疑活動(dòng)。
再比如,可以使一個(gè)經(jīng)過(guò)訓(xùn)練的攝像系統(tǒng),用于發(fā)現(xiàn)小偷在行竊前和行竊中的肢體語(yǔ)言和動(dòng)作。當(dāng)這些行為被識(shí)破后,安全團(tuán)隊(duì)就可以部署人員對(duì)這一情況進(jìn)行檢查。雖然準(zhǔn)確率高達(dá)90%,但依然無(wú)法進(jìn)行現(xiàn)實(shí)應(yīng)用,這項(xiàng)研究的意義其實(shí)不在于是否能識(shí)別罪犯,而是證明了面相和行動(dòng)具有相關(guān)性。其實(shí)有一種方式可以理解,面相和情緒相關(guān),情緒容易激動(dòng)的人面部都有相似的特征,而情緒容易激動(dòng)的人也可能容易犯錯(cuò),比如打人傷人之類(lèi)的。目前并沒(méi)有論文顯示,機(jī)器學(xué)習(xí)有沒(méi)有把罪犯分類(lèi),是傷害罪還是高智商犯罪。小智君認(rèn)為只有一兩種罪是可能通過(guò)面相看出來(lái)的,比如上面提到的傷害罪,可能由情緒變化引起。其他的犯罪基本不大可能通過(guò)面相表現(xiàn)。同時(shí)行動(dòng)受情緒影響非常大。而每個(gè)人都有自己的情緒波動(dòng)范圍,這個(gè)是內(nèi)在的,而且很有可能通過(guò)面部特征表現(xiàn)出來(lái)。經(jīng)常激動(dòng)的人臉部就容易形成某些特征,這跟經(jīng)常鍛煉的人身體容易形成某些特征一樣。就像根據(jù)人體的體型肌肉判斷哪些人是健身俱樂(lè)部的會(huì)員一樣,是有一定道理的。很多人認(rèn)為基因決定面相,其實(shí)并不全如此,不考慮畸形臉(畸形臉也不在論文的識(shí)別范圍),基因只能決定大體框架,人臉的面部脂肪、肌肉甚至骨骼在成長(zhǎng)過(guò)程中都是可以微調(diào)的,而且調(diào)動(dòng)范圍不像想象中那么小。
上海交大研究里面提到的“罪犯與常人的的面部特征的三大不同”,一是罪犯上唇的彎曲程度比非罪犯要大23%,二是罪犯兩只眼睛內(nèi)角之間的距離比正常人短6%,三是罪犯從鼻尖到嘴角兩條線的角度比非罪犯小20%。其中比較重要的關(guān)注點(diǎn):嘴——嘴唇和嘴角,而嘴算是人類(lèi)面部表情最豐富、脂肪最多的地方之一,完全可以說(shuō)和基因無(wú)關(guān),單靠后天長(zhǎng)期做某些表情就可以改變嘴的脂肪、肌肉分布。而眼睛距離雖然看起來(lái)鍛煉不出來(lái),不過(guò)差距只有6%,非常小,也是可以通過(guò)長(zhǎng)期的微表情改變的,況且這么小的差距也不能用來(lái)識(shí)別什么,所以即便理論上已經(jīng)已經(jīng)達(dá)到90%,但用機(jī)器判斷人臉表情這件事,本身就有待商議。
未來(lái)監(jiān)控系統(tǒng)將利用全國(guó)攝像頭以及一些監(jiān)聽(tīng)設(shè)備采集的視頻和音頻信息進(jìn)行處理和分析,最終提前找出與即將發(fā)生的犯罪行為相關(guān)的人。利用圖像識(shí)別,語(yǔ)音識(shí)別,語(yǔ)義分析,云計(jì)算,數(shù)據(jù)挖掘,多信息融合等等。也可以簡(jiǎn)單的概括為:data-driven,即數(shù)據(jù)驅(qū)動(dòng)。而其中能真正很快提高識(shí)別準(zhǔn)確率的就是“多信息融合技術(shù)”,除了利用臉部特征信息,還可以利用聲音特征信息,利用聲音內(nèi)容(比如電話交談)等信息進(jìn)行融合和判斷。
人工智能在許多行業(yè)和領(lǐng)域都有很大的潛力,但很難忽視它在安全領(lǐng)域的變革。無(wú)論是用于商店監(jiān)控,還是房主保護(hù)自己的財(cái)產(chǎn),或是執(zhí)法查明犯罪行為,其可用之處有更多。