?人臉識別已經(jīng)被廣泛應(yīng)用在各個領(lǐng)域,但當(dāng)新冠肺炎來襲的時候,戴著口罩的你如何證明你是你?
發(fā)現(xiàn)一個犯罪嫌疑人,但是視頻沒有捕捉到他的臉。能不能通過衣服的顏色、布料的紋理,查找相似的ID?
有違章或是犯罪行為的車輛,往往會遮擋號牌或是使用套牌,那么用車牌號就不能正確辨識車輛的身份,能不能通過更細(xì)致的外觀把它找出來?
視頻識別在我們現(xiàn)實中的應(yīng)用越來越廣泛,很多我們想得到的、想不到的,AI已經(jīng)帶給我們越來越多的驚喜與驚嘆。但,這也都是在進程當(dāng)中,現(xiàn)實的應(yīng)用場景對AI不斷提出更高的挑戰(zhàn):以前只要能識別人臉就可以了,現(xiàn)在你要能識別戴口罩的人;以前通過人臉照片追查罪犯,現(xiàn)在看不到臉也能把他找出來;以前通過車牌號碼辨別車輛身份,現(xiàn)在則要通過車身細(xì)節(jié)去追蹤……
“人們往往高估一項技術(shù)的短期表現(xiàn),而低估一項技術(shù)的長期表現(xiàn)。” 已經(jīng)從事17年計算機視覺研究的格靈深瞳信息技術(shù)有限公司CTO鄧亞峰深有體會,AI是一個長跑,自己的實力很重要,陪伴的伙伴也很重要。
從看見到看懂,AI在各行各業(yè)中落地才有價值
關(guān)于AI,我們常常聽到智慧城市、機器人、自動駕駛、智慧醫(yī)療、工業(yè)視覺、AR等,這些都是AI的應(yīng)用場景。如果說到AI的核心技術(shù),主要是三個方向:計算機視覺、語音識別、自然語言理解。也就是說,在三個技術(shù)方向上的深入,可以應(yīng)用到各種場景當(dāng)中去發(fā)揮價值。
在我們?nèi)祟愇锢硎澜鐏砜矗曈X可以占到人體各種感覺器官接受信息的80%。所以,視覺是人與外界溝通最重要的途徑。同樣,在數(shù)字世界里,計算機視覺的發(fā)展也決定著AI的走向與能力。“計算機視覺是智慧物聯(lián)網(wǎng)時代最大的數(shù)據(jù)入口,擁有廣闊的應(yīng)用場景?!?格靈深瞳信息技術(shù)有限公司CTO鄧亞峰表示,無論智慧城市、機器人、自動駕駛、智慧醫(yī)療、智能制造,所有這些應(yīng)都離不開計算機視覺這一項AI基礎(chǔ)技術(shù)。
在智慧城市的應(yīng)用中,可以通過人的行為軌跡分析找線索、發(fā)現(xiàn)規(guī)律,甚至提前預(yù)知異常。比如某個人白天不出門,經(jīng)常是后半夜出門,而且行為軌跡也不是去某個固定的工作場所,那么這個人就有可能是犯罪嫌疑人。
再比如在智能商業(yè)應(yīng)用中,通過人臉識別將同一個人多次到店關(guān)聯(lián)起來,利用人臉將商品購買記錄關(guān)聯(lián)起來,并形成動線和熱力圖。有時候,通過海量數(shù)據(jù)匯集后,AI真的可以“比你更了解你”。
“看見”這個世界并不能,但“看懂”這個世界卻非常難。在中國現(xiàn)在有近2億的安防攝像頭,但其產(chǎn)生的視頻數(shù)據(jù)有80%是冗余信息。AI如何通過深度學(xué)習(xí)、高性能運算及大數(shù)據(jù)技術(shù),在這些數(shù)據(jù)中篩出有用的價值。
格靈深瞳就是一家以“讓計算機看懂世界”為愿景的公司。他們與華為聯(lián)合打造的全目標(biāo)結(jié)構(gòu)化系統(tǒng),集結(jié)構(gòu)化分析、數(shù)據(jù)存儲、數(shù)據(jù)應(yīng)用于一體的高性能、高密度計算系統(tǒng),以解決對人體、機動車、非機動車、人臉等全目標(biāo)的特征識別和快速檢索。其主要功能包括目標(biāo)檢測、跟蹤、分類、全目標(biāo)特征識別、以圖搜圖、軌跡分析、綜合布控、違法分析等應(yīng)用。這個系統(tǒng)能夠有效處理大規(guī)模視頻數(shù)據(jù),將廣泛具備并發(fā)能力強、分析識別準(zhǔn)、運算速度快、檢索效率高等優(yōu)勢,可實現(xiàn)預(yù)警、布控、研判等多種應(yīng)用,提高辦案效率。應(yīng)用于包括智慧城市、公共安全領(lǐng)域各類場景。
沒必要重復(fù)造輪子,讓算法工程師的工作變得簡單而極致
單機實現(xiàn)384路極致高密視頻實時分析,支持圖片分析(檢測、結(jié)構(gòu)化、特征提?。┎坏陀?200張/秒——這些聽起來不明覺厲的技術(shù),是如何在高效的機器視覺系統(tǒng)上實現(xiàn)的呢?
一般來講,高效的機器視覺系統(tǒng)取決于四個關(guān)鍵因素:一是核心算法,二是自動化大規(guī)模訓(xùn)練模式,三是智能數(shù)據(jù)挖掘和標(biāo)注,四是基于硬件平臺的計算優(yōu)化。
如上圖,在傳統(tǒng)的算法開發(fā)模式中,工程師把大量的時間都放在處理參數(shù)等這些基礎(chǔ)工作上,而真正能發(fā)揮其價值的時間占比很少。同時,機器的GPU利用率低,硬件無法充分發(fā)揮其效能。形成了對人才價值和機器價值的雙重浪費。
再看改進后的開發(fā)模式,通過設(shè)計與開發(fā)工具,幫助更好的收集和處理數(shù)據(jù),工程師把數(shù)據(jù)、框架、計算資源都管理起來,使得訓(xùn)練的效率、資源的使用效率都非常高,工程師的時間都用要高價值的工作內(nèi)容上。
“通過虛擬化的環(huán)境,系統(tǒng)把運算資源、存儲資源運用得更為高效,讓算法工程師的工作變得簡單而極致?!?鄧亞峰總結(jié)到。
從前后兩種開發(fā)模式對比來看,差別就在于一套大規(guī)模訓(xùn)練平臺?!?b>大部分公司沒必要重新造輪子?!痹卩噥喎蹇磥?,打造一個高效的大規(guī)模訓(xùn)練平臺就相當(dāng)于那個“輪子”,把算法工程師從大量的低端重復(fù)性工作中拯救出來。
那么又如構(gòu)建一個通用又高效的輪子呢?格靈深瞳用了“數(shù)據(jù)并行+模型并行”的方式。簡單來講就是把數(shù)據(jù)和模型分配到不同的機器上去運行,通過巧妙的分割、設(shè)計,使得不同機器間數(shù)據(jù)交換量比較少,平行拓展計算資源,從而實現(xiàn)非常高的訓(xùn)練效率。
這恰好就是深瞳大腦的設(shè)計思路:構(gòu)建從“數(shù)據(jù)->標(biāo)注->算法->訓(xùn)練->產(chǎn)品->數(shù)據(jù)”的一個正循環(huán),在這個訓(xùn)練框架里可以支持上百卡的集群訓(xùn)練、支持上億類別任務(wù)訓(xùn)練、支持多達上百層以及數(shù)十億參數(shù)的深度學(xué)習(xí)模型。“終極目標(biāo)是工程師做完這個框架,標(biāo)注好數(shù)據(jù),系統(tǒng)就會算出一個完美的結(jié)果?!编噥喎灞硎?。
找對那個“關(guān)鍵先生”
前面講過,高效的機器視覺系統(tǒng)有四個關(guān)鍵因素,其中前三個都是與框架相關(guān)的,是靠內(nèi)部工程師的智慧來解決,而第四個則是如何借助外力,選擇最好的“伙伴”,鄧亞峰認(rèn)為這一點極其重要:“如何選擇平臺,把計算做到極到,這跟效率和成本都是密切相關(guān)的?!?/b>
華為Atlas、海思NNIE、Movidius、TPU、NPU……對于工程師而言,當(dāng)前市場上的選擇比較多。鄧亞峰給出幾個重要的考量標(biāo)準(zhǔn):性價比如何?開發(fā)成本如何?能否提供一整套完整的接口和框架?生態(tài)的持續(xù)性如何?
在他看來,平臺的完整性和生態(tài)的可持續(xù)性非常重要。首先,多平臺開發(fā)和維護成本很高。如果一個平臺不具備云、端、側(cè)完整的能力,那么工程師就需要開發(fā)多平臺、維護多平臺。增加一個新平臺,不僅資金成本增加,關(guān)鍵是時間成本可能是企業(yè)不能承受的。所以,選擇具備云、端、側(cè)完整能力的平臺可以減少很多不必要的重復(fù)工作。其次,要選擇一個立足于長遠發(fā)展的生態(tài)。如果生態(tài)沒有保障,那么可能很多前期的投入就會全部作廢,這是更可怕的事情。
正是基于這樣的思考,格靈深瞳選擇了鯤鵬處理器+Atlas 300加速卡,結(jié)合自創(chuàng)的業(yè)界領(lǐng)先的全目標(biāo)(人臉、人體、車輛、非機動車)結(jié)構(gòu)化算法,搭建了自己的平臺,通過系統(tǒng)調(diào)度、推理流水線優(yōu)化、內(nèi)存優(yōu)化,最終實現(xiàn)單卡支持48路視頻結(jié)構(gòu)化,64路人臉識別。單機可以提供實現(xiàn)384路極致高密視頻實時分析。這其中Atlas 300 AI加速卡是一個“關(guān)鍵先生”,基于昇騰310和910 AI處理器的Atlas 300 AI加速卡提供多種數(shù)據(jù)精度,適用于人工智能訓(xùn)練和推理場景。
“我們業(yè)務(wù)的特點是模型非常多,各種各樣的處理需求復(fù)雜。Atlas 300有非常多的資源?!?鄧亞峰對雙方聯(lián)合打造的解決方案非常滿意,“這已經(jīng)是行業(yè)內(nèi)非常領(lǐng)先的一個結(jié)果。”
華為人工智能計算平臺以強大的算力,有云、邊、端豐富的產(chǎn)品,使得綜合成本更低。鄧亞峰認(rèn)為更為重要的原因是,華為在生態(tài)上有非常大的決心去投入,“我們開發(fā)中間也遇到一些困難,華為非常積極地支持我們,跟我們一起聯(lián)調(diào)。
格靈深瞳去年參加了行業(yè)最具挑戰(zhàn)的“非約束性自然環(huán)境人臉照片”測試項目,根據(jù)全球最權(quán)威的人臉識別算法測試(FRVT)公布的結(jié)果來看,格靈深瞳獲得了全球第一名的成績。此外,在2019年北京市交管局組織的第一屆交通行為圖像智能識別技術(shù)競賽中,格靈深瞳的行為識別算法也獲得了全國總排名第一的佳績。
在懂懂看來,讓格靈深瞳之所以選擇華為,主要是兩個原因:
第一,華為Atlas智能計算平臺的強算力和完整性。這是基于華為昇騰系列AI處理器和業(yè)界主層異構(gòu)計算部件,通過模塊、板卡、小站、服務(wù)器、集群豐富的產(chǎn)品形態(tài),打造面向“端、邊、云”的全場景AI基礎(chǔ)設(shè)施方案,可廣泛用于平安城市、智能交通、智慧醫(yī)療、AI推理等領(lǐng)域。
第二,是華為開放的生態(tài)以及對生態(tài)伙伴不遺余力的支持。華為Atlas智能計算平臺支持業(yè)界主流框架,方便易用的代碼遷移和模型轉(zhuǎn)換工具,通過靈活的合作方式與業(yè)界ISV共建、共贏。也就是說,選擇了華為Atlas智能計算平臺,就是選擇了一個開放的標(biāo)準(zhǔn),選擇了更多的合作伙伴,選擇了更多的機會。
如果人工智能是一場長跑,那么選擇一個最好的合作伙伴才是跑到終點的必要條件。對于格靈深瞳而言,華為Atlas人工智能計算平臺就是那個陪伴的“關(guān)鍵先生”。
請登錄以參與評論
現(xiàn)在登錄