從馬云在 CeBIT 大會上的“刷臉”支付到最近微軟推出的“how - old”,關于“面部識別”技術的討論一直備受關注,但基于這項技術的具體應用和發(fā)展狀況的市場認知卻十分有限。事實上,隨著機器學習和深度神經網(wǎng)絡兩個領域的迅速發(fā)展以及智能設備的普及,“面部識別”技術正在經歷前所未有的發(fā)展。

早在 2009 年,一家來自美國馬薩諸塞州的公司—— Affectiva 便已經開始了基于云端的面部識別和情緒識別解析服務的探索,并獲得了李嘉誠的投資;而在 2010 年末,F(xiàn)acebook 也開始了面部識別領域的布局,并于 2012 年以 6,000 萬美金的價格收購了著名面部識別公司 Face.com,其面部識別項目組“DeepFace”更是宣稱正在研發(fā)的面部識別技術的準確率已經接近人類水平;一直致力于人工智能領域探索的 Google 也沒有閑著,近幾年接連大手筆收購了 Picassa、Pittoatt 和 Viewdle 等多家人臉識別公司;就在不久前的“Build 2015”大會上,微軟也發(fā)布了可供用戶免費集成圖像及人臉識別功能的 Project Oxford。

同樣,國內的互聯(lián)網(wǎng)巨頭和創(chuàng)業(yè)公司們也在不同程度上針對“面部識別”技術進行著相應的探索。阿里巴巴圍繞著“安全支付”同螞蟻金服和 “Face++” 合作研發(fā)的人臉識別技術備受關注,騰訊“優(yōu)圖”基于人臉識別、圖像識別和深度學習的技術也逐步應用于各產品線,而百度則在吳恩達博士的率領下將“面部識別”作為百度深度學習研究室的重點研究項目。除此之外,國內還涌現(xiàn)了像“Face++”、“Angel Eyes” 和“一登”這樣的基于“面部識別”技術的創(chuàng)業(yè)公司。

從“圖像識別”到“人臉識別”的應用場景變更

現(xiàn)階段“人臉識別”技術的進步離不開早期“圖像識別”技術的發(fā)展與應用。從搜索引擎相似圖片搜索到手機相機應用自動美顏,再到電商依據(jù)圖像識別的相似商品搜索和二維碼掃描,“圖像識別”技術的應用場景覆蓋了眾多領域。這一方面源于各領域海量數(shù)據(jù)的積累可以達到精準匹配與優(yōu)化的程度,另一方面也是因為“圖像識別”技術較于“人臉識別”技術的更高可操作性。

的確,由于“人臉識別”涉及到動態(tài)識別、活體檢測和微表情識別等維度,在可操作性和精準度等方面的表現(xiàn)暫不及“圖像識別”,但它卻有著“圖像識別”所替代不了的技術和場景優(yōu)越性。首先,它能簡化認證和注冊的流程。如果你現(xiàn)在要開一個淘寶店或者注冊一個微信公眾賬號,你便需要手持身份證拍照以驗證你的身份。這固然是出于安全和信用方面的考慮,但“人臉識別”技術卻能以“人臉”為獨立驗證 ID 簡化注冊與認證的流程。相同的例子還有“一登”為一些應用提供的“刷臉”注冊功能。

其次,在安全支付領域,成熟的“人臉識別”技術顯然要比普通的字符、字串密碼來的更加快捷和安全。當用戶發(fā)生支付行為時,用“刷臉”這一簡單的動作代替復雜的密碼輸入操作可以縮短用戶支付時間;而當用戶出現(xiàn)密碼被盜的情況時,不僅可以通過獨立人臉 ID 迅速找回,還能通過后臺保留的用戶人臉 ID 避免密碼被輕易修改。

同時,在娛樂領域,“人臉識別”技術也有豐富的利用空間。之前由“落網(wǎng)電臺”推出的情緒識別 app ——“emo”便是利用了由“一登”提供的技術進行刷臉注冊和情緒識別音樂推薦;而在游戲領域,開發(fā)者也可以通過“人臉識別”技術的應用來捕獲玩家的表情變化,從而優(yōu)化游戲設計與關卡邏輯。

當然,關于“人臉識別”技術還有很多的想象空間,一個真實且腦洞大開的故事是波士頓警方曾在 Facebook “人臉識別”技術的輔助下成功抓獲了一名涉嫌兒童性侵案的嫌犯。

聽上去很酷,但實現(xiàn)起來很難

的確,“人臉識別”技術有著十分廣泛的應用范圍和落地場景。但不可否認的是,過高的技術門檻和相關人才的缺失成為了其發(fā)展的最大短板。以國內為例,有關“人臉識別”的最核心技術和人才基本集中于 BAT 這樣的科技巨頭手中,而巨頭們出于自身生態(tài)和戰(zhàn)略的考慮都對相關技術進行著有限開放和相對封閉的上層領域開發(fā);而技術能力相對較弱的中小團隊只能憑借著不斷的摸索從小的領域尋找突破口。此外,由于關鍵技術的封閉,在現(xiàn)實應用領域,光線、角度等因素仍對識別結果有著一定的影響,識別結果的精確度和安全性仍有很大的提高空間。

其次,目前國內的“人臉識別”也缺乏統(tǒng)一的技術標準。雖然國內團隊在類似 LFW 的國際標準測試中的精度不斷提升,基本上每家的 LFW 通過率都在 95% 以上,但真實的場景要比 LFW 的測試復雜得多,行業(yè)對“人臉識別”技術的評判缺乏一個更為細致的可靠辨識度。

與此同時,用戶數(shù)據(jù)信息渠道的封閉也使得用戶圖像信息與其他相關信息間的關聯(lián)缺乏有效連接,各公司和開發(fā)者依據(jù)自身數(shù)據(jù)積累進行研發(fā)的小閉環(huán)難以形成生態(tài)效應,這也加大了“人臉識別”技術準確度在海量數(shù)據(jù)研究基礎上的提升。

同樣,有關“人臉識別”所涉及的隱私問題也一直備受爭議。此前,F(xiàn)acebook 因為未經用戶允許而私自儲存和使用用戶的“人臉識別”數(shù)據(jù)而飽受詬病;而 Google 則因隱私政策和輿論壓力而禁止 Glass App 使用“人臉識別”功能。這是涉及到用戶個人信息安全的共性問題,一方面需要企業(yè)合開發(fā)者們有過硬的技術實力來保證用戶數(shù)據(jù)安全,同時對用戶數(shù)據(jù)在征得同意的情況下進行合理使用;另一方面也需要對相關用戶市場進行針對性教育。

未來,共性合作大于個性爆發(fā)

任何行業(yè)和技術的發(fā)展都不會一蹴而就,一個健康生態(tài)的形成也絕非一朝一夕。我們不可否認“人臉識別”技術的發(fā)展前景,但也不能忽視它在發(fā)展中所存在的問題。當然,這些問題也并非哪一方就能解決的,需要整個行業(yè)各環(huán)節(jié)的共同努力。

對于“人臉識別”技術的開發(fā)團隊而言,除了在技術研發(fā)方面的努力外還應拓展技術實現(xiàn)場景,實現(xiàn)有效數(shù)據(jù)積累。在用戶市場,除了上述的小眾娛樂領域,開發(fā)團隊們還可以進行安全解鎖和數(shù)據(jù)檢索方向的探索;而在企業(yè)市場,企業(yè)級身份認證和基于“人臉識別”的可穿戴設備及智能家居植入也有很多的想象空間。畢竟,依托海量數(shù)據(jù)的技術研發(fā)才更具有應用的精準度和可靠性。

對于 BAT 這些生態(tài)級的巨頭而言,開放戰(zhàn)略不能僅僅紙上談兵。相關技術與數(shù)據(jù)的開放帶動的是整個生態(tài)的繁榮,之如 Google 對 Android 的開源政策,只有大的行業(yè)生態(tài)不斷向前發(fā)展才能帶動小生態(tài)穩(wěn)定繁榮。對中小開發(fā)團隊的開放與合作能夠給巨頭企業(yè)帶來更多的想象空間,從底層小眾應用到上層生態(tài)構造,讓“人臉識別”技術可以形成“鏈條式”的打通,推動更多應用場景的產生,而不是各自閉門造車。

對于整個行業(yè)而言,無論是 BAT 還是中小開發(fā)團隊,建立一個行之有效的技術評判標準與隱私尊重政策是迫在眉睫的必要之舉。只有在一個公正客觀的行業(yè)環(huán)境下才能更好地教育市場和用戶。

關于“人臉識別”,可以預計的是一個不斷上升的發(fā)展空間和愈加豐富的應用場景,但要真正實現(xiàn)技術落地和生態(tài)打通還需要行業(yè)各環(huán)節(jié)的相互配合。