我們教機器認識你的美

2020-06-19 23:01:57 sunmedia 2110


? ? 作者:是深圳市賽為智能股份有限公司人工智能研究院

????院長 ?王秋陽?

????算法工程師 吳亦歌

????宋代禪宗大師青原行思曾提出參禪的三重境界:參禪之初,,看山是山,,看水是水;禪有悟時,,看山不是山,,看水不是水,;禪中徹悟,看山還是山,,看水還是水,。這三種境界,從本質(zhì)上其實是展示了人“看見”的過程,,以及思維與理解在這一過程中所起到的作用,。?
?????
????“看見”,首先是視覺識別的意思,。對于人類而言,,似乎是一個很簡單,、自然的事情,實則不然,。從地球上第一個長出眼睛的三葉蟲,,到今天的人類視覺,中間經(jīng)歷了五億四千萬年的漫長旅程,。人類獲得今天的視覺能力,,是大自然長期進化的結(jié)果。在漫長的過程中,,大自然更多的是幫助我們進化大腦內(nèi)用于視覺處理的器官,,而不是眼睛本身。所以,,“看見”不僅僅是從眼睛采集光線獲得信息,,還需通過大腦處理才能使這些信息產(chǎn)生正真的意義。???????

????當今時代,,風云變幻,,在科技發(fā)展上的道路上,人類社會已取得了前所未有的進步,。我們可以通過火箭將人類送上太空,,可以通過手機和互聯(lián)網(wǎng)隨時隨地的與人交流,也可以通過飛機在一日之內(nèi)將人送往全球任意一個地方,。但是,,我們依然會面對這樣的困境:即便是我們最先進的機器和超級計算機,也會在“看見”這個問題上手足無措,。

????對于研發(fā)人員來說,前些年,,我們開發(fā)了地鐵綜合監(jiān)控系統(tǒng),,但是沒有敏銳的機器視覺,幫我們對人流和突發(fā)事件進行最高效分析,;我們的無人機可以攜帶重物飛越廣闊的土地,,卻沒有足夠的視覺技術,去幫助我們追蹤太陽能板的損壞情況,;我們做過許多重大的安防項目,,部署成千上萬的安防攝像頭,但當有險情發(fā)生時卻不能百分之百實現(xiàn)及時報警,。這都是我們在計算機視覺領域不得不面對的難題,,和亟需突破的瓶頸。?
??????
????這兩年,包括百度,、阿里,、賽為智能,、商湯科技等都相繼成立了人工智能的研究機構,都在不斷優(yōu)化人臉識別技術,,尋找適配場景,。?
?????
????人腦的視覺任務,本質(zhì)上是人腦對外界視覺信號作出反應的過程,,那么,,通過對人腦的工作原理進行分析和模擬,是否能夠為計算機視覺提供一些啟發(fā),,讓機器“看山是山”呢,?基于上述的部分應用場景,我們組建了專業(yè)的研發(fā)團隊,,明知山有虎,,偏向虎山行,集中優(yōu)勢資源和人才,,重點對機器視覺領域進行專項研究,。?

????“看見”為什么這么難,你可能在內(nèi)心提出這樣的疑問,。其實,,在我們的日常生活中,相機獲取照片的方式是這樣的:它通過捕獲光線,,轉(zhuǎn)換成二維數(shù)字矩陣——像素來存儲,。但這些都是數(shù)字,本身沒有任何意義,。就像拍照和“看見”完全不同,。通過“看見”,意味著我們實際上“理解”了這幅畫,。?
??????
????教計算機去“看見”,,如何“看見”,這就是計算機視覺和深度學習的主要研究領域,,也是人工智能的重要分支領域,。自從人工智能研究所成立以來,我們把重點放在讓機器像我們一樣看見事物上,,例如識別物品,、識別環(huán)境、辨別不同的人,、推斷人臉的姿態(tài),、理解人與人的關聯(lián)、人的情緒、動作和意圖,。最終的目標就是,,只需對一個畫面看一眼,,就能理清整個圖片中的人物、動作和環(huán)境。?
??????
????要實現(xiàn)這一目標,,我們首先要教計算機“看到”對象,,這是建造機器視覺的基石,。這個人物看上去很簡單,,但是識別的過程確相對比較復雜。想象一下這個教學過程,,首先給計算器進行特定物品圖片的訓練,,例如人臉圖片,讓它從成千上萬次的反復的訓練中,,總結(jié)特征,,構建出對應的識別模型。?
??????
????這有多難呢,?人臉看起來,,就是一些形狀和特征拼湊起來的圖形罷了。最傳統(tǒng)的特征匹配識別方法,,是告訴計算機:“人”有著圓臉,、中間有鼻子、上面有眼睛,,下面有嘴巴,、兩個耳朵分別在左右,而且這看上去挺美的,!但在實際的場景中,,我們還會遇到多種多樣的人臉,例如傾斜的人臉,、遮擋的人臉以及非活體的人臉(靜態(tài),、或者動態(tài)的人臉照片)。簡單的人臉,,在計算機的視角下,,有著無限種變化的外觀模型,。所以,,我們采用新的識別方法,從新的視角來描述這個人臉,。?
??????
????大家都知道,,沒有人教嬰兒如何“看”,尤其是在他們很小的時候,但是他們卻可以從現(xiàn)實世界中學會這一點,。簡單來講,,我們可以把孩子的眼睛當成生物攝像機,大腦是后端的處理系統(tǒng),。他們一秒能就能拍5張照片,,到三歲的時候,一個孩子已經(jīng)看到了數(shù)億張真實世界的照片,。如果換成計算機,,那么可以說所用于“訓練照片”的數(shù)量是非常大的。這給予我們很大的啟發(fā),。我們的研究方向不再是孤立地只關注算法的優(yōu)化和再優(yōu)化,,而要同時去為算法提供海量的訓練數(shù)據(jù),用數(shù)據(jù)為機器視覺的算法提供訓練和支持,。?
??????
????目前,,國內(nèi)應用的人臉識別的基礎數(shù)據(jù)多數(shù)是國際上的通用數(shù)據(jù),多數(shù)是西方的人臉數(shù)據(jù),。賽為智能做建筑,、交通智能化起家,后來又涉足智慧城市,,同BAT一樣,,積累了大量的數(shù)據(jù),結(jié)合公司的業(yè)務,,大量采集人臉數(shù)據(jù),,自主建立了標準的海量人臉數(shù)據(jù)庫,數(shù)據(jù)庫以亞洲人種為主,,包含完整的人臉關鍵特征點,、多角度的人臉姿勢,同時覆蓋了不同時間空間(時空)中的同一人群,。無論是質(zhì)量還是數(shù)量,,都是一個非常豐富的人臉數(shù)據(jù)庫,這對于我們?nèi)四樧R別的研究大有裨益,,特別在智慧城市的場景下,,擁有良好的適配度。?

????有了用來培育計算機大腦的數(shù)據(jù)庫,,我們接著針對算法展開研究,。賽為智能海量人臉數(shù)據(jù)庫所包含的的信息數(shù)據(jù),適用于一些特定類別的機器學習算法,,即卷積神經(jīng)網(wǎng)絡,。人類的大腦是由數(shù)億緊密聯(lián)結(jié)的神經(jīng)元組成,,為了模擬人腦,我們從神經(jīng)網(wǎng)絡中最基礎的運算單元——“神經(jīng)元節(jié)點”開始構建,。計算機所模擬的神經(jīng)元節(jié)點模型是一個包含輸入,、輸出與計算功能的模型。每個節(jié)點從其它節(jié)點獲取輸入的信息,,然后通過計算,,將自己的輸出信息傳遞給下一個節(jié)點。這些神經(jīng)元節(jié)點就像大腦中的神經(jīng)網(wǎng)絡一樣排列,,最后組成卷積神經(jīng)網(wǎng)絡,。在自主建設的海量人臉數(shù)據(jù)庫的數(shù)據(jù)支持下,我們通過大量的GPU集群訓練這個模型,,最后得到人臉識別模型,。??
??????
????而為了訓練計算機看懂圖片并輸出正確的結(jié)果,我們需要進一步結(jié)合大數(shù)據(jù)和深度學習算法,。通過多次迭代和更新算法,,我們的人臉識別sdk可以在分類輸入圖片的同時,采集和更新數(shù)據(jù)庫,,進行學習,,不斷的學習和總結(jié)所獲得的視覺信息,讓整個系統(tǒng)不斷的優(yōu)化自己?,F(xiàn)在,,賽為智能人臉識別sdk4.0項目,已階段性結(jié)項,。我們把所有技術結(jié)合在一起,,研發(fā)出賽為智能的人臉識別sdk4.0和跨平臺人臉識別系統(tǒng)。這些系統(tǒng)在看到圖片的第一時間,,就能自動檢測和識別人臉,,并且輸出人臉的特征點和各類屬性。同時,,不斷的采集和更新數(shù)據(jù)庫,,讓人臉識別更精確,有效的對抗時間和空間的變化,,性能更佳,。?
??????
????但這并不是我們的最終目標。計算機實現(xiàn)的功能尚未達到,,或者超過人類的能力,。到現(xiàn)在,我們還只是完成了讓機器“看見”對象,,而真正地實現(xiàn)讓計算機“看懂”這個世界,,我們?nèi)匀蝗沃囟肋h,這也是整個行業(yè)正在不斷努力前行的方向,。?
??????
????前路漫漫,,真正的挑戰(zhàn),存在于未來的每一天,,而我們將會傾注心血,,與機器視覺技術一起成長。賦力機器,,賦能技術,,不遠的將來,人類的眼睛將不再孤獨地思考和探索我們的世界,。我們將不止借助機器的視覺,、聽力以及智力,我們還要以一種前所未有的方式,,與它們合作共生,。這也是我們?nèi)斯ぶ悄苎芯吭喝w同仁的追求。?
??????
????賦予計算機智能,,賦予機器智能,,賦予未來智能。賦能世界,,在人類科學技術的不斷發(fā)展之下,,我們終將為生存的家園,創(chuàng)造更美好的明天,。 ? ? ?


未知來源
免責聲明:商媒在線所提供的信息及圖片除原創(chuàng)外,,有部分資訊和圖片從網(wǎng)絡等媒體收集而來,版權歸原作者及媒體網(wǎng)站所有,,商媒在線力求保存原有的版權信息并盡可能注明來源,;部分因為操作上的原因可能已將原有信息丟失,敬請原作者諒解,,如果您對商媒在線所載文章及圖片版權的歸屬存有異議,,請立即通知商媒在線,商媒在線將立即予以刪除,,同時向您表示歉意,!

最新資訊