從“認得出”到“讀得懂”——AI助力“猴臉識別”再升級
來源:陜西日報 2025-07-24 08:16
暑假期間,科研人員在野外觀察金絲猴(資料照片)。 受訪者供圖
7月21日,西北大學生命科學學院的實驗室里,科研人員點開一段野外視頻。畫面中的秦嶺密林里,金絲猴或嬉戲或覓食,而手機小程序“猴臉識別2.0”宛如懂猴語的“翻譯官”,將它們的一舉一動拆解成了可解讀的行為信號。
這不是簡單的“認猴”,而是一場AI與野生動物的“深度對話”。
“識猴”之困催生技術(shù)探索
西北大學金絲猴研究團隊為了研究金絲猴,付出了艱辛的努力。20多年前,該團隊在教授李保國的帶領(lǐng)下,經(jīng)過艱難探索,實現(xiàn)了對野生金絲猴的近距離觀察和個體識別。
如何準確、快速地對野生金絲猴進行個體識別,一直是全世界動物學家向往卻無法突破的難題。
“長期以來,在動物行為學的研究中,個體識別的數(shù)據(jù)采集主要依靠‘一筆一本一(望遠)鏡’人工觀察記錄方式。這種方式極度依賴觀察者的經(jīng)驗。”西北大學生命科學學院教授郭松濤介紹。例如,每只金絲猴的圖像樣本需要覆蓋四季,研究人員想要識別一只猴子,至少要為其拍攝七八百張照片,還要錄制大量視頻,難度很大。
2015年,團隊開始嘗試通過跨學科合作,利用新興技術(shù)解決這些問題。團隊與本校計算機科學領(lǐng)域、西安電子科技大學計算機科學領(lǐng)域的專家深度交流,組建了動物AI研究團隊。歷經(jīng)無數(shù)次嘗試與優(yōu)化,團隊終于“訓練”出了高精度的識別模型——“猴臉識別”系統(tǒng)。
該系統(tǒng)顛覆了依靠動物個體特征或者人為標記特征的傳統(tǒng)方法,實現(xiàn)了對野生個體準確身份識別和連續(xù)跟蹤采樣的功能。2020年7月,“猴臉識別”系統(tǒng)研究成果發(fā)表在《細胞》旗下綜合性子刊《交叉科學》上,獲得“為在‘理想條件下’實現(xiàn)‘無觀察者干擾效應(yīng)’的動物學研究提供了可能”的評價。
“猴臉識別”系統(tǒng)的誕生,使西北大學金絲猴研究團隊的“識猴”水平邁向一個新高度。
“猴臉識別”系統(tǒng)的進化
“猴臉識別”系統(tǒng)類似于人臉識別,先通過提取金絲猴面部特征信息,建立秦嶺金絲猴個體的身份信息庫;接入野外采集的視頻、圖像后,能夠自動識別、匹配,實現(xiàn)了在復雜條件下對動物個體的探測、識別和追蹤。
“不過,金絲猴臉部皮膚區(qū)域小,帶毛區(qū)域多,紋理特征更為復雜。這對識別系統(tǒng)的深度學習能力提出了極高要求。為此,團隊采集了數(shù)量更多、質(zhì)量更高的個體圖像樣本,不斷優(yōu)化算法?!惫蓾榻B。
與此同時,團隊把識別的范圍擴大到秦嶺金絲猴的多個種群上千只個體,啟動建立秦嶺金絲猴個體信息庫,并結(jié)合野外和圈養(yǎng)條件下識別動物的不同應(yīng)用場景與需求,進行個性化識別功能的研發(fā)。
但是,復雜場景下野生動物行為識別仍然面臨多重共性挑戰(zhàn):哺乳動物行為由多樣姿勢與動作組合構(gòu)成,卻無獨立標簽;行為連續(xù)且交互性強,時間跨度差異大,起止時間難以精準確定……
為解決行為智能分析中面臨的共性難題,團隊以行為學原理為根基,融合人工智能技術(shù),歷時4年研發(fā)出“猴臉識別2.0”——自動識別與測量AI框架。這個AI框架如同一位神奇的“翻譯官”,從行為的結(jié)構(gòu)分析入手,通過在動物的整個身體布列出多個關(guān)鍵信息點,利用這些點的結(jié)構(gòu)運動來分析其行為。
“它不再局限于解讀某一姿勢或動作,而是對動物行為全流程進行分析,結(jié)果更加客觀,排除了人為觀察的干擾,可以幫助我們更‘懂猴’?!惫蓾榻B,該技術(shù)已在4大類群、10種代表性物種上得到了驗證。
“我們希望借助AI的力量,共同推動動物行為學研究手段的進步,促進技術(shù)快速迭代。”郭松濤說。
學科交叉孕育創(chuàng)新碩果
學科交叉的力量始終貫穿在“識猴”到“懂猴”的技術(shù)發(fā)展過程中。
在“猴臉識別”系統(tǒng)的研發(fā)過程中,西北大學金絲猴研究團隊的科研人員憑借對金絲猴長期的觀察和了解,提供了豐富的物種特征數(shù)據(jù)及行為學知識,為計算機科學領(lǐng)域的科研人員構(gòu)建識別模型提供了重要的依據(jù)。
西北大學、西安電子科技大學計算機科學領(lǐng)域的團隊則運用神經(jīng)網(wǎng)絡(luò)原理、人工智能算法等技術(shù)手段,將生物學數(shù)據(jù)轉(zhuǎn)化為可被機器識別和處理的信息。
“在這個過程中,我們開發(fā)了深度神經(jīng)網(wǎng)絡(luò)模型,讓計算機能夠?qū)W習和識別金絲猴復雜的面部特征及身體結(jié)構(gòu)和運動特征。在面對數(shù)據(jù)量龐大、特征復雜等問題時,計算機科學的大數(shù)據(jù)處理能力、算法優(yōu)化能力得以充分發(fā)揮?!蔽鞅贝髮W信息科學與技術(shù)學院教授許鵬飛說。
在郭松濤和許鵬飛看來,學科交叉的力量之所以能很好發(fā)揮,在于他們在交叉中都找到了屬于自己學科要突破的共性問題。
例如,生命科學希望借助新技術(shù)、新手段,解決復雜場景下野生動物行為識別的行業(yè)難題;信息科學需要解決機器識別中,目標相似難識別和目標狀態(tài)易變難識別等技術(shù)難題。
在交流合作中,他們相互啟發(fā)。
“我們生命科學的研究者從計算機科學的快速發(fā)展中獲得靈感,思考如何將新技術(shù)應(yīng)用于動物行為研究。”郭松濤說。
“計算機科學領(lǐng)域的研究者則在了解生物學問題的過程中,拓展了算法應(yīng)用的邊界,開發(fā)出更適合解決生物領(lǐng)域問題的技術(shù)?!痹S鵬飛介紹。