科學家發現了一種應用于智慧醫院等領域的人臉識別模型
人臉識別工具是一種計算模型,可以在眾多領域得到應用,醫學領域的智慧醫院環節也不例外。
在醫院的就醫環節,醫院的管理人員可以用人臉識別代替社???、身份證等識讀設備。在醫保支付環節,人臉識別還可以進行支付認證。在醫院影像領域,人臉識別可以和PACS系統很好結合,輔助醫療技術影像科的專家識別身份,判定疾病的癥狀等。人臉識別,智慧醫院領域領域必不可少。
雖然現在大多數現有的人臉識別模型都表現得非常好,但仍有很大的改進空間。倫敦瑪麗女王大學的研究人員最近為人臉識別創造了一種新的、有前景的架構。
“使用卷積神經網絡(CNN)和基于邊緣損失的整體方法主導了人臉識別的研究,”進行這項研究的兩名研究人員孫仲林(Zhonglin Sun)和Georgios Tzimiropoulos說。
“在這項工作中,我們從兩個方面出發:首先,我們使用視覺轉換器作為一個架構來訓練一個非常強的人臉識別基線,簡稱fViT,它已經超過了大多數最先進的人臉識別方法。其次,我們利用視覺變壓器(ViTs)的固有屬性來處理從不規則網格中提取的信息(視覺標記),設計出一種用于人臉識別的管道?!?/span>
大多數廣泛使用的人臉識別方法都是基于CNN,這是一類人工神經網絡,可以自主學習在圖像中尋找模式,例如識別特定的物體或人。雖然其中一些方法取得了非常好的性能,但最近的工作突出了另一類人臉識別算法的潛力,即視覺變壓器(ViTs)。
與CNN相比,ViTs將圖像分割成特定大小的補丁,然后在這些補丁中添加嵌入。CNN通常全面分析圖像。然后,得到的向量序列被饋送到標準轉換器,這是一個深度學習模型,它對正在分析的數據的不同部分進行不同的加權。
研究人員在他們的論文中解釋說:“與CNN相反,ViT實際上可以在從不規則網格中提取的補丁上工作,并且不需要用于卷積的均勻間隔采樣網格?!薄坝捎谌四樖怯刹糠?/span>(如眼睛、鼻子、嘴唇)組成的結構化對象,并且受到深度學習之前基于部分的面部識別開創性工作的啟發,我們建議將ViT應用于代表面部部分的補丁?!?/span>
由Sun和Tzimiropoulos創建的視覺轉換器架構,被稱為部分fViT,由一個輕量級網絡和一個視覺轉換器組成。網絡預測面部標志的坐標(例如,鼻子,嘴巴等),而變壓器分析包含預測標志的補丁。
他們的架構在所有測試數據集上都取得了驚人的準確性,與許多其他最先進的人臉識別模型相當。此外,他們的模型似乎在沒有經過專門訓練的情況下成功地勾畫出了面部地標。