首頁 資訊 人體姿態(tài)估計技術(shù)的理解(Human Pose Estimination)

人體姿態(tài)估計技術(shù)的理解(Human Pose Estimination)

來源:泰然健康網(wǎng) 時間:2025年09月07日 02:35

2024-10-21 519 發(fā)布于吉林

版權(quán)

舉報

版權(quán)聲明:

本文內(nèi)容由阿里云實名注冊用戶自發(fā)貢獻,版權(quán)歸原作者所有,阿里云開發(fā)者社區(qū)不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。具體規(guī)則請查看《 阿里云開發(fā)者社區(qū)用戶服務(wù)協(xié)議》和 《阿里云開發(fā)者社區(qū)知識產(chǎn)權(quán)保護指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,填寫 侵權(quán)投訴表單進行舉報,一經(jīng)查實,本社區(qū)將立刻刪除涉嫌侵權(quán)內(nèi)容。

本人畢設(shè)題目是人體姿態(tài)估計技術(shù)的相關(guān)課題,本人按照自己對人體姿態(tài)估計技術(shù)的學(xué)習(xí)和理解進行論述,如有不足,請大家指正?。?!

首先討論一個問題:什么是姿態(tài)估計?

“姿勢估計?……姿勢這個詞對不同的人可能有不同的含義,但我們不是在討論阿諾德的經(jīng)典作品、奧林匹亞或選美表演。那么,姿勢估計到底是什么呢?那么,讓我們深入探討一下這個話題。

姿態(tài)估計在計算機視覺領(lǐng)域引起了極大的關(guān)注。人們越來越感興趣的是能夠使用計算機視覺技術(shù)實時識別和跟蹤人或物體的運動,這在各行各業(yè)提供了很多有用性。在不斷發(fā)展的先進技術(shù)時代,姿態(tài)估計可以成為體育生物力學(xué)、動畫、游戲、機器人、醫(yī)療康復(fù)和監(jiān)控領(lǐng)域的

有效工具。

本質(zhì)上,姿勢估計是根據(jù)一個人在圖像或視頻中的身體部位和關(guān)節(jié)位置來預(yù)測不同的姿勢。例如,我們可以在做深蹲的時候自動檢測關(guān)節(jié)、手臂、臀部和脊柱的位置。現(xiàn)在,我們中的一些人可能想知道它是如何有用的?然而,考慮一個運動員受傷后恢復(fù)或進行力量訓(xùn)練的例子;姿勢估計可以幫助運動分析人員分析深蹲從起始位置到結(jié)束位置的關(guān)鍵點。因此,這些分析人員可以糾正姿勢,幫助預(yù)防訓(xùn)練損傷。

在與人類合作時,姿態(tài)分析是通過確定各種身體關(guān)節(jié)來進行的。例如,它可以通過某人肘關(guān)節(jié)的位置或膝關(guān)節(jié)的位置來確定。這種形式的姿態(tài)檢測屬于人體姿態(tài)估計的范疇。姿態(tài)估計模型以處理良好的圖像或視頻的形式提供輸入。該模型根據(jù)輸入圖像中的信息提供關(guān)于不同關(guān)鍵點的輸出。一般來說,關(guān)鍵點被提供了一個 ID 和一個置信度分數(shù),決定了一個關(guān)鍵點存在于給定輸入的特定位置的概率?,F(xiàn)在,如果我們回憶一下之前運動員做深蹲的圖像,我們可以分配各種 id,例如:

相反,與人類受試者不同的是,對于主要是剛性的物體,可以進行姿態(tài)估計;因此,它們屬于剛性姿態(tài)估計的范疇。

2D 和 3D 方面的姿態(tài)估計

姿態(tài)估計可以通過兩種方式進行,即 2D 和 3D。也許,我們中的一些人將 2D 和 3D 的這些概念與動畫領(lǐng)域聯(lián)系起來。然而,2D 方面的姿態(tài)估計與基于像素值從圖像中預(yù)測關(guān)鍵點有關(guān)。因此,大多數(shù) 2D 人體姿態(tài)估計技術(shù)都實現(xiàn)了特征提取方法,以提供人體的適當(dāng)關(guān)鍵點。類似地,3D 姿態(tài)估計與從圖像和視頻中預(yù)測特定的人或物體的空間位置有關(guān)。隨著深度學(xué)習(xí)的出現(xiàn),這些模型的性能有了顯著的提高,但它們的使用更加復(fù)雜,因為數(shù)據(jù)集需要與適當(dāng)?shù)娜梭w 3D 結(jié)構(gòu)信息(包括背景和照明條件)進行整理。此外,還有新的方法用于與檢測一個人或物體或跟蹤多個人和物體相關(guān)的單姿態(tài)和多姿態(tài)估計。

姿態(tài)估計模型

各種研究人員提出了不同的姿態(tài)、估計模型。在深入探討之前,有必要了解一下,人體姿態(tài)估計模型基本上有三種類型:

運動的平面的體積的運動學(xué)模型可用于 2D 和 3D 姿態(tài)估計。本質(zhì)上,這個模型側(cè)重于不同的關(guān)節(jié)和肢體位置,以提供人體的結(jié)構(gòu)信息。因此,這樣的模型有效地識別了人體各部位之間的各種關(guān)系。然而,運動學(xué)模型在表示基于紋理或形狀的信息時幾乎沒有限制。接下來,我們討論強調(diào) 2D 姿態(tài)估計的平面模型。理想情況下,人體部位用矩形表示,以提供近似人
體輪廓。最后,體姿態(tài)估計模型專注于 3D 姿態(tài)估計。這些是端到端的深度學(xué)習(xí)模型,使用包含全身掃描高分辨率數(shù)據(jù)的復(fù)雜數(shù)據(jù)集進行訓(xùn)練,以導(dǎo)出各種形狀和姿態(tài)的人體網(wǎng)格。

雖然不可能涵蓋廣泛的模型,但我們將討論近年來用不同的方法提出的一些最可靠和魯棒的模型。

讓我們來看看 2022 年正在使用的一些流行的姿態(tài)估計。

開放姿態(tài)
開放姿勢是卡內(nèi)基梅隆大學(xué)開發(fā)的第一個實時后估計模型。該模型主要專注于在實時場景中檢測多人的手、臉、腳等人體關(guān)鍵點。一般來說,圖像是在卷積神經(jīng)網(wǎng)絡(luò)(CNN)的幫助下處理的,以生成特定輸入的特征映射。進一步,通過 CNN 管道的不同階段對特征圖進行處理,得到置信度圖和親和場。
![2
移動網(wǎng)絡(luò)
移動網(wǎng)絡(luò)是由谷歌研究使用 TensorFlow.js 開發(fā)的。研究人員聲稱,該模型具有超快、高精度的特點,能夠檢測人體的 17 個關(guān)鍵關(guān)鍵點。然而,該模型有兩個版本,即“閃電”,針對的是對延遲要求低的應(yīng)用。另一方面,Thunder 版本是為專注于實現(xiàn)更高精度的應(yīng)用而設(shè)計的。此外,這兩個模型都能夠進行實時檢測,并已被證明可以有效地檢測實時健身、體育或基于醫(yī)療保健的應(yīng)用。

PoseNet
PoseNet 是另一個流行的姿勢檢測模型。該模型可以實時檢測姿態(tài),并高效地用于人體的單姿態(tài)和多姿態(tài)檢測。PoseNet 是一個深度學(xué)習(xí)模型,它使用 TensorFlow 來檢測不同的身體部位,并通過連接其他關(guān)鍵點提供全面的骨骼信息。此外,PoseNet 還為人體從眼睛到腳踝的各個部位提供了 17 個關(guān)鍵點。生成一個置信度分數(shù),以確定模型從圖像中識別特定關(guān)鍵點的精準(zhǔn)程度,從而識別模型的準(zhǔn)確性。所有關(guān)于測試和配置的信息都可以通過 GitHub 訪問。

DCpose
DCPose 代表深度雙連續(xù)網(wǎng)絡(luò),開發(fā)用于從多幀檢測人體姿勢。該框架利用深度學(xué)習(xí)技術(shù)來克服多幀人體姿態(tài)估計中的關(guān)鍵挑戰(zhàn),如運動模糊、散焦視頻,以及由于對每個視頻幀的依賴而發(fā)生的遮擋。此外,這些視頻幀之間提供了各種時間參考,以促進準(zhǔn)確的關(guān)鍵點檢測。進一步,時間合并充當(dāng)編碼器,以實現(xiàn)更廣泛的搜索范圍,而殘差融合模塊負責(zé)計算不同方向的殘差。

Densepose
DensePose 是一個人體姿態(tài)估計器,旨在從關(guān)于人體 3D 表面的 RGB 圖像中映射各種基于人體的像素。該模型可以實現(xiàn)單姿態(tài)和多姿態(tài)估計的必要性。DensePose 以包含圖像到表面注釋信息的大規(guī)模數(shù)據(jù)集的形式使用地面真相。此外,提出了一種循環(huán)神經(jīng)網(wǎng)絡(luò)(RCNN),能夠以每秒多幀的速度回歸每個人體受試者之間不同身體部位相關(guān)的 UV 坐標(biāo)。

HigherHRnet
HigherHRNet 是一種流行的自下而上的姿勢估計模型,旨在解決由于比例差異而在預(yù)測矮個子的正確姿勢時遇到的一些挑戰(zhàn)。特征金字塔是必不可少的組成部分,它允許所提出的方法從尺度感知表示中學(xué)習(xí),幫助估計精確的關(guān)鍵點,以確定矮個子的姿態(tài)估計變化。特征金字塔主要包括由 HRNet 模型生成的特征圖輸出,包括由轉(zhuǎn)置卷積產(chǎn)生的高分辨率輸出。此外,作者還發(fā)現(xiàn),對于中等規(guī)模的人來說,該模型比現(xiàn)有的一些自下而上的方法的AP高出2.5%。此外,該模型在從擁擠的場景中估計姿態(tài)時也能有效地表現(xiàn)。

結(jié)論

姿態(tài)檢測是計算機視覺領(lǐng)域中一個不斷發(fā)展的研究領(lǐng)域。從提供現(xiàn)實生活中的應(yīng)用程序到在云端服務(wù)器上運行的應(yīng)用程序,姿態(tài)估計在業(yè)界獲得了極大的吸引力。事實上,先進的姿態(tài)估計模型更快、更小,才能在移動設(shè)備上發(fā)揮作用,這提供了充足的機會。這些模型可以實時有效地為體育分析師服務(wù),甚至在醫(yī)療康復(fù)、私人教練和逼真的游戲中都是可靠的。雖然已經(jīng)開發(fā)了各種應(yīng)用,但每一種新模型都旨在改善之前模型的一些局限性。

然而,隨著深度學(xué)習(xí)和多種開源技術(shù)的使用,各種產(chǎn)品都符合要求,可以改變未來人體姿態(tài)估計的執(zhí)行方式。因此,令人興奮的前景已經(jīng)打開,使有效跨行業(yè)實現(xiàn)最先進的姿態(tài)檢測應(yīng)用成為可能。

相關(guān)知識

瑜伽體式:虎式(Tiger Pose)
拍照pose擺的好,體重看起來輕不少!
人體姿態(tài)評估要點
Human Health Issues Related to Pesticides
歐盟健康風(fēng)險評估技術(shù)概述
瑜伽體式:搖籃式(Cradle Yoga Pose)
身體姿態(tài)評估,讀懂身體的語言!
體態(tài)檢測,如何評估體態(tài)健康? – 維塑科技
體態(tài)評估儀
身體體態(tài)評估流程.docx

網(wǎng)址: 人體姿態(tài)估計技術(shù)的理解(Human Pose Estimination) http://m.u1s5d6.cn/newsview1773220.html

推薦資訊