We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
SMPL-X での人体メッシュ生成 SMPL-X は、統計的手法に基づくパラメディック制御可能な人体メッシュ生成モデルである SMPL を拡張したモデルである。 SMPL-X では{顔の表情・より細かな手足のジョイント}も3D再構成可能になっており、 SMPL より広範囲の表現力をもつパラメディック人体メッシュ生成モデルになっている。
SMPL-X は、SMPL での{人体体型パラメーターβ・人体姿勢パラメータθ}に{顔表情パラメータψ}を加えたモデルになっており、以下の式でモデル化される。
本手法では、この SMPL-X を用いて、{人体体型パラメーターβ・人体姿勢パラメータθ・顔表情パラメータψ}から人体メッシュの生成を行う。 回転表現として D=6 を採用するので、全てのパラメータの次元は、Θ={β,θ,ψ}∈R^338 となり、次元数が非常に多くなる。
本手法(Expose)のアーキテクチャ
本手法では、人物画像から encoder を通じて SMPL-X パラメータを直接推定することで、高速な動作を実現する。 但し、上図赤枠のように、単純に enocoder で SMPL-X パラメータを直接推定する方法では、手や顔部分のメッシュの詳細がぼやけてしまう。そのため、上図青枠のような処理を行う。
これらの処理は、具体的には以下のような処理になる。
上図赤枠
上図青枠
レンダリング画像の手と顔部分に対する BBOX を推定する
spatial transformers (ST) を用いて、この BBOX と元の入力画像から高解像度の手と顔画像を抽出する
抽出した手画像と顔画像を、それぞれの encoder f, h に入力し、{SMPL-X パラメータ・透視変換用カメラのスケール値・オフセット値}の値を精密化するためのオフセット値を出力する。この際に encoder g からのパラメータを enocder に入力している。 このオフセット加算処理は、以下のような式で行われる。
更に、 encoder f, h では、カメラのパラメータ {s_t,t_h}, {s_ht_h} も出力するようにする。 この手と顔の encoder f,h は、学習時のみ後述の顔と手のデータセットでも学習が行われる。
学習用データセットの作成 上図は、本手法での学習用データセットの一部を図示した図である。 この学習用データセットは、以下のような手順で作成している。
推論処理高速化の定量比較検証 本手法では、SMPLify-X に比べて、1枚の人物画像での推論時の処理が約 200 倍高速化している。
生成メッシュの定性検証 本手法では、手や顔部分の詳細に関しても3D再構成出来ている
The text was updated successfully, but these errors were encountered:
No branches or pull requests
0. 論文情報・リンク
1. どんなもの?
2. 先行研究と比べてどこがすごいの?
本手法では、人物画像から encoder を通じて SMPL-X パラメータを直接推定することで、高速な動作を実現している。
3. 技術や手法の"キモ"はどこにある?
SMPL-X での人体メッシュ生成
SMPL-X は、統計的手法に基づくパラメディック制御可能な人体メッシュ生成モデルである SMPL を拡張したモデルである。
SMPL-X では{顔の表情・より細かな手足のジョイント}も3D再構成可能になっており、 SMPL より広範囲の表現力をもつパラメディック人体メッシュ生成モデルになっている。
SMPL-X は、SMPL での{人体体型パラメーターβ・人体姿勢パラメータθ}に{顔表情パラメータψ}を加えたモデルになっており、以下の式でモデル化される。

本手法では、この SMPL-X を用いて、{人体体型パラメーターβ・人体姿勢パラメータθ・顔表情パラメータψ}から人体メッシュの生成を行う。
回転表現として D=6 を採用するので、全てのパラメータの次元は、Θ={β,θ,ψ}∈R^338 となり、次元数が非常に多くなる。
本手法(Expose)のアーキテクチャ

本手法では、人物画像から encoder を通じて SMPL-X パラメータを直接推定することで、高速な動作を実現する。
但し、上図赤枠のように、単純に enocoder で SMPL-X パラメータを直接推定する方法では、手や顔部分のメッシュの詳細がぼやけてしまう。そのため、上図青枠のような処理を行う。
これらの処理は、具体的には以下のような処理になる。
上図赤枠
※ このときの encoder としては、論文「End-to-end recovery of human shape and pose」と同様の encoder を用いる。
生成した人体メッシュを直交射影で2D画像にレンダリングする。
上図青枠
レンダリング画像の手と顔部分に対する BBOX を推定する
spatial transformers (ST) を用いて、この BBOX と元の入力画像から高解像度の手と顔画像を抽出する

抽出した手画像と顔画像を、それぞれの encoder f, h に入力し、{SMPL-X パラメータ・透視変換用カメラのスケール値・オフセット値}の値を精密化するためのオフセット値を出力する。この際に encoder g からのパラメータを enocder に入力している。

このオフセット加算処理は、以下のような式で行われる。
更に、 encoder f, h では、カメラのパラメータ {s_t,t_h}, {s_ht_h} も出力するようにする。
この手と顔の encoder f,h は、学習時のみ後述の顔と手のデータセットでも学習が行われる。
本手法での encoder ネットワークは、以下のように、{身体・顔・手}それぞれに関する{3Dジョイント間での loss・2Dレンダリング画像間での loss・SMPL-X パラメータ間での loss}から構成される損失関数で end2end に学習される
学習用データセットの作成

上図は、本手法での学習用データセットの一部を図示した図である。
この学習用データセットは、以下のような手順で作成している。
→ SMPL パラメータから SMPL-X パラメータへの変換処理のことを言っている?
※ この顔と手の追加データセットは、学習時のみ、それぞれの encoder f,h の追加学習用に利用される。
4. どうやって有効だと検証した?
推論処理高速化の定量比較検証

本手法では、SMPLify-X に比べて、1枚の人物画像での推論時の処理が約 200 倍高速化している。
生成メッシュの定性検証


本手法では、手や顔部分の詳細に関しても3D再構成出来ている
5. 議論はあるか?
6. 次に読むべき論文はあるか?
7. 参考文献
The text was updated successfully, but these errors were encountered: