研究生: 戴廷宇
Ting-Yu Tai
論文名稱: 以殘差圖卷積網路進行三維人臉重建
Residual Graph Convolutional Networks for 3D Face Reconstruction
指導教授: 徐繼聖
Gee-Sern Hsu
口試委員: 鍾聖倫
Sheng-Luen Chung
Chia-Wen Lin
Shang-Hong Lai
Huei-Yung Lin
學位類別: 碩士
系所名稱: 工程學院 - 機械工程系
Department of Mechanical Engineering
論文出版年: 2021
畢業學年度: 109
語文別: 中文
論文頁數: 69
中文關鍵詞: 三維人臉重建圖卷積網路
外文關鍵詞: 3D Face Reconstruction, Graph Convolutional Networks
三維人臉重建任務是透過單個或多個二維圖像進行對人臉幾何的重建。近期有許多方法結合三維人臉形變模型與深度卷積神經網路,透過使用深度卷積神經網路進行預測對應二維圖像的三維人臉形變模型參數,該種方法有助於在不受約束的環境下重建出良好的三維人臉模型。然而,由於三維人臉掃描數據集有限,對於使用單一圖像進行重建三維人臉模型以及紋理仍然有挑戰性。為了解決上述的問題,我們提出一個新穎的框架,考慮非線性三維幾何形狀以及表面平滑度,我們設計三維人臉形變模型模組 (Linear Parametric Module, LPM) 和三維人臉模型生成模組 (3D Face Generation Module, 3D-FGM) 進行結合,來達成三維人臉重建任務。LPM取自預訓練模型,可以根據二維圖像對應之3DMM參數生成三維人臉模型。3D-FGM結合人臉編碼器以及圖卷積網路 (GCN),生成另一個高品質三維人臉模型。以LPM生成之三維人臉模型作為目標,進行優化3D-FGM效能以生成品質更高的三維人臉模型。由於3D-FGM架構屬於非線性模型,可以更有效的生成對應的三維人臉模型。因此基於3D-FGM生成之三維人臉模型品質相較於LPM表現更為優異。本方法在AFLW2000-3D、MICC Florence 3D Faces資料庫中展現優異的競爭力。

3D face reconstruction aims to recover the 3D geometry of a face from single or multiple 2D images. Many recent approaches combine the 3D Morphable Model (3DMM) and the Deep Convolutional Neural Network (DCNN) to tackle 3D face reconstruction. However, the accuracy of the 3D reconstructed facial shape from a monocular image still has a large room for improvement. We propose a framework to couple a Linear Parametric Model (LPM) and a 3D Face Generation Module (3D-FGM) with an objective that considers the nonlinear 3D facial geometry and surface smoothness for 3D face reconstruction. The LPM, taken from an off-the-shelf pretrained model, can generate the 3D shape and texture in terms of 3DMM coefficients for a 2D face. The 3D-FGM combines a face encoder and a Graph Convolutional Network (GCN) to generate another 3D shape for the 2D face. Taking the LPM-generated 3D shape as a reference, the 3D-FGM-based 3D shape will be iteratively improved by updating the GCN parameters during training. As the 3D-FGM is by nature a nonlinear model that can better capture the nonlinearity of a face shape, the 3D-FGM -based 3D shape will be trained to outperform the LPM-generated 3D shape in reconstructing the 3D shape of the target face. Experiments on the AFLW2000-3D and MICC Florence 3D Faces datasets show that the proposed approach delivers a better performance than state-of-the-art methods.

摘要 Abstract 誌謝 目錄 圖目錄 表目錄 第1章 介紹 1.1 研究背景和動機 1.2 方法概述 1.3 論文貢獻 1.4 論文架構 第2章 文獻回顧 2.1 3DMM 2.2 VRN 2.3 3DDFA 2.4 Nonlinear-3DMM 2.5 PRNet 2.6 Deep3DFace 第3章 主要方法 3.1 整體網路架構 3.2 線性三維人臉形變模型模組設計 3.3 三維人臉生成模組 (3D-FGM) 第4章 實驗設置與分析 4.1 資料庫介紹 4.1.1 Large-scale CelebFaces Attributes Database 4.1.2 300W-LP Database 4.1.3 MICC Florence 3D Faces Database 4.1.4 AFLW2000-3D Database 4.2 實驗設置 4.2.1 資料劃分、設置 4.2.2 效能評估指標 4.2.3 實驗設計 4.3 實驗結果與分析 4.3.1 三維人臉生成模組之損失函數設置比較 4.3.2 三維人臉生成模組之三維人臉生成模組設置比較 4.3.3 三維人臉生成模組對生成三維人臉模型之影響 4.4 與相關文獻之比較 第5章 結論與未來研究方向 第6章 參考文獻

