研究生: 蔡奕德
I-Te Tsai
論文名稱: 快速且穩定地從單圖像中學習生成模型
Fast Learning a Stabilized Generative Model from a Single Image
指導教授: 花凱龍
Kai-Lung Hua
口試委員: 陳駿丞
Jun-Cheng Chen
Yung-Yao Chen
Ching-Hu Lu
Chuan-kai Yang
學位類別: 碩士
系所名稱: 電資學院 - 資訊工程系
Department of Computer Science and Information Engineering
論文出版年: 2022
畢業學年度: 110
語文別: 英文
論文頁數: 40
中文關鍵詞: 無條件圖像生成圖像生成膨脹內捲
外文關鍵詞: Unconditional Image Generation, Image Generation, Dilated Involution
  • 在擁有大規模數據集的情況下,生成對抗網路在圖像合成任務中取得了良好的成效。然而我們無法保證在各種狀態下都能夠蒐集到足夠大量的數據,因此若能從單一圖像中學習一個生成模型便能大幅解決資料不足的問題。只用單一圖像訓練生成對抗網路是一個困難的問題,因為過度擬合與訓練發散的狀況經常發生。在本文中,我們提出了一種新的運算子"擴張內捲",它防止了信道冗餘的問題,並且能夠適應每個位置的局部信息。我們還提出了一種自我監督判別器,透過圖像重建函數,防止生成的圖像發散。與之前的方法相比,我們的方法以更少的參數和一半的訓練時間實現了最先進的性能。

    Generative Adversarial Networks (GANs) achieve good results through large-scale datasets. However, collecting such datasets is challenging. Therefore, enabling GAN models to learn from a few or single images without overfitting is essential. This paper proposes the dilated involution operator, which prevents channel redundancy/ learning redundant features while adapting to local information at each location. We also propose a self-supervised discriminator that doubles as a reconstruction function preventing the generated image from diverging too much. Our method achieves state-of-the-art performance with fewer parameters and half the training time.

    Abstract in Chinese . . . . . . . . . . . . . . . . . . . . . . . . . . i Abstract in English . . . . . . . . . . . . . . . . . . . . . . . . . . ii Acknowledgements . . . . . . . . . . . . . . . . . . . . . . . . . . iii Contents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv List of Figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi List of Tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii 1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 Related Work . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.1 Single Image Generative Models . . . . . . . . . . 4 2.2 Few-Shot Generative Models . . . . . . . . . . . 5 3 Proposed Method . . . . . . . . . . . . . . . . . . . . . . . . . 6 3.1 Multi-scale training . . . . . . . . . . . . . . . . . 6 3.2 Dilated involution . . . . . . . . . . . . . . . . . 9 3.3 Self-supervised discriminator . . . . . . . . . . . 12 4 Experiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 4.1 Quantitative Evaluation . . . . . . . . . . . . . . 15 4.2 Ablation Study . . . . . . . . . . . . . . . . . . . 22 5 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Letter of Authority . . . . . . . . . . . . . . . . . . . . . . . . . . 31

