研究生: 楊昌祐
chang-you Yang
論文名稱: 中文扭曲文件影像之還原與文字切割
Recovery and Character Segmentation of Chinese Warped Document Images
指導教授: 吳乾彌
Chen-Mie Wu
口試委員: 陳省隆
Hsing-Lung Chen
Yie-Tarng Chen
Hann-Trong Chen
Yi-Ru Lin
學位類別: 碩士
系所名稱: 電資學院 - 電子工程系
Department of Electronic and Computer Engineering
論文出版年: 2011
畢業學年度: 99
語文別: 中文
論文頁數: 63
中文關鍵詞: 影像處理文件影像扭曲文件影像文字切割
外文關鍵詞: skew correction, Connected component Labeling, ccl, Nearest neighbor Interpolation
This thesis is about recovery and character segmentation of Chinese warped document images. The research work includes four parts:
The first part is about software design of the binarization algorithm for digital document images.
The second part is about software design of recovery from warped document images. To restore the distorted or skewed Chinese document images this software includes the following algorithms such as text line and word detection, word baseline estimation, and skew correction.
The third part is about software design for segmenting the Chinese document images. The characters are segmented by using the connected component labeling algorithm. This would make character normalization and document image analysis easier. Finally, a coordinate file for individual characters will be generated.
The fourth part is about the evaluation of reliability and run-time performance of recovery and character segmentation of Chinese warped document images. Experiments over various kinds of Chinese warped document images have shown that recovery and character segmentation can be operated very well.
On the whole, this thesis has accomplished the related algorithms and software design of recovery and character segmentation of Chinese warped document images. After being verified by various kinds of document images, the algorithm developed in this thesis has shown very good performance in skew correction and can improve the recognition rate of the document image analysis system used later.

第一章 緒論 1 1.1 研究動機與背景 1 1.2 論文進度組織與概觀 2 第二章 中文扭曲文件影像之還原與文字切割發展環境與驗證流程 3 2.1 Linux-based發展環境介紹 3 2.1.1 Linux 3 2.1.2 CYGWIN 4 2.1.3 VMware 5 2.1.4 GCC Compiler 7 2.2 扭曲文件影像之還原與文字切割流程與介紹 8 2.2.1 文件影像資料儲存方式與資料格式 8 2.2.2 文件影像二值化演算法之原理與實現 9 2.2.3 扭曲文件影像還原之原理與介紹 13 2.2.4 文字切割之原理與介紹 13 第三章 中文扭曲文件影像還原之設計與實現 14 3.1 扭曲文件影像還原之原理簡介 14 3.2 測試影像之介紹 15 3.3 偵測本文行與字演算法之設計與實現 16 3.3.1 偵測本文行與字之執行流程 16 3.3.2 連接物件標記演算法之設計與實現 17 3.3.3 統計本文所有物件高與濾除雜訊之原理與介紹 22 3.3.4 偵測本文行演算法之設計與實現 23 3.4 偵測文字基線演算法 26 3.4.1 線性迴歸 26 3.4.2 演算法之原理 26 3.4.3 演算法之設計與實現 30 3.5 歪斜校正演算法 31 3.5.1 演算法之執行流程 31 3.5.2 Rotation-based歪斜校正演算法之設計與實現 32 3.5.3 Shear-based歪斜校正演算法之設計與實現 34 3.6 中文扭曲文件影像還原之實驗結果與分析 38 3.6.1 復原扭曲影像分析 38 3.6.2 還原傾斜影像分析 40 第四章 文件影像切割之設計與實現 42 4.1 文件影像切割之原理簡介 42 4.2 文字切割演算法 44 4.2.1 演算法之原理 44 4.2.2 演算法之設計與實現 46 4.3 字體正規化演算法 47 4.3.1 演算法之原理 47 4.3.2 演算法之設計與實現 48 4.4 文件影像切割演算法之結果與分析 50 第五章 中文扭曲文件影像之還原與文字切割測試與效能分析 52 5.1 測試環境簡介 52 5.2 扭曲文件影像還原與文字切割之實驗結果 53 5.3 扭曲文件影像還原與文字切割之執行效能分析 57 第六章 結論 59

