簡易檢索 / 詳目顯示

研究生: 洪健軒
Jian-syuan Hong
論文名稱: 含ASM圖之文件影像分析系統之設計與實現
Design and Implementation of an ASM-Chart-based Document Image Analysis System
指導教授: 吳乾彌
Chen-Mie Wu
口試委員: 陳省隆
Hsing-Lung Chen
陳郁堂
Yie-Tarng Chen
陳漢宗
Hann-Tzong Chern
學位類別: 碩士
Master
系所名稱: 電資學院 - 電子工程系
Department of Electronic and Computer Engineering
論文出版年: 2013
畢業學年度: 101
語文別: 中文
論文頁數: 116
中文關鍵詞: 影像處理文件影像分析形態學流程圖擷取
外文關鍵詞: document image analysis, morphology, flow chart extraction, image processing
相關次數: 點閱:242下載:1
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報

  本論文係有關含ASM圖之文件影像分析系統之設計與實現,相關的研究工作包含五大部分:
第一部分為數位影像二值化演算法之軟體設計。
第二部份為文件頁面排版之分析,利用連通物件標記與塗抹等演算法切割文本行並分類出ASM圖與文字區域。
第三部分首先擷取ASM圖中之文字,然後再利用浸蝕與膨脹等方法來擷取其中之箭頭;重新連結ASM圖中之斷線後,利用型態學重建與細線化等演算法來處理,以擷取其中各種符號。最後,擷取ASM圖中之線段,以建立各個符號間之連結性。
第四部分將文本行合併為文字段,並建立包括文字區域與ASM圖之文件邏輯結構。
第五部分設計工具程式來測試且驗證含ASM圖之文件影像分析系統之輸出資料結構,最後顯示各部分程式之執行效能。
整體而言,本論文係完成了一個含ASM圖之文件影像分析系統之軟體設計,藉由ASM圖元件擷取之技術,分析ASM圖之資訊,建立起包含ASM圖與文件之邏輯結構。此外,相關的技術也可以應用於含流程圖之文件分析。


This thesis is related to the design and implementation of an ASM-chart-based document image analysis system. The research work includes five parts:
The first part is about software design of the binarization algorithm for digital images.
The second part is related to the analysis of the document page layout. By using connected component labeling and smearing algorithms, the textlines are segmented and classified into the ASM chart and text regions.
The third part is to extract the text in the ASM chart first. Then the arrowheads are also extracted by using the erosion and dilation methods. After linking the broken lines the ASM chart is processed by morphological reconstruction and thinning algorithms to extract the various symbols. Finally the line segments in the ASM chart are extracted to build the connective relations among these symbols.
The fourth part is to merge the textlines into paragraphs and create a logical structure of the document which consists of both the text regions and ASM chart.
The fifth part is to design an utility program for testing and validating the output data structure of the ASM-chart-based document image analysis system. And, finally, the run-time performance of the sub-programs are also shown.
On the whole, this thesis has accomplished the software design of an ASM-chart-based document image analysis system. Through using the object extraction technology the ASM chart information is analyzed to build the logical structure of the document image. Besides, the related technologies can also be applied to the analysis of the flow-chart-based documents.

第一章 緒論 1 1.1 研究動機與背景 1 1.2 論文組織與概觀 2 第二章 含ASM圖之文件影像分析系統發展環境與流程 3 2.1 含ASM圖之文件影像分析系統發展環境 3 2.1.1 Linux 3 2.1.2 Cygwin 4 2.1.3 GCC Compiler 5 2.2 含ASM圖之文件影像分析系統架構 6 2.2.1 文件影像分析系統架構 6 2.2.2 含ASM圖之文件影像分析系統結構與介紹 7 第三章 含ASM圖之文件影像分析系統之設計與實現 9 3.1 系統輸入影像之介紹 9 3.1.1 影像儲存方式與資料格式 10 3.1.2 ASM圖介紹 11 3.2 影像之二值化 13 3.2.1 演算法之介紹 13 3.2.2 演算法之原理 13 3.2.3 演算法之實現 14 3.3 含ASM圖之文件頁面排版分析 15 3.3.1 含ASM圖之文件頁面排版分析之執行流程 15 3.3.2 第一次連通物件標記 16 3.3.2.1 演算法之介紹 16 3.3.2.2 演算法之原理 17 3.3.2.3 演算法之實現 18 3.3.2.4 實例分析 19 3.3.3 統計物件資訊與寬度、面積中位數計算 22 3.3.4 濾除雜訊 23 3.3.5 塗抹演算法 23 3.3.5.1 演算法之介紹 23 3.3.5.2 演算法之原理 24 3.3.5.3 演算法之實現 24 3.3.6 第二次連通物件標記 26 3.3.7 ASM圖/文字區域分類 27 3.4 ASM圖物件擷取 28 3.4.1 ASM圖物件擷取演算法之執行流程 28 3.4.2 文字物件擷取 29 3.4.3 計算線條平均厚度 31 3.4.4 箭頭物件擷取 32 3.4.4.1 箭頭物件擷取流程 32 3.4.4.2 形態學膨脹與侵蝕 34 3.4.4.3 箭頭區域浸蝕與膨脹 35 3.4.5 斷線修補 38 3.4.5.1 細線化演算法 39 3.4.5.2 終端點搜尋與連結 45 3.4.6 符號物件擷取 47 3.4.6.1 符號物件擷取流程 47 3.4.6.2 形態學重建演算法 48 3.4.6.3 刪除多餘線段與紀錄符號物件資訊 55 3.4.7 符號分類介紹 57 3.4.7.1 符號分類流程 57 3.4.7.2 路徑走訪與曲度餘弦值計算 58 3.4.7.3 符號特徵分析 60 3.4.8 線段物件擷取 62 3.4.8.1 線段切割流程 62 3.4.8.2 線段重新記數與起終點定位 64 3.4.8.3 線段重繪介紹 66 3.4.9 物件連結性建立 67 3.4.9.1 文字物件隸屬關係建立 68 3.4.9.2 符號物件與線段物件之關連性 70 3.4.9.3 ASM圖區塊切割 72 3.5 文字區域之文字段合併 73 3.6 含ASM圖之文件邏輯結構建立 74 第四章 含ASM圖之文件影像分析系統測試驗證與 效能分析 75 4.1 測試環境介紹 75 4.2 測試程式之結構介紹 76 4.3 含ASM圖之文件影像分析系統之實驗結果與分析 77 4.3.1 二值化之結果與分析 79 4.3.2 含ASM圖之文件頁面排版分析結果與分析 81 4.3.3 ASM圖物件擷取之結果與分析 82 4.3.4 文字段合併之結果與分析 90 4.3.5 含ASM圖之文件邏輯結構建立之結果與分析 93 4.4 含ASM圖之文件影像分析系統之效能分析 95 第五章 結論 97 參考文獻 98

[1] 李皇達,「中文文件影像分析系統之設計與實現」,碩士論文,國立臺灣科技大學,臺北 (2008)。
[2] 黃寅修,「邊界與邊角偵測演算處理器之軟/硬體整合設計與實現」,碩士論文,國立臺灣科技大學,臺北 (2008)。
[3] 楊昌祐,「中文扭曲文件影像之還原與文字切割」,碩士論文,國立臺灣科技大學,臺北 (2011)。
[4] 許博翔,「多像素管線式單回合連通物件標示演算法處理器之軟/硬整合設計與實現」,碩士論文,國立臺灣科技大學,臺北 (2012)。
[5] A. M. Namboodiri and A. K. Jain, “Document Structure and Layout Analysis”, Digital Document Processing Advances in Pattern Recognition, pp 29-48 (2007).
[6] B. G. Vasudevan, S. Dhanapanichkul, and R. Balakrishnan, ”Flowchart knowledge extraction on image processing”, International Symposium on Neural Networks - ISNN2, pp. 4075-408 (2008).
[7] F. Shafait, D. Keysers, and T. M. Breuel, “Performance comparison of six algorithms for page segmentation”, 7th IAPR Workshop on Document Analysis Systems (2006).
[8] F. L. Bourgeois and H. Kaileh, “Automatic Metadata Retrieval from Ancient Manuscripts”, Document Analysis Systems VI, Lecture Notes in Computer Science Volume 3163, pp 75-89 (2004).
[9] G. Nagy, “Twenty Years of Document Image Analysis in PAMI.” IEEE Trans. Pattern Analysis and Macine. Inteligence, Vol. 22, No 1, pp.38-62 (2000).
[10] H. Wang, S. Z. Li, and S. Ragupathi, ”Document segmentation and classification with top-down approach”. First International Conference on knowledge-Based Intelligent Electronic Systems, 21-23 May 1997, Adelaide, Ausnalia. Editor, L.C. Jain, IEEE, pages 243-247, (1997).
[11] J. Sauvola and M. Pietikainen, ”Adaptive document Image binarization”, Pattern Recognition 33 , pp. 225-236 (2000).
[12] J. Van Beusekom, “Document Layout Analysis”, Diploma Thesis, Technische Universit‥at Kaiserslautern (2006).
[13] K. Saeed, M. Tabedzki, M, Rybnik and M. Adamski, “K3M: A Universal Algorithm for Image Skeletonization and A Review of Thinning Techniques”, International Journal of Applied Mathematics and Computer Scienc, June 2010 e, pp. 317-335, (2010).
[14] K. Kise, A. Sato, and K. Matsumoto, “Document Image Segmentation as Selection of Voronoi Edges”, 1997 Workshop on Document Image Analysis (DIA'97) (1997).
[15] L. G. Shapiro and G. C. Stockman, Computer Vision, Prentice-Hall, Inc., Upper Saddle River, New Jersey, ISBN 0-13-030796-3 (2001).
[16] M. Ciletti, “Advanced Digital Design with the Verilog HDL” (2003).
[17] Q. Shen, S. Lil, and J. Kwok, “Page Segmentation using Mathematical Morphology”, Proceedings of 2005 International Symposium on Intelligent Signal Processing and Communication Systems (2005).
[18] R. Kasturi, L. O'Gorman, and V. Govindaraju, , Document image analysis: a primer, Sadhana(27), No. 1, pp. 3-22(2002).
[19] R. C. Gonzalez and R. E. Woods, Digital Image Processing, 3rd edition, Prentice Hall (2007).
[20] Robert M. Haralick, Linda G. Shapiro, Computer and Robot Vision, Vol. 1, Addison Wesley Publishing Company (1992).
[21] T. Y. Zhang and C. Y. Suen, “A Fast Parallel Algorithm for Thinning Digital Patterns”, Communications of the ACM, March 1984, pp. 236-239 (1984).
[22] X. Jiang, D. C. Chen, “Document layout analysis” (2005).

QR CODE