研究生: 邱靖惠
Ching-Hui Chiou
論文名稱: 整合文字探勘和本體論 於碳化矽晶圓化學機械拋光製程 專利分析研究
Integration with Text-Mining and Ontology-Based Patent Analysis on Chemical Mechanical Polishing of Silicon Carbide Wafers
指導教授: 陳炤彰
Chao-Chang Chen
口試委員: 管中徽
Chung-Huei Kuan
Zone-Ching Lin
Jui-Fen Chang
Sam Lin
學位類別: 碩士
系所名稱: 工程學院 - 機械工程系
Department of Mechanical Engineering
論文出版年: 2018
畢業學年度: 106
語文別: 中文
論文頁數: 163
中文關鍵詞: 技術功效矩陣碳化矽晶圓化學機械拋光本體論皮爾森相關係數
外文關鍵詞: Technique-function matrix, Silicon carbide wafer, Chemical mechanical polishing, Ontology, Pearson’s correlation coefficient
隨著電子電力系統需求的規格逐年提升,碳化矽(Silicon Carbide, SiC)被視為未來高功率元件的理想材料,但因SiC本身的高硬度及高抗化學性,使其在化學機械拋光(Chemical Mechanical Polishing, CMP)製程中面臨加工時間冗長、成本過高的技術問題,在製程研發上仍需注入龐大的研究資源以克服,而專利更是研發時的重要參考資料,但透過人力進行專利分析不僅耗時且費力,因此本研究旨在運用資訊科技以提升專利分析效率。本研究以Orbit檢索資料蒐集1986~2017年間,共837件英文的全球碳化矽晶圓之化學機械拋光專利家族資料,以R語言進行資料分析,分析方法以CMP本體論為基,進行專利分類、技術概念、功效分析。專利分類方面,利用本體論詞彙篩選出本體詞組,再另以皮爾森相關係數(Pearson’s correlation coefficient)擷取CMP本體論相關之文本詞組,根據技術類別進行專利分類。在技術概念與功效分析方面,並搭配了特定的選詞規則,篩選TF-IDF詞頻最高的詞組為結果。最後再自動建構出分類Road map圖及技術/功效矩陣圖呈現分析結果。於精確率評估結果顯示,專利分類為93.93%,技術概念為91.85%,功效分析為84.25%。

With urgent demand on electronic power system of high power performance, mono-crystalline Silicon carbide wafers have been considered as a high potential materials for high power IC devices. However, the ultra high hardness and excellent chemical stability of SiC wafers induce a very long processing time duration and high cost in chemical mechanical polishing (CMP) process. Many researches have indicated some potential improvement of CMP process of SiC wafers, a roadmap of future development is definitely needed to achieve above challenges. Patent deployment plays an important role in research resource, but it is inefficiently if all operations depend on manual work. This study aims to use text mining and ontology-based technology to enhance the efficiency of patent analysis. This study has been searched through Orbit patent database and collect 837 global patent families of SiC wafer chemical mechanical polishing (SiC CMP) from 1986 to 2017 and also analyzed by R language programming. Pre-constructed ontology method is used for patent classification, technical concept and function analysis. In patent classification, ontology phrase is an index that used to classify various technical patents and also applying the Pearson's correlation coefficient to extract the CMP related ontology phrases. In technical concept and function analysis, phrases with highest TF-IDF frequency are selected as results which based on specific rule of key phrases selecting. Results of this study can develop and obtain the classified road map and technique-function matrix. Results of evaluation rate of patent classification precision is 93.93%, concept precision is 91.85% and function precision is 84.25%. Future study can focus on developing a smart patent analysis system.

摘要 I Abstract II 致謝 III 目錄 V 圖目錄 X 表目錄 XVI 第1章 緒論 1 1.1 研究背景與目的 1 1.2 研究方法 3 1.3 論文架構 3 第2章 文獻回顧 6 2.1 碳化矽材料介紹 6 2.2 碳化矽基板化學機械拋光技術 8 2.2.1 碳化矽拋光製程之拋光液相關文獻 8 2.2.2 碳化矽拋光製程拋光墊之相關文獻 14 2.2.3 碳化矽拋光製程之相關文獻 16 2.3 應用文字探勘於專利分析之相關研究 22 2.4 關鍵詞彙提取方法 27 2.4.1 TF-IDF詞彙統計方法 27 2.4.2 TF-IDF輔以本體論之專利分析研究 28 2.5 文獻回顧總結 29 第3章 分析方法介紹 35 3.1 分析系統流程 35 3.2 SiC CMP專利檢索 36 3.2.1 Orbit專利檢索資料庫 36 3.2.2 專利檢索詞彙定義 37 3.2.3 檢索指令及專利蒐集結果 39 3.3 CMP本體論建立 40 3.3.1 CMP 本體論建構 40 3.3.2 本體論資料格式 43 3.4 專利資料前處理 44 3.4.1 專利範圍第一項提取 44 3.4.2 文字預處理 46 3.4.3 詞性標記、篩選詞組 47 3.4.4 TF-IDF詞頻統計 49 3.5 第一階技術分類分析 51 3.5.1 建立CMP本體論詞庫(Ontology Dictionary) 52 3.5.2 篩選本體詞組 54 3.5.3 本體關聯詞組分析 54 3.5.4 分類權重計算 58 3.5.5 專利家族分類判斷 60 3.6 各專利家族之技術概念/功效分析 61 3.6.1 專利家族技術概念分析 61 3.6.2 第三階及第二階技術分類 62 3.6.3 專利家族功效分析 63 3.6.4 CMP複合功效分析 65 3.7 專利地圖輸出 67 3.7.1 技術Road map 輸出 67 3.7.2 技術/功效矩陣圖輸出 68 第4章 專利分析結果 69 4.1 專利資料預處理 69 4.1.1 專利資料於Excel之前置處理 69 4.1.2 系統讀取專利資料及文字預處理 70 4.1.3 建立文件-詞組矩陣及給予位置權重 71 4.1.4 詞性標註及詞組篩選 72 4.2 第一階技術分類分析 73 4.2.1 篩選本體詞組 73 4.2.2 本體關聯詞組分析 74 4.2.3 統計各分類之權重及判斷專利分類 76 4.3 專利家族技術概念/功效分析 79 4.3.1 技術概念/功效分析 79 4.3.2 第二階及第三階技術分類結果 82 4.3.3 CMP複合功效分析結果 82 4.4 分析結果及專利地圖輸出 84 4.4.1 Road map圖輸出 85 4.4.2 技術/功效矩陣圖輸出 87 4.5 碳化矽基板拋光與硬脆材料拋光之專利分析 88 4.5.1 硬脆材料拋光專利分析結果 90 第5章 系統建置及評估 95 5.1 系統建置 95 5.1.1 資料上傳及預處理 95 5.1.2 技術分類 99 5.1.3 主要概念/功效及複合功效分析 101 5.1.4 專利地圖 103 5.2 系統評估 105 5.2.1 系統評估標準 105 5.2.2 評估文件取樣 105 5.2.3 技術分類、概念分析及功效分析之評估結果 106 5.2.4 分析錯誤之原因探討 108 5.2.5 相關研究之分析效能比較 109 第6章 結論與建議 111 6.1 結論 111 6.2 未來研究建議 112 參考文獻 114 附錄A CMP本體論(Slurry類別) 117 附錄B CMP本體論(Dresser及Pad類別) 118 附錄C CMP本體論(Apparatus類別) 119 附錄D 參考之CMP本體論 [31] 120 附錄E 抽樣評估Slurry 類別之專利 121 附錄F 抽樣評估Dresser類別之專利 133 附錄G 抽樣評估Pad類別之專利 135 附錄H 抽樣評估Apparatus類別之專利 137 作者簡介 142

