研究生: |
陳禹衡 Yu-Heng Chen |
---|---|
論文名稱: |
使用ROC曲線與基因演算法的資料分類 Classification based on the area under ROC curve using genetic algorithm |
指導教授: |
楊維寧
Wei-Ning Yang |
口試委員: |
呂永和
Yung-Ho Leu 陳雲岫 none |
學位類別: |
碩士 Master |
系所名稱: |
管理學院 - 資訊管理系 Department of Information Management |
論文出版年: | 2016 |
畢業學年度: | 104 |
語文別: | 中文 |
論文頁數: | 19 |
中文關鍵詞: | 二元式監督學習問題 |
外文關鍵詞: | Binary classification |
相關次數: | 點閱:321 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
使用屬性向量來做二元式監督學習問題是一個常用的方法,我們可以基於屬性向量和一些投影向量的內積來去解決問題。我們使用基因演算法去逼近最佳的投影向量,該投影向量會使得ROC曲線下的面積最大。實驗結果顯示準確度大幅的進步。
Binary classification based on a feature vector is a long-standing problem. Linear discriminant analysis proposed by Fisher finds a linear combination of features such that the ratio of the variation between class to the variation within class is maximized. Similar to the linear discriminant analysis, we propose a linear combination of features such that the area under the receiver operating characteristic curve is maximized. The optimal linear combination is approximated by the genetic algorithm. Empirical results demonstrate substancial improvement on the classification accuracy when compared with the exiting classification methods.
[1]林政隆(2008) Internet Traffic Classification based on Hybrid Naive Bayes HMMs Classifier. 台灣科技大學資訊工程系,碩士論文
[2]楊國樺(2007) 結合隱藏式馬可夫模型與簡單貝氏網路分類器應用於入侵偵測系統。台灣科技大學資訊工程系,碩士論文
[3]余桂霖(2012)因素分析:從探索性到驗證性的因素分析。臺北市:五南
[4]林真真(2009) 統計分析與應用手册:使用R軟體。臺北市:文魁資訊出版:松崗總代理
[5]吳淑妃(2012) 統計學與R軟體的應用。臺中市:滄海
[6]黃文璋。(2010.3) 機率應用不易。數學傳播 34卷1期18-19
[7]楊乃玉、鄭瓊茹(2012.6) 藉由貝氏屬性挑選法改善簡易貝氏分類器處理連續型態資料之效能。工程科技與教育學刊第九卷第二期197-203
[8]林柏安、王惠嘉(2012)混合式會議主題分類法。國立成功大學資訊管理研究所
[9] 李德治、童惠玲(2009)多變量分析:專題及論文常用的統計方法。臺北市:雙葉書廊