研究生: |
蔡煒彤 Wei - tung Tsai |
---|---|
論文名稱: |
簡單貝氏分類器結合主成分分析於網路入侵偵測植基於P值 Naive Bayes Classifiers using Principal Component Analysis for Intrusion Detection - Based on p-value |
指導教授: |
楊維寧
Wei-Ning Yang |
口試委員: |
呂永和
Yung-Ho Leu 陳雲岫 Yun-Shiow Chen |
學位類別: |
碩士 Master |
系所名稱: |
管理學院 - 資訊管理系 Department of Information Management |
論文出版年: | 2014 |
畢業學年度: | 102 |
語文別: | 中文 |
論文頁數: | 36 |
中文關鍵詞: | 簡單貝氏分類器 、主成分分析 、網路入侵偵測 、P值 |
外文關鍵詞: | Naive Bayes, Principal Component Analysis, Intrusion Detection, p-value |
相關次數: | 點閱:348 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
簡單貝氏分類器是以貝氏定理為理論基礎發展出的分類器,其直接假設所有屬性彼此之間條件獨立,對於處理多維度資料集,有著簡單且有效的特性,能避免在進行多維度計算時產生無法想像的災難,但是它是一個天真的假設,並非所有屬性皆為獨立,故此,本研究首先利用主成分分析將所有屬性轉換成彼此不相關的新屬性,其後便運用簡單貝氏分類進行資料分類。
透過訓練資料集推算出根據這些經過相對應轉換的新屬性之分布,計算得到測試資料中每一個經過轉置後之新屬性的P值,基於簡單貝氏獨立性的假設,將每一個從測試資料中算出來的P值去計算貝氏分類。
本研究所提出的混合算法透過計算準確率檢測NSL-KDD 99資料集的入侵偵測資訊。本實驗結果表示,主成分分析能提高簡單貝氏分類器的檢測準確率。
Naive Bayes classifier is a simple probabilistic classifier which applies Bayes' theorem based on strong (naive) independence assumptions between the features to avoid the curse of dimensionality. We first apply principal component analysis to obtain the uncorrelated transformed features and then apply Naive Bayes algorithm based on the transformed features.
The p-value associated with each transformed feature of the testing instance is evaluated based on the distribution of the corresponding transformed feature estimated from the training dataset. Based on Naive Bayes independence assumptions, the joint p-value for each testing instance is evaluated for Bayesian classification.
The proposed hybrid algorithm is evaluated through the accuracy for detecting anomaly-based intrusion on NSL-KDD dataset. The experimental results demonstrate that principal component analysis can (substantially) increase the detection accuracy of the Naive Bayes classifier.
[1]林政隆(2008) Internet Traffic Classification based on Hybrid Naive Bayes HMMs Classifier. 台灣科技大學資訊工程系,碩士論文
[2]楊國樺(2007) 結合隱藏式馬可夫模型與簡單貝氏網路分類器應用於入侵偵測系統。台灣科技大學資訊工程系,碩士論文
[3]余桂霖(2012)因素分析:從探索性到驗證性的因素分析。臺北市:五南
[4]林真真(2009) 統計分析與應用手册:使用R軟體。臺北市:文魁資訊出版:松崗總代理
[5]吳淑妃(2012) 統計學與R軟體的應用。臺中市:滄海
[6]黃文璋。(2010.3) 機率應用不易。數學傳播 34卷1期18-19
[7]楊乃玉、鄭瓊茹(2012.6) 藉由貝氏屬性挑選法改善簡易貝氏分類器處理連續型態資料之效能。工程科技與教育學刊第九卷第二期197-203
[8]林柏安、王惠嘉(2012)混合式會議主題分類法。國立成功大學資訊管理研究所
[9] 李德治、童惠玲(2009)多變量分析:專題及論文常用的統計方法。臺北市:雙葉書廊