簡易檢索 / 詳目顯示

研究生: 蔡煒彤
Wei - tung Tsai
論文名稱: 簡單貝氏分類器結合主成分分析於網路入侵偵測植基於P值
Naive Bayes Classifiers using Principal Component Analysis for Intrusion Detection - Based on p-value
指導教授: 楊維寧
Wei-Ning Yang
口試委員: 呂永和
Yung-Ho Leu
陳雲岫
Yun-Shiow Chen
學位類別: 碩士
Master
系所名稱: 管理學院 - 資訊管理系
Department of Information Management
論文出版年: 2014
畢業學年度: 102
語文別: 中文
論文頁數: 36
中文關鍵詞: 簡單貝氏分類器主成分分析網路入侵偵測P值
外文關鍵詞: Naive Bayes, Principal Component Analysis, Intrusion Detection, p-value
相關次數: 點閱:348下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報

簡單貝氏分類器是以貝氏定理為理論基礎發展出的分類器,其直接假設所有屬性彼此之間條件獨立,對於處理多維度資料集,有著簡單且有效的特性,能避免在進行多維度計算時產生無法想像的災難,但是它是一個天真的假設,並非所有屬性皆為獨立,故此,本研究首先利用主成分分析將所有屬性轉換成彼此不相關的新屬性,其後便運用簡單貝氏分類進行資料分類。
透過訓練資料集推算出根據這些經過相對應轉換的新屬性之分布,計算得到測試資料中每一個經過轉置後之新屬性的P值,基於簡單貝氏獨立性的假設,將每一個從測試資料中算出來的P值去計算貝氏分類。
本研究所提出的混合算法透過計算準確率檢測NSL-KDD 99資料集的入侵偵測資訊。本實驗結果表示,主成分分析能提高簡單貝氏分類器的檢測準確率。


Naive Bayes classifier is a simple probabilistic classifier which applies Bayes' theorem based on strong (naive) independence assumptions between the features to avoid the curse of dimensionality. We first apply principal component analysis to obtain the uncorrelated transformed features and then apply Naive Bayes algorithm based on the transformed features.
The p-value associated with each transformed feature of the testing instance is evaluated based on the distribution of the corresponding transformed feature estimated from the training dataset. Based on Naive Bayes independence assumptions, the joint p-value for each testing instance is evaluated for Bayesian classification.
The proposed hybrid algorithm is evaluated through the accuracy for detecting anomaly-based intrusion on NSL-KDD dataset. The experimental results demonstrate that principal component analysis can (substantially) increase the detection accuracy of the Naive Bayes classifier.

中文摘要 I Abstract II 致謝 III 目錄 IV 圖目錄 VI 表目錄 VII 第一章 緒言 1 1.1研究背景與動機 1 1.2研究目的 1 第二章 文獻探討 3 2.1貝氏 3 2.1.1 貝氏定理(Bayes’Theorem) 3 2.1.2 簡單貝氏(Naive Bayes) 4 2.2 主成份分析Principal Component Analysis 5 2.2.1 PCA簡述 5 2.2.2 PCA原理性質 5 2.2.3 PCA的理論基礎 7 2.2.4 PCA計算方法 8 2.3 p-value 9 2.3.1 p-value的意義 9 2.3.2 p-value的應用 10 第三章 研究方法 11 3.1 使用的資料集 11 3.2 使用的工具 12 3.3 實驗研究 12 3.3.1 研究步驟 12 3.3.2 研究說明 13 第四章 實驗分析結果 15 4.1 資料集處理 15 4.2 實驗結果 15 第五章 結論 20 參考文獻 21 附錄一 22 附錄二 23

[1]林政隆(2008) Internet Traffic Classification based on Hybrid Naive Bayes HMMs Classifier. 台灣科技大學資訊工程系,碩士論文
[2]楊國樺(2007) 結合隱藏式馬可夫模型與簡單貝氏網路分類器應用於入侵偵測系統。台灣科技大學資訊工程系,碩士論文
[3]余桂霖(2012)因素分析:從探索性到驗證性的因素分析。臺北市:五南
[4]林真真(2009) 統計分析與應用手册:使用R軟體。臺北市:文魁資訊出版:松崗總代理
[5]吳淑妃(2012) 統計學與R軟體的應用。臺中市:滄海
[6]黃文璋。(2010.3) 機率應用不易。數學傳播 34卷1期18-19
[7]楊乃玉、鄭瓊茹(2012.6) 藉由貝氏屬性挑選法改善簡易貝氏分類器處理連續型態資料之效能。工程科技與教育學刊第九卷第二期197-203
[8]林柏安、王惠嘉(2012)混合式會議主題分類法。國立成功大學資訊管理研究所
[9] 李德治、童惠玲(2009)多變量分析:專題及論文常用的統計方法。臺北市:雙葉書廊

無法下載圖示 全文公開日期 2019/07/21 (校內網路)
全文公開日期 本全文未授權公開 (校外網路)
全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)
QR CODE