簡易檢索 / 詳目顯示

研究生: 蔡叡渝
Jui-yu Tsai
論文名稱: 以使用者喜好為基礎之個人化網路搜尋
Personalized Web Search based on User’s Preference
指導教授: 徐俊傑
Chiun-chieh Hsu
口試委員: 李保志
none
洪政煌
none
學位類別: 碩士
Master
系所名稱: 管理學院 - 資訊管理系
Department of Information Management
論文出版年: 2006
畢業學年度: 94
語文別: 中文
論文頁數: 60
中文關鍵詞: 個人化網路搜尋搜尋引擎使用者個人檔個人化排序
外文關鍵詞: Search Engine, User Profile, Personalized ranking, Personalized web search
相關次數: 點閱:268下載:6
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 網路搜尋引擎可以幫助使用者在全球資訊網中(WWW)找到其所需的資訊,然而它們通常是設計來為所有使用者提供服務,並未考慮到個別使用者喜好,在多數情況下搜尋引擎回傳的結果中會滲雜著使用者不感興趣的資料,使用者必須花費額外時間做過濾資訊的動作。相反地,個人化網頁搜尋則是依據使用者喜好來提供客製化的搜尋結果,幫助使用者在資訊尋求的過程中節省許多的時間。
    在本論文中,我們提出之個人化網路搜尋的方法是將搜尋引擎回傳的結果依據使用者個別的喜好重新排序,幫助使用者在面對網路上大量資料加速其搜尋的速度。我們的方法是從使用者感興趣的網頁中萃取出使用者喜好的資訊,不需使用者的介入。當使用者提交查詢詞時,從搜尋引擎擷取搜尋結果,利用主題詞彙群組將搜尋結果分成多個具有不同主題的群組。然後利用使用者個人檔,評估使用者對於每個群組的喜好度,依據群組喜好度將網頁重新排序。實驗結果顯示我們的個人化網路搜尋方法可以有效提升搜尋的精確率。


    Web search engines help users find useful information on the World Wide Web (WWW). However, they are usually designed to serve all users, without considering the preference of individual users. The results returned from search engines are peppered with many impertinent data under most situations, and therefore users must pay a lot of effort to filter information. On the contrary, personalized web search provides customized results depending on each user’s preference, which can save a lot of time for users.
    In the thesis, we propose a method for personalizing web search by reranking search engine results based on the preferences of each individual user, which can greatly aid the search when facing massive amounts of data on the internet. Our method first extracts information of users’ preferences from their interested web pages without any involvement of users. When a query is submitted, we retrieve results from a search engine and cluster them into several topics using topic keyword clusters. Then rerank web pages by topic preference which is evaluated from user profile. Experimental results reveal that our personalized web search method can effectively enhance the precision rate of the retrieved results.

    中文摘要 英文摘要 誌謝 目錄 圖索引 表索引 第一章 緒論 1.1 研究動機 1.2 研究目的及方法 1.3 論文架構 第二章 相關研究 2.1 個人化搜尋服務種類 2.2 使用者喜好資訊取得 2.2.1 明確式 2.2.2 隱含式 2.3 個人化搜尋相關文獻 2.3.1 連結分析 2.3.2 使用分析 2.3.3 內容分析 2.4 網頁搜尋排序評估方法 第三章 個人化搜尋網頁排序系統 3.1 系統架構 3.2 網頁類型分析 3.3 網頁資料區塊擷取 3.3.1 網頁區塊化 3.3.2 資料區塊擷取 3.3.3 詞彙權重計算 3.4 使用者個人檔的建構與更新 3.4.1 使用者個人檔架構 3.4.2 使用者個人檔建構及更新 3.5 文件主題分群 3.5.1 文件前處理 3.5.2 主題詞彙分群 3.5.3 文件分群 3.6 個人化網頁排序 3.6.1 主題喜好排名 3.6.2 個人化網頁排序 3.6.3 即時喜好調適 第四章 實驗結果與分析 4.1 網頁類型辨識門檻值 4.2 網頁資料區域擷取之效果 4.3 主題品質度分析 4.4 系統效果分析 4.4.1 實驗設計 4.4.2 使用者介面 4.4.3 主題分群對個人化排序的影響 4.4.4 即時喜好調適效果分析 參考文獻

    [1] Nielsen NetRatings, http://www.nielsen-netratings.com/ , 2006.
    [2] A. Gulli, A. Signorini, “The indexable web is more than 11.5 billion pages”, Special interest tracks and posters of the 14th international conference on World Wide Web, pp.902-903, 2005.
    [3] J. Teevan, S. T. Dumais, and E. Horvitz, “Personalizing Search via Automated Analysis of Interests and Activities”, Proceedings of 28th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 449-456, 2005.
    [4] L. Page, S. Brin, R. Motwani, and T. Winograd, “The PageRank citation ranking: Bringing order to the web”, Stanford Digital Libraries Working Paper,1998.
    [5] H. Kim, P. K. Chan, “Personalized Ranking of Search Results with Learned User Interest Hierarchies from Bookmarks”, Proceedings of WebKDD: KDD Workshop on Web Mining and Web Usage Analysis, 2005
    [6] K. D. Fenstermacher, M. Ginsburg, “Mining Client-Side Activity for Personalization”, Processding of the 4th IEEE International Workshop on Advanced Issues of E-Commerce and Web-Based Information Systems, pp. 205, 2002
    [7] 林志隆,”使用者記錄探勘及其在檢索詞URL與搜尋引擎推薦之應用”,國立台灣大學資訊工程研究所未出版碩士論文,2003
    [8] 魏雲飛,”使用查詢記錄發掘主題之研究”,國立台灣科技大學資訊管理研究所未出版碩士論文,2005
    [9] 丁一賢,”運用網頁探勘為基礎的個人化技術於網路廣告之探討”,國立彰化師範大學資訊管理研究所未出版碩士論文,2002
    [10] J. T. Sun, H. J. Zeng, H. Liu, Y. Lu, and Z. Chen, “CubeSVD: a novel approach to personalized Web search”, Proceedings of the 14th international conference on World Wide Web, pp. 382-390, 2005
    [11] H. Cui, J. R. Wen, J. Y. Nie, and W. Y. Ma, “Query Expansion by Mining User Logs”, IEEE Transaction on Knowledge and Data Engineering, Vol. 15, No. 4, pp. 829-839, 2003.
    [12] J. Kleinberg, “Authoritative Sources in a Hyperlinked Environment”, Journal of the ACM, Vol. 46, No. 5, pp. 604-632, 1999.
    [13] T. H. Haveliwala, “Topic-sensitive pagerank: A Context-Sensitive Ranking Algorithm for Web Search”, IEEE transactions on knowledge and data engineering, vol. 15, no. 4, 2003.
    [14] B. Mobasher, H. Dai, M. Tao, “Discovery and evaluation of aggregate usage profile for web personalization”, Data Mining and Knowledge Discovery, pp. 61-82, 2002
    [15] M. Aktas, M. Nacar, and F. Menczer, “Personalizing PageRank Based on Domain Profiles”, Proceedings of the 6th WEBKDD Workshop, 2004
    [16] A. Goker, D. He, “Personalization via Collaboration in Web Retrieval Systems: A Context based Approach”, Proceedings of the American Society for Information Science and Technology, vol 40, issue 1, pp. 367-365, 2005
    [17] A. Pretschner, S. Gauch, “Ontology based personalized search”, Proceeding of 11th IEEE International Conference on Tools with Artifical Intelligence, pp. 391-398, 1998
    [18] J. Pitkow, H. Schutze, T. Cass, R. Cooley,D. Turnbull, A. Edmonds, E. Adar, and T. Breuel.”Personalized search”,Communications of the ACM, pp.50–55, 2002.
    [19] K. Sugiyama, K. Hatano, and M. Yoshikawa, “Adaptive Web Search Based on User Profile Constructed without Any Effort from Users”, Proceedings of the 13th international conference on World Wide Web, pp. 675-684, 2004
    [20] S. Chakrabarti, Mining the Web: Discovering Knowledge from Hypertext Data, Morgan-Kaufmann, 2002
    [21] C. Buckley, E. M. Voorhees, “Evaluating evaluation measure stability”, Proceedings of the 23rd annual international ACM SIGIR conference on Research and development in information retrieval, pp. 33-40, 2000
    [22] K. Jarvelin, J. Kekalainen,“IR evaluation methods for retrieving highly relevant documents”, Proceedings of the 23rd annual international ACM SIGIR conference on Research and development in information retrieval, pp. 41-48, 2000
    [23] M. Porter, "The Porter Stemming Algorithm", http://www.tartarus.org/~martin/PorterStemmer/
    [24] L.A. Zadeh, “Fuzzy sets and Systems”, Information and Control, vol. 8, pp. 338-353, 1965
    [25] P. B. Harrington, “Sigmoid transfer functions in backpropagation neural networks”, American Chemical Society, vol. 65, pp. 2167-2168, 1993
    [26] 張錫正,”使用主題詞彙群組進行文件分群之研究”,國立台灣科技大學資訊管理研究所未出版博士論文,2005

    無法下載圖示 全文公開日期 2011/06/16 (校內網路)
    全文公開日期 本全文未授權公開 (校外網路)
    全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)
    QR CODE