簡易檢索 / 詳目顯示

研究生: 邱孟俞
Meng-Yu Chiu
論文名稱: 擷取重要字詞擴充情緒辭庫改善情緒分析之研究-以Dcard工作版為例
An Extended Sentiment Dictionary Approach with TF-IDF to Enhance Sentiment Analysis Taking the Dcard Job forum as an example
指導教授: 呂永和
Yungho Leu
口試委員: 楊維寧
Wei-Ning Yang
陳雲岫
Yun-Shiow Chen
學位類別: 碩士
Master
系所名稱: 管理學院 - 資訊管理系
Department of Information Management
論文出版年: 2017
畢業學年度: 105
語文別: 中文
論文頁數: 28
中文關鍵詞: 情緒分析情緒辭典TF-IDF文字探勘
外文關鍵詞: Sentiment Analysis, Sentiment Dictionary, TF-IDF, Text Mining
相關次數: 點閱:458下載:2
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報

在科技日新月異的進步下,社群平台已經成為許多人每天使用以及瀏覽的平台之一,而他們也會在社群平台上分享自己對於事物的看法並與人作意見的交流,雖然現今社會提倡言論自由,但是在暢所欲言的同時,卻往往忽略了網路文章帶來的影響力。當使用者在社群平台中閱覽文章的時候,他們會對自己喜歡的內容產生認同感,進而改變自己對於文中評論之事物的看法。本研究在幫助使用者初步判斷文章中帶有的情緒程度,讓使用者在閱覽文章之前,根據程式判斷結果斟酌認同程度。本研究中首先利用情緒辭典對Dcard工作版中的283篇熱門文章進行正負面詞彙分析,並利用TF-IDF方式取出已分類好文章中的關鍵字,並透過情緒分數的計算方式擴充至情緒字典中,最後再利用貝氏分類器為全新的文章進行分類。實驗結果發現,準確率(Accuracy)達70%,查全率(Recall rate)達88%,能夠正確地判斷一篇文章是屬於正面情緒或負面情緒。


With the advance of social networks, posting and reading articles on a website have become our daily routine. People can easily express their opinions with others through a social network. Although "freedom of speech" is guaranteed in a democratic country, one cannot neglect the effect of a web article. In this research, we proposed a method to perform sentimental analysis on web-based articles. Our research first used a well-known Chinese sentiment dictionary to classify 283 most popular articles; then, we used the TF-IDF scheme to select important keywords from these articles; subsequently, we expanded the Chinese sentiment dictionary with the keywords found by using the TF-IDF scheme. Based on the expanded Chinese sentiment dictionary, we used the Naive Bayes classifier to classify 30 new articles and calculated the accuracy of the classification. The experimental results showed that the accuracy is about 70 percent and the recall rate is about 88 percent.

摘要 I ABSTRACT II 誌謝 III 目錄 IV 圖目錄 VI 表目錄 VII 第一章 緒論 1 1.1 研究背景 1 1.2 研究動機與目的 1 1.3 論文架構 4 第二章 文獻探討 6 2.1 台灣社群平台使用狀況與現象 6 2.1.1 社群平台使用趨勢 6 2.1.2 社群中的從眾現象 7 2.2 斷字斷詞技術 7 2.3 情緒分析 8 2.3.1 情緒辭庫 8 2.4 量表信度測量 9 2.4.1 Kappa統計量 9 2.5 分類工具 9 2.5.1 貝氏分類器 9 第三章 研究方法 12 3.1 研究架構 12 3.2 研究對象與工具 13 3.2.1 研究對象 13 3.2.2 研究工具與環境 13 3.3 研究方法與流程 14 3.3.1 步驟1:抓取社群平台資料 14 3.3.2 步驟2:定義特徵值 15 3.3.3 步驟3:分類文章情緒 15 3.3.4 步驟4:斷字斷詞 17 3.3.4 步驟5:擴充情緒辭庫 18 3.3.5 步驟6:評估模型 20 第四章 研究結果與討論 22 4.1 情緒分數權重調整 22 4.2 評估結果 22 4.3 誤判情形探討 23 第五章 結論與建議 26 5.1 結論 26 5.2 未來發展 26 參考文獻 27

[1] 曾靉(2017)5年打造每月800萬不重複訪客,社群新星Dcard如何崛起?取自https://www.bnext.com.tw/article/44423/how-social-media-dcard-reaches-millions-users
[2] 何文君(2016)小三美日怒告Dcard!不滿遭匿名控販售「假貨」。取自http://news.tvbs.com.tw/life/684381
[3] 資策會FIND/經濟部技術處「資策會FIND(2016)/ 服務系統體系驅動新興事業研發計畫(2/4)」
[4] 從眾效應 - 維基百科,自由的百科全書. 取自https://zh.wikipedia.org/wiki/%E5%BE%9E%E7%9C%BE%E6%95%88%E6%87%89
[5] 創市際市場研究顧問公司雙週刊(第67期):7-8。
[6] 詹壬菡、方彩欣(2012)論網路虛擬社群中的從眾行為現象。設計研究學報,5,153-167。
[7] Hanson, W. A., & Putler, D. S. (1996). Hits and misses: Herd behavior and online product popularity, Marketing Letters, Vol 7, 297-305
[8] Asch, S. E. (1951). Effect of group pressure upon the modification and distortion of judgments. Journal of Marketing Research, 16, 394-400.
[9] 郭俊桔、張育蓉(2013)使用情緒分析於圖書館使用者滿意度評估之研究。圖書資訊學研究,7:2 (June 2013):153-197。
[10] Ku, L. W. & Chen, H. H. (2007). Mining Opinions from the Web: Beyond Relevance
Retrieval. Journal of American Society for Information Science and Technology,
58, 1838-1850.
[11] 吳蕙欣(2011)。結合多辭典與常識網路的情緒分析系統。台灣大學資訊工程學系碩士論文。
[12] [Machine Learning] Bayes貝氏分類演算法 取自 http://enginebai.logdown.com/posts/241677/bayes-classification
[13] 吳姮憓、羅偉峰(2014)「按讚、留言或分享」-探究影響臉書訊息反應行為意圖之前置因素。行銷評論,Vol.11,2,107-132
[14] 錢鉦津(2016)淺談監督式機器學習的測試評估方法-如何確保大數據分析的品質。叡揚e論壇,第82期,11-13。
[15] Landis, J. & Koch, G. G. (1977). The Measurement of Observer Agreement for
Categorical Data. Biometrics, 33, 159-174

無法下載圖示 全文公開日期 2022/08/16 (校內網路)
全文公開日期 本全文未授權公開 (校外網路)
全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)
QR CODE