研究生: |
邱孟俞 Meng-Yu Chiu |
---|---|
論文名稱: |
擷取重要字詞擴充情緒辭庫改善情緒分析之研究-以Dcard工作版為例 An Extended Sentiment Dictionary Approach with TF-IDF to Enhance Sentiment Analysis Taking the Dcard Job forum as an example |
指導教授: |
呂永和
Yungho Leu |
口試委員: |
楊維寧
Wei-Ning Yang 陳雲岫 Yun-Shiow Chen |
學位類別: |
碩士 Master |
系所名稱: |
管理學院 - 資訊管理系 Department of Information Management |
論文出版年: | 2017 |
畢業學年度: | 105 |
語文別: | 中文 |
論文頁數: | 28 |
中文關鍵詞: | 情緒分析 、情緒辭典 、TF-IDF 、文字探勘 |
外文關鍵詞: | Sentiment Analysis, Sentiment Dictionary, TF-IDF, Text Mining |
相關次數: | 點閱:458 下載:2 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
在科技日新月異的進步下,社群平台已經成為許多人每天使用以及瀏覽的平台之一,而他們也會在社群平台上分享自己對於事物的看法並與人作意見的交流,雖然現今社會提倡言論自由,但是在暢所欲言的同時,卻往往忽略了網路文章帶來的影響力。當使用者在社群平台中閱覽文章的時候,他們會對自己喜歡的內容產生認同感,進而改變自己對於文中評論之事物的看法。本研究在幫助使用者初步判斷文章中帶有的情緒程度,讓使用者在閱覽文章之前,根據程式判斷結果斟酌認同程度。本研究中首先利用情緒辭典對Dcard工作版中的283篇熱門文章進行正負面詞彙分析,並利用TF-IDF方式取出已分類好文章中的關鍵字,並透過情緒分數的計算方式擴充至情緒字典中,最後再利用貝氏分類器為全新的文章進行分類。實驗結果發現,準確率(Accuracy)達70%,查全率(Recall rate)達88%,能夠正確地判斷一篇文章是屬於正面情緒或負面情緒。
With the advance of social networks, posting and reading articles on a website have become our daily routine. People can easily express their opinions with others through a social network. Although "freedom of speech" is guaranteed in a democratic country, one cannot neglect the effect of a web article. In this research, we proposed a method to perform sentimental analysis on web-based articles. Our research first used a well-known Chinese sentiment dictionary to classify 283 most popular articles; then, we used the TF-IDF scheme to select important keywords from these articles; subsequently, we expanded the Chinese sentiment dictionary with the keywords found by using the TF-IDF scheme. Based on the expanded Chinese sentiment dictionary, we used the Naive Bayes classifier to classify 30 new articles and calculated the accuracy of the classification. The experimental results showed that the accuracy is about 70 percent and the recall rate is about 88 percent.
[1] 曾靉(2017)5年打造每月800萬不重複訪客,社群新星Dcard如何崛起?取自https://www.bnext.com.tw/article/44423/how-social-media-dcard-reaches-millions-users
[2] 何文君(2016)小三美日怒告Dcard!不滿遭匿名控販售「假貨」。取自http://news.tvbs.com.tw/life/684381
[3] 資策會FIND/經濟部技術處「資策會FIND(2016)/ 服務系統體系驅動新興事業研發計畫(2/4)」
[4] 從眾效應 - 維基百科,自由的百科全書. 取自https://zh.wikipedia.org/wiki/%E5%BE%9E%E7%9C%BE%E6%95%88%E6%87%89
[5] 創市際市場研究顧問公司雙週刊(第67期):7-8。
[6] 詹壬菡、方彩欣(2012)論網路虛擬社群中的從眾行為現象。設計研究學報,5,153-167。
[7] Hanson, W. A., & Putler, D. S. (1996). Hits and misses: Herd behavior and online product popularity, Marketing Letters, Vol 7, 297-305
[8] Asch, S. E. (1951). Effect of group pressure upon the modification and distortion of judgments. Journal of Marketing Research, 16, 394-400.
[9] 郭俊桔、張育蓉(2013)使用情緒分析於圖書館使用者滿意度評估之研究。圖書資訊學研究,7:2 (June 2013):153-197。
[10] Ku, L. W. & Chen, H. H. (2007). Mining Opinions from the Web: Beyond Relevance
Retrieval. Journal of American Society for Information Science and Technology,
58, 1838-1850.
[11] 吳蕙欣(2011)。結合多辭典與常識網路的情緒分析系統。台灣大學資訊工程學系碩士論文。
[12] [Machine Learning] Bayes貝氏分類演算法 取自 http://enginebai.logdown.com/posts/241677/bayes-classification
[13] 吳姮憓、羅偉峰(2014)「按讚、留言或分享」-探究影響臉書訊息反應行為意圖之前置因素。行銷評論,Vol.11,2,107-132
[14] 錢鉦津(2016)淺談監督式機器學習的測試評估方法-如何確保大數據分析的品質。叡揚e論壇,第82期,11-13。
[15] Landis, J. & Koch, G. G. (1977). The Measurement of Observer Agreement for
Categorical Data. Biometrics, 33, 159-174