研究生: 姚道志
Tao-Chih Yao
論文名稱: 建立以小樣本時間序列網路聲量資料為基之汽車銷量趨勢預測模型
Establish Forecast Models of Automobile Sales Trends based on Small Samples Time Series Network Volume Data
指導教授: 歐陽超
Chao Ou-Yang
口試委員: 歐陽超
Chao Ou-Yang
Kung-Jeng Wang
Ren-Jieh Kuo
學位類別: 碩士
系所名稱: 管理學院 - 工業管理系
Department of Industrial Management
論文出版年: 2020
畢業學年度: 108
語文別: 中文
論文頁數: 67
中文關鍵詞: 網路聲量資料小樣本CNNLSTM子集合選擇
外文關鍵詞: voice volume data, small samples, CNN, LSTM, Subset Selection
相關次數: 點閱:192下載:0
本研究所採用的網路聲量情緒資料具有時間序列資料之特性,所以在預測模型方面將使用一維卷積神經網絡(1 Dimension Convolution Neural Networks, 1D CNN),以及長短期記憶網絡(Long Short Term Memory Network, LSTM)作為預測模型的主軸,並加入CNN與LSTM的複合模型,對架構進行測試與研究,活用這類深度學習模型之特性並提供實務上的案例,建立針對個案資料最適配之模型架構。同時,本研究屬於現實的小樣本時間序列資料,在方法與研究上會針對其特殊的資料特性選配,期待會對本研究之模型預測有所幫助。

Applying network opinions as a reference to shopping becomes popular in recent years. Many social networks medias such as discussion forums and blogs growth rapidly. More and more businesses have utilized social networks as their marketing strategies. The market for automobile sales is one of the areas. People will go to various social media to search for related information before making the final decision. Therefore, this research tends to apply network opinions from various social media to predict the trends of automobile sales.
This research will use the positive/negative emotion and total internet volume for six brands of automobiles and their automobiles sales data as the dataset. The time series of internet volume data are collected and analyzed every day and car sales data are recorded every month.
The proposed approach including several steps. First, convert car sales data into a trend up, hold, or down labels. Second, use genetic algorithms to reduce the number of variables to facilitate model training. Then a hybrid “One Dimension Convolution Neural Networks (1D CNN)” with “Long Short Term Memory Network (LSTM)” will be used to predict the sales trends. Finally, compare the prediction results with LSTM and 1D CNN models. The predicting results can be used as a reference for the marking and production departments of local automobile companies.

摘要 i Abstract ii 致謝 iii 圖目錄 vi 表目錄 vii 第一章、緒論 1 1.1 研究背景 1 1.2 研究目的 2 1.3 研究議題 2 1.4重要性 4 第二章、文獻探討 5 2.1 銷售量預測 5 2.2 網路情緒聲量之應用 7 2.3 利用基因演算法進行子集合選擇(Subset Selection) 9 2.4 時間序列型資料預測模型 10 第三章、研究方法 12 3.1 研究架構與流程 12 3.2 資料收集與預處理 14 3.2.1 銷售量資料收集與預處理 14 3.2.2 聲量資料收集 16 3.2.3 資料對應 18 3.2.4 正規化方法 21 3.3 CNN模型、LSTM模型與複合模型之建構 22 3.3.1 一維卷積神經網絡 (1 Dimension Convolution Neural Network) 22 3.3.2 長短期記憶網絡(Long Short Term Memory Network) 23 3.3.3 CNN與LSTM複合模型 26 3.4 變數挑選 28 3.4.1 子集合選擇變數對應 28 3.4.2利用基因演算法對變數進行變數選擇 29 3.5 模型參數與評估 31 3.5.1 模型參數 31 3.5.2 損失函數(Loss Function) 32 3.5.3 混淆矩陣(Confusion Matrix) 32 3.5.4 K-fold 交叉驗證(K-fold cross-validation) 33 第四章、實作結果 34 4.1 資料收集與預處理 34 4.1.1 個案網路聲量資料 34 4.1.2 銷售量資料 37 4.2 模型參數與訓練 38 4.2.1 參數設定與訓練 38 4.2.2 早停法(Earlystop method) 39 4.3 變數選擇 (Feature selection) 41 4.3.1 用基因演算法進行變數選擇 41 4.3.2 變數選擇結果 45 4.4 模型預測與分析 47 4.4.1 CNN模型預測結果 47 4.4.2 LSTM模型預測結果 50 4.4.3 複合模型建構與預測 51 4.4.4 各方法於各品牌的比較 53 第五章、結論與建議 55 5.1 結論 55 5.2 研究限制與未來建議 56 參考文獻 57

