研究生: 李慶祥
論文名稱: 大數據分析之研究 -以中鼎工程公司為例
Big Data Analysis – A Case Study on CTCI Corporation
指導教授: 歐陽超
Chao Ou-Yang
口試委員: 王孔政
Kung-Jeng Wang
Ren-Jieh Kuo
學位類別: 碩士
系所名稱: 管理學院 - 管理研究所
Graduate Institute of Management
論文出版年: 2015
畢業學年度: 103
語文別: 中文
論文頁數: 79
中文關鍵詞: 大數據文字探勘R
外文關鍵詞: Big Data, Text Mining, R
  • 大數據是一種新的能力,它結合硬體、軟體、統計模型、專業領域知識、經驗等元素,從資料解析出對決策有用的資訊,讓企業可以達到節省成本、加快速度、改進產品與服務、提升決策品質的目的,進而創造競爭優勢。這種能力以物聯網、雲端計算、Hadoop叢集資料處理等資訊技術為基礎,加上人的專業知識,經過實驗、分析、解讀、調整的循環,逐步改進程序以獲取有意義資訊,形成企業的策略行動。其中最關鍵因素是人的專業知識與判斷,影響大數據行動成敗。
    本研究採用R語言的文字探勘模組(tm package),解析工程文件內容,尋找出現頻率最高關鍵字,再透過領域專家解讀,從中了解業主的潛在需求,經由實做過程,熟悉大數據技術的應用,評估是否適合用於解決流程問題,並建議引進的程序與步驟,供有意在公司內部養成大數據分析能力的企業參考。

    Big Data is a new capability that combines hardware, software, statistical models, domain knowledge, experience and other elements. By parsing out useful information for decision-making, companies can cut cost, speed up, improve products and services, and enhance the quality of decision-making, which thereby create competitive advantages. This capability based on Internet of Things, Cloud Computing, Hadoop cluster data processing and other information technology, coupled with human expertise, through experiment, analysis, interpretation, adjustment cycle, and gradually improvement on procedures to obtain meaningful information forms business strategic action. One of the most critical factors is the human expertise and judgment, which affect the success of Big Data actions.
    Engineering project will generate a lot of unstructured data when executed, which is not effectively used in the past. Case company expects to introduce Big Data technologies to interpret business documents, and analyze engineering requirements and preferences from it. These data will accumulate and become knowledge file. Through experience, company will become more and more familiar with owners, which enables them to reduce occurrence of punch, shorten construction period, save costs and improve project quality.
    In this study, by using text mining module (tm package) in R language, we analyze project file contents and find the keywords which appear most frequently. Then through the interpretation of experts, we learn about the potential needs of the owners. After some actual practices, we can get familiar with Big Data’s applications, evaluate whether it is suitable for solving procedure problems, and suggest which process or procedure should be introduce. This will be provided as reference for company who intend to cultivate Big Data analysis capability.
    Alan M. Weber mentioned in the book 《Rules of Thumb》 that the future will be personal, portable, digital. The protagonist is not the technology itself, but what will become possible via technology. The real technology is intangible, including the link it established, the speed and flexibility it implements, behavioral change it leads, and innovative possibility it stimulates. To behold the true power of technology, please observe the intangible things. Think more about the uses of technology, rather than the technological tools themselves, just like computing is way more important than the computer.

    目錄 VIII 表目錄 XI 圖目錄 XII 第一章 緒論 第一節 研究背景 第二節 研究動機 第三節 研究目的 第四節 研究對象與範圍 第五節 研究流程 第二章 文獻探討 第一節 大數據是什麼? 1. 資料的定義 2. 大數據的興起 3. 大數據的定義 4. 大數據的廣義定義 5. 大數據的軟體技術 6. 大數據的分析技術 7. 大數據對產業的影響 8. 大數據人才的缺口 第二節 數位化時代的來臨 1. 大數據與智慧連網 2. 數位化創造新價值 3. 大數據創造價值的方式 4. 資料流整合供應鏈 第三節 大數據發展策略 1. 企業為什麼需要大數據 2. 可用大數據實現的目標 3. 大數據的兩階段導入 4. 大數據的運用方式 5. 大數據的專業知識 6. 大數據與實驗 7. 大數據與決策分析 8. 大數據發揮功效的做法 第四節 資料的非理性效果 第三章 研究方法 第一節 研究架構 1. 問題定義與架構 2. 資料準備 3. 建立資料分析模式 4. 結論與建議 第二節 研究對象 第四章 個案公司介紹 第一節 個案公司概況 第二節 大數據架構 第三節 大數據導入與運作 1. 問題定義與架構 2. 資料準備 44 3. 建立資料分析模式 4. 關鍵字搜尋實驗 5. 結果解釋與評估 第四節 實驗結果應用 第五章 結論與建議 第一節 結論 1. 資料收集程序簡化 2. 從資料收集到資料分析 3. 大數據與資料品質 4. 資訊安全與共享 5. 企業現在就該投資大數據 第二節 建議 1. 分階段導入大數據 2. 大數據未來的演進與發展 3. 大數據導入的天時、地利、人和 4. 大數據與外包(Outsourcing) 69 5. 開放原始碼軟體(Open Source Software)

