研究生: 林家興
Jia-Xing Lin
論文名稱: 以 GPUs 加速 Skyline-Join 查詢問題之研究
A Study of Accelerating Skyline-Join Query Using GPUs
指導教授: 陳維美
Wei-Mei Chen
口試委員: 林昌鴻
Chang-Hong Lin
Ching-Shun Lin
Yuan-Hsiang Lin
Wei-Mei Chen
學位類別: 碩士
系所名稱: 電資學院 - 電子工程系
Department of Electronic and Computer Engineering
論文出版年: 2020
畢業學年度: 108
語文別: 中文
論文頁數: 49
中文關鍵詞: 天際線查詢關聯式連接Skyline-join平行演算法GPGPU
外文關鍵詞: skyline query, relational join, Skyline-join, parallel algorithm, GPGPU
點閱:561下載:0
為了加速天際線查詢(skyline query) ,已經有許多文獻提出相關演算法,但大部分都是對單一表格進行天際線查詢,在實務情況資料分量可能分散在不同表格,若對多個表格的資料進行天際線查詢,需要先將表格進行關聯式連接(relational join),再利用現有的天際線查詢演算法,這樣可能造成許多不必要運算,於是延伸出skyline-join問題,但隨著資料量的上升,計算量變得龐大,導致相關文獻的演算法的執行時間過長。本論文提出適合Graphics Processing Unit(GPU)平行計算的skyline-join演算法,以join分量的數值分群,並利用k-d樹概念尋找天際線,以減少比較次數,在輸入表格中分析支配關係,進行join運算後資料都是skyline。本論文的循序演算法與其他文獻進行比較,效率有顯著提升,最後應用至GPU平行演算法,實驗結果顯示可大幅降低整體時間。

Based on the goal of accelerating the skyline query, there have been many papers and research that have proposed related algorithms. However, most methods are to perform skyline query on a single table. In practice, the data attributes may be scattered in multiple tables separately. Relational joins are required before performing the existing skyline query algorithm. Such steps may produce many unnecessary operations, so the related issues of skyline-join are extended. the cardinality increases, the amount of calculation becomes relatively large, from numerous literatures, it is found that directly leads to the too long execution time of the algorithms. This paper is dedicated to proposing a skyline-join algorithm suitable for parallel computing by Graphics Processing Unit (GPU). The join attribute is used for grouping, and the k-d tree concept is applied to find the skyline, thereby reducing the number of comparisons. Then, in the input form, the dominance relationship is analyzed. After the join operation, the data is all skylines. Comparing the sequential algorithm used in this paper with the methods in other papers, it can be found that the efficiency is significantly improved. Furthermore, by applying the skyline-join algorithm to the GPUs , it can be estimated from the experimental results that the overall time is greatly reduced.

教授推薦書 i 論文口試委員審定書 ii 中文摘要 iii 英文摘要 iv 目錄 v 圖目錄 viii 表目錄 x 1 緒論 1 1.1 研究背景 1 1.2 研究動機 1 1.3 論文架構 3 2 GPU 架構 4 2.1 NVIDIA GPU 硬體架構 4 2.2 CUDA 6 2.3 軟硬體間的對應 6 2.4 全域記憶體 7 2.5 共享記憶體 8 3 文獻探討 9 3.1 Skyline query 9 3.2 Join 10 3.3 Skylinejoin 10 4 研究方法 14 4.1 基本定義 14 4.1.1 Skyline query 定義 14 4.1.2 Join 定義 14 4.1.3 Skyline-join query 定義 15 4.2 SJQ algorithm 15 4.2.1 分群資料16 4.2.2 尋找local skyline 17 4.2.3 分析local skyline 支配關係 20 4.2.4 Join 20 4.3 SJQGPU algorithm 21 4.3.1 應用於GPU 的資料結構與工作分配 21 4.3.2 平行尋找local skyline 22 4.3.3 記錄支配關係的資料結構 23 4.3.4 平行版本join 運算 24 5 實驗結果與分析 27 5.1 實驗資料與設定 27 5.2 SJQ 實驗分析 28 5.2.1 分群群大小的影響 28 5.2.2 資料量大小的影響 29 5.2.3 資料分量的影響 30 5.2.4 Join rate 的影響 30 5.3 循序演算法與其他文獻比較 31 5.3.1 資料大小的影響 32 5.3.2 資料分量的影響 32 5.3.3 Join rate 的影響 33 5.4 Real dataset 33 6 結論 35 參考文獻 36

