簡易檢索 / 詳目顯示

研究生: 黃之鴻
Chih-hung Huang
論文名稱: 一個32位元多執行緒CPU架構研究與實現
The Design and Verification of a 32-bit Multithreading CPU Architecture
指導教授: 林銘波
Ming-bo Lin
口試委員: 陳郁堂
Yie-tarng Chen
陳維美
Wei-mei Chen
學位類別: 碩士
Master
系所名稱: 電資學院 - 電子工程系
Department of Electronic and Computer Engineering
論文出版年: 2013
畢業學年度: 101
語文別: 中文
論文頁數: 65
中文關鍵詞: 中央處理單元ARM精簡指令集多執行緒
外文關鍵詞: CPU, ARM, RISC, multithreading
相關次數: 點閱:283下載:8
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 在本篇論文中,我們設計並實現了一個與ARMv4T指令集架構相容的微處理器智財(Intellectual Property, IP) ─ HT-ARM9TM。為了改善~Proto3-ARM9TM~處理器效能,本論文選擇從多執行緒的議題著手,在承襲Proto3-ARM9TM的基本架構下,設計了配合處理器特性的執行緒管理單元:Thread-dispatcher,並配合多執行緒處理的特性,設計對應的記憶體存取路徑、暫存器存取路徑以及其他管線架構的修改。藉由適當的切換多執行緒的指令,使HT-ARM9TM處理器能有效的減少Proto3-ARM9TM處理器因危障產生的時間浪費。
    HT-ARM9TM微處理器智財已在Xilinx的Virtex-5 XC5VLX110-FF676 FPGA上實現,其整體系統使用了9397個LUT,32個Block RAM,其最高操作頻率(含AMBA匯流排系統)為31 MHz。其處理器核心與Proto3-ARM9TM處理器核心做比較,操作頻率由45.2 MHz提升至45.7 MHz,相同測試程式下的IPC由0.7提升至0.856,整體效能則增加23.64%。


    In this thesis, an ARMv4T instruction set architecture compatible microprocessor IP (Intellectual Property), HT-ARM9TM, is proposed. In order to improve the performance of the Proto3-ARM9TM processor, we focus on the subject of multithreading. To follow the architecture of the Proto3-ARM9TM processor, we designed a thread management unit: Thread-dispatcher, that matches with the processor property. To match with the multithreading property, we designed the memory access paths, register files access paths, and the modification of other pipeline architecture. By switching instructions of threads appropriately in the HT-ARM9TM processor, it can reduce the cycle wastes due to the hazards of the Proto3-ARM9TM processor.
    The HT-ARM9TM processor are implemented and verified at Xilinx Virtex-5 XC5VLX110-FF676 FPGA. The HT-ARM9TM processor consumes 9397 LUTs, 32 Block RAMs, and operates at maximum frequency (included the AMBA bus system) of 31 MHz. As compared with the HT-ARM9TM processor core and the Proto3-ARM9TM processor core, the maximum operating frequency is increased from 45.2 MHz to 45.7 MHz, the IPC is increased from 0.7 to 0.856, and the performance is increased by an amount of 23.64%.

    教授推薦書 論文口試委員審定書 中文摘要 英文摘要 目錄 表目錄 圖目錄 第一章 緒論 1.1 研究動機 1.2 章節編排 第二章 多執行緒處理的背景知識 2.1 執行緒的分割 2.2 執行緒的切換 2.3 執行時的時間浪費 2.4 多執行緒處理器的種類 2.5 現有的多執行緒處理器的特性 2.5.1 Intel處理器 2.5.2 Fuce處理器 2.5.3 MVP系統 第三章 ARM處理器的簡介 3.1 ARM處理器的發展 3.2 指令集架構 3.3 ARM處理器的運作模式 第四章 HT-ARM9TM處理器系統架構 4.1 ARM9TDMI的簡介 4.2 HT-ARM9TM的特性 4.2.1 Proto3-ARM9TM的特性 4.2.2 多執行緒處理 4.3 管線階級規劃 4.3.1 Proto3-ARM9TM處理器的管線階級 4.3.2 處理分支指令的效率分析 4.3.3 HT-ARM9TM處理器的管線階級 第五章 HT-ARM9TM的控制單元與資料路徑設計 5.1 控制單元與資料路徑的簡介 5.1.1 Thumb指令解碼器 5.1.2 指令控制器 5.1.3 乘加器 5.1.4 算術邏輯單元 5.2 Thread-dispatcher單元設計 5.2.1 執行緒的切換 5.2.2 優先權規劃 5.2.3 Thread-dispatcher ver.1 5.2.4 Thread-dispatcher ver.2 5.3 記憶體存取控制 5.4 暫存器檔案 第六章 HT-ARM9TM的危障處理 6.1 結構危障 6.2 資料危障 6.3 控制危障 第七章 FPGA驗證與結果分析 7.1 FPGA驗證流程 7.2 FPGA合成結果 7.3 效能評估 第八章 結論 參考文獻 授權書

    1. http://www.arm.com/
    2. S. Furber, ARM system-on-chip architecture, 2nd edition, Addison Wesley, 2000.
    3. A. N. Sloss, D. Symes and C. Wright, ARM system developer’s guide : designing and optimizing system software, Morgan Kaufmann, 2004.
    4. K. Toda, K. Nishida, Y. Uchibori, S. Sakai and T. Shimada, “Parallel multi-context architecture with high-speed synchronization mechanism,” 1991. Proceedings of the Fifth International Conference on Parallel Processing Symposium, pp. 336-343, Apr. 1991.
    5. D. M. Tullsen, S. J. Eggers and H. M. Levy, “Simultaneous multithreading: Maximizing on-chip parallelism, ” 22nd Annual International Symposium on Computer Architecture, pp. 392-403, Jun. 1995.
    6. http://www.intel.com/
    7. Intel, IntelR 64 and IA-32 Architectures Software Developer’s Manual, Vol. 3A, 2006.
    8. J. Kreuzinger and T. Ungerer, “Context-switching Techniques for Decoupled Multithreaded Processors,” 1999. Proceedings of the 25th Euromicro Conference, vol. 1, pp. 248-251, Sep. 1999.
    9. T. Matsuzaki, H. Tomiyasu and M. Amamiya, ”An architecture of on-chip-memory multi-threading processor,” 2001. Innovative Architecture for Future Generation High-Performance Processors and Systems, pp. 100-108, Jan. 2001.
    10. T. Matsuzaki, S. Amamiya, M. Izumi and M. Amamiya, “A multi-thread processor architecture based on the continuation model,” 2005. Innovative Architecture for Future Generation High-Performance Processors and Systems, Jan. 2005.
    11. M. Amamiya, H. Tomiyasu and S. Kusakabe, “Datarol: a parallel machine architecture for fine-grain multithreading,” 1997. Proceedings of the Third Working Conference on Massively Parallel Programming Models, pp. 151-162, Nov. 1997.
    12. C. Guangzuo and L. Zhaolin, “MT-ARM: multithreading implementation in ARM7 architecture,” 2001. Proceedings of the Fourth International Conference on ASIC, pp. 793-796, Oct. 2001.
    13. H. Kwak, B. Lee, A. R. Hurson, S.-H. Yoon and W.-J. Hahn, “Effects of multithreading on cache performance,” 1999. IEEE Transactions on Computers, pp. 176-184, Feb. 1999.
    14. K. Tanaka, “Fast context switching by hierarchical task allocation and reconfigurable cache,” 2003. Innovative Architecture for Future Generation High-Performance Processors and Systems, pp. 20-29, Jul. 2003.
    15. ARM, ARM7TDMI Technical Reference Manual, Rev. 4, 2001.
    16. ARM, ARM9TDMI Technical Reference Manual, Rev. 3, 2000.
    17. ARM, ARM926EJ-S Technical Reference Manual, Rev. 0, 2000.
    18. 方志中,ARMv4T指令集架構相容之微處理器智財設計與驗證,國立台灣科技大學電子工程系碩士論文,2009.
    19. 林晉禾,ARMv4T指令集架構相容之微處理器智財設計與驗證,國立台灣科技大學電子工程系碩士論文,2005.

    QR CODE