簡易檢索 / 檢索結果

  • 檢索結果:共36筆資料 檢索策略: "Reinforcement Learning".ekeyword (精準)


  • 在搜尋的結果範圍內查詢: 搜尋 展開檢索結果的年代分布圖

  • 個人化服務

    我的檢索策略

  • 排序:

      
  • 已勾選0筆資料


      本頁全選

    1

    以深度強化學習網路玩非對稱遊戲
    • 資訊工程系 /110/ 碩士
    • 研究生: 范祐恩 指導教授: 洪西進
    •   受其他深度強化學習研究所啟發,本研究創造了一個供強化學習agent(代理者)使用的非對稱遊戲環境,在遊戲中兩隊agent各有不同的目標需要完成,鬼需要抓到人,而人需要逃離鬼,雙方建立起一個互相對…
    • 點閱:321下載:0
    • 全文公開日期 2024/12/05 (校內網路)
    • 全文公開日期 本全文未授權公開 (校外網路)
    • 全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)

    2

    利用專注性代理及概念路徑分辨器整合評分融合之知識圖譜推論
    • 資訊工程系 /110/ 碩士
    • 研究生: 林彥碩 指導教授: 陳怡伶
    • 點閱:241下載:0
    • 全文公開日期 2025/09/05 (校內網路)
    • 全文公開日期 本全文未授權公開 (校外網路)
    • 全文公開日期 本全文未授權公開 (國家圖書館:臺灣博碩士論文系統)

    3

    基於強化學習模型之 Ludo 遊戲 AI Bot 之研究
    • 資訊工程系 /110/ 碩士
    • 研究生: 王珮如 指導教授: 戴文凱
    • 在遊戲領域中,AI一直都是非常重點研究項目,從早期的規則式AI、強化學習AI到現在結合深度學習技術的深度強化學習AI。傳統的規則式AI必須需要開發者熟悉該遊戲的操作及各式各樣的演算法及資料結構,且幾…
    • 點閱:354下載:10

    4

    基於預訓練模型的抽取式文件摘要之研究
    • 資訊工程系 /108/ 碩士
    • 研究生: 吳政育 指導教授: 陳冠宇
    • 目前主要的自動摘要方法,可以分為抽取式摘要(extractive)與重寫式摘要 (abstractive)。在本文中,我們提出無監督學習以及監督學習且基於 BERT 的摘要 任務架構,首先,我們提出…
    • 點閱:365下載:0
    • 全文公開日期 2025/02/11 (校內網路)
    • 全文公開日期 2025/02/11 (校外網路)
    • 全文公開日期 2025/02/11 (國家圖書館:臺灣博碩士論文系統)

    5

    在Device-Edge-Cloud運算環境中基於強化學習之卸載決策方法
    • 資訊管理系 /110/ 碩士
    • 研究生: 張芸甄 指導教授: 賴源正
    • 現今的行動應用程式對於運算資源的需求越來越大,然而設備(Device)本身的運算資源有限,因此可卸載部分任務至雲端(Cloud)或邊緣端(Edge),故找到一個最佳卸載策略相當重要。目前的研究大多都…
    • 點閱:239下載:0
    • 全文公開日期 2025/09/22 (校內網路)
    • 全文公開日期 2032/09/22 (校外網路)
    • 全文公開日期 2032/09/22 (國家圖書館:臺灣博碩士論文系統)

    6

    基於近端策略最佳化演算法結合 澤爾尼克多項式反射罩應用於自由曲面光學設計
    • 色彩與照明科技研究所 /111/ 碩士
    • 研究生: 李岳軒 指導教授: 孫沛立 黃忠偉
    • 隨著時代的進步光學系統的尺寸也隨之變得越來越小,而隨著光學系統的縮小當中的光學元件也必須隨著一起變小,而需要在如此有限的空間中要達到與以往相同的效果就勢必要使用自由度更高的光學元件如:非球面、XY多…
    • 點閱:206下載:3

    7

    生成用於互動性游泳者動畫的神經網路控制
    • 資訊工程系 /111/ 碩士
    • 研究生: 葉定豪 指導教授: 戴文凱
    • 本論文提出了一種程序化生成動作控制器的方法。 我們使用了計算流體力學 (Computational fluid dynamics)方法,模擬流體與水下游泳者間的相互作用,並使用深度強化學習,學習出真…
    • 點閱:214下載:3

    8

    基於強化學習之蛇形機器人運動控制
    • 自動化及控制研究所 /110/ 碩士
    • 研究生: 李哲維 指導教授: 李敏凡
    • 在過去幾年中,蛇形機器人之運動控制是一個具有非常有挑戰性的問題。這問 題其中包括了非獨立性關節以及連接機構等相關技術問題,所以它無法簡單應用到 許多領域之中。對於這篇挑戰論文,建模方法主要是分析運動…
    • 點閱:335下載:0
    • 全文公開日期 2024/09/07 (校內網路)
    • 全文公開日期 2024/09/07 (校外網路)
    • 全文公開日期 2024/09/07 (國家圖書館:臺灣博碩士論文系統)

    9

    結合傳統視覺演算法與強化式學習之自動化拼圖系統
    • 電機工程系 /109/ 碩士
    • 研究生: 王晟安 指導教授: 施慶隆
    • 本文旨為結合傳統視覺演算法和強化式學習之自動化拼圖系統。在硬體上使用六軸機械手臂、網路攝影機以及氣壓夾具。本文將拼圖問題分為已知原始拼圖自動化實現及未知原始拼圖重組策略討論。在已知原始拼圖方面使用傳…
    • 點閱:230下載:0
    • 全文公開日期 2023/07/21 (校內網路)
    • 全文公開日期 2025/07/21 (校外網路)
    • 全文公開日期 2025/07/21 (國家圖書館:臺灣博碩士論文系統)

    10

    學習式軌跡引導控制的虛擬測試
    • 電子工程系 /111/ 碩士
    • 研究生: 力午天 指導教授: 陳郁堂 方文賢
    • 本文介紹了一種使用學習車輛 (LAV) 系統進行自動駕駛的新方法,利用鳥瞰圖 (BEV) 圖像作為感知的主要來源,並根據信息訓練周圍車輛以生成其運動預測,使它們能夠預測並對附近車輛的潛在動作做出反應…
    • 點閱:292下載:3