檢索結果:共36筆資料 檢索策略: "Reinforcement Learning".ekeyword (精準)
個人化服務 :
排序:
每頁筆數:
已勾選0筆資料
1
受其他深度強化學習研究所啟發,本研究創造了一個供強化學習agent(代理者)使用的非對稱遊戲環境,在遊戲中兩隊agent各有不同的目標需要完成,鬼需要抓到人,而人需要逃離鬼,雙方建立起一個互相對…
2
3
在遊戲領域中,AI一直都是非常重點研究項目,從早期的規則式AI、強化學習AI到現在結合深度學習技術的深度強化學習AI。傳統的規則式AI必須需要開發者熟悉該遊戲的操作及各式各樣的演算法及資料結構,且幾…
4
目前主要的自動摘要方法,可以分為抽取式摘要(extractive)與重寫式摘要 (abstractive)。在本文中,我們提出無監督學習以及監督學習且基於 BERT 的摘要 任務架構,首先,我們提出…
5
現今的行動應用程式對於運算資源的需求越來越大,然而設備(Device)本身的運算資源有限,因此可卸載部分任務至雲端(Cloud)或邊緣端(Edge),故找到一個最佳卸載策略相當重要。目前的研究大多都…
6
隨著時代的進步光學系統的尺寸也隨之變得越來越小,而隨著光學系統的縮小當中的光學元件也必須隨著一起變小,而需要在如此有限的空間中要達到與以往相同的效果就勢必要使用自由度更高的光學元件如:非球面、XY多…
7
本論文提出了一種程序化生成動作控制器的方法。 我們使用了計算流體力學 (Computational fluid dynamics)方法,模擬流體與水下游泳者間的相互作用,並使用深度強化學習,學習出真…
8
在過去幾年中,蛇形機器人之運動控制是一個具有非常有挑戰性的問題。這問 題其中包括了非獨立性關節以及連接機構等相關技術問題,所以它無法簡單應用到 許多領域之中。對於這篇挑戰論文,建模方法主要是分析運動…
9
本文旨為結合傳統視覺演算法和強化式學習之自動化拼圖系統。在硬體上使用六軸機械手臂、網路攝影機以及氣壓夾具。本文將拼圖問題分為已知原始拼圖自動化實現及未知原始拼圖重組策略討論。在已知原始拼圖方面使用傳…
10
本文介紹了一種使用學習車輛 (LAV) 系統進行自動駕駛的新方法,利用鳥瞰圖 (BEV) 圖像作為感知的主要來源,並根據信息訓練周圍車輛以生成其運動預測,使它們能夠預測並對附近車輛的潛在動作做出反應…