檢索結果:共20筆資料 檢索策略: ckeyword.raw="強化學習"
個人化服務 :
排序:
每頁筆數:
已勾選0筆資料
1
受其他深度強化學習研究所啟發,本研究創造了一個供強化學習agent(代理者)使用的非對稱遊戲環境,在遊戲中兩隊agent各有不同的目標需要完成,鬼需要抓到人,而人需要逃離鬼,雙方建立起一個互相對…
2
由於傳統演算法無法有效地適應交通路網的動態變化,因此,在解決交通信號控制 (Traffic Light Control, TLC) 問題上,強化學習 (Reinforcement Learning,…
3
現今的行動應用程式對於運算資源的需求越來越大,然而設備(Device)本身的運算資源有限,因此可卸載部分任務至雲端(Cloud)或邊緣端(Edge),故找到一個最佳卸載策略相當重要。目前的研究大多都…
4
本文旨為結合傳統視覺演算法和強化式學習之自動化拼圖系統。在硬體上使用六軸機械手臂、網路攝影機以及氣壓夾具。本文將拼圖問題分為已知原始拼圖自動化實現及未知原始拼圖重組策略討論。在已知原始拼圖方面使用傳…
5
目前主要的自動摘要方法,可以分為抽取式摘要(extractive)與重寫式摘要 (abstractive)。在本文中,我們提出無監督學習以及監督學習且基於 BERT 的摘要 任務架構,首先,我們提出…
6
本文介紹了一種使用學習車輛 (LAV) 系統進行自動駕駛的新方法,利用鳥瞰圖 (BEV) 圖像作為感知的主要來源,並根據信息訓練周圍車輛以生成其運動預測,使它們能夠預測並對附近車輛的潛在動作做出反應…
7
一對一格鬥遊戲在整個遊戲史上的地位舉足輕重,直至今日依然保有大批忠實玩家。在格鬥遊戲誕生之初,一種特殊的玩家形態就已存在,那就是虛擬電腦玩家(遊戲 AI)。 遊戲 AI 很好的滿足了玩家以單機模式遊…
8
無人飛行載具(UAV),或稱無人機,具有良好的機動性,並隨著導航技術的進步,近年來已經成為包裹配送問題的有效解決方案。在配送包裹時,無人機容易受到電池容量以及載重量的限制,因此必須在解決方案中同時考…
9
傳統的無人機辨識和響應(跟蹤和避障)方法在面對環境不確定性方面存在著局限性,例如光照變化、視角變化和物體模糊性等。挑戰在於建立可靠的數學模型,將感知輸入與後續行動之間建立起來。複雜的人工智能模型,通…
10
由於現今人們對光學系統的要求提高,如輕量化、照明品質及特殊功能等,自由曲面的重要性也因此逐年增長。然而,自由曲面的設計是具有挑戰性的。首先,創建自由曲面往往無法從以前的案例中找到合適的設計起始點,因…