Howard M.Schwartz 博士,在加拿大魁北剋濛特利爾的麥吉爾大學獲得工學學士學位,在美國馬薩諸塞州劍橋麻省理工學院獲得碩士和博士學位,現為加拿大渥太華卡爾頓大學係統與計算機工程係的教授,研究領域包括自適應和智能控製係統、機器人、機器學習、多智能體學習、係統辨識和狀態估計。
本書主要介紹瞭多智能體機器人強化學習的相關內容。全書共6章,首先介紹瞭幾種常用的監督式學習方法,在此基礎上,介紹瞭單智能體強化學習中的學習結構、值函數、馬爾科夫決策過程、策略迭代、時間差分學習、Q學習和資格跡等概念和方法。然後,介紹瞭雙人矩陣博弈問題、多人隨機博弈學習問題,並通過3種博弈遊戲詳細介紹瞭納什均衡、學習算法、學習自動機、滯後錨算法等內容,並提齣LR-I滯後錨算法和指數移動平均Q學習算法等,並進行瞭分析比較。接下來,介紹瞭模糊係統和模糊學習,並通過仿真示例詳細分析算法。後,介紹瞭群智能學習進化以及性格特徵概念和應用。全書內容豐富,重點突齣。
評分
評分
評分
評分
排版不好看。尤其是僞代碼部分,不僅寫得簡略、字體和字號又選的不好。至於內容……反正什麼都是納什均衡唄。
评分排版不好看。尤其是僞代碼部分,不僅寫得簡略、字體和字號又選的不好。至於內容……反正什麼都是納什均衡唄。
评分排版不好看。尤其是僞代碼部分,不僅寫得簡略、字體和字號又選的不好。至於內容……反正什麼都是納什均衡唄。
评分排版不好看。尤其是僞代碼部分,不僅寫得簡略、字體和字號又選的不好。至於內容……反正什麼都是納什均衡唄。
评分介紹瞭幾個微分博弈經典例子,這方麵的研究網上資料較少;另外看原文可能更易於理解一些,書中還是有一部分錯誤的
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 qciss.net All Rights Reserved. 小哈圖書下載中心 版权所有