販売価格
販売中
お取り寄せお取り寄せの商品となります
入荷の見込みがないことが確認された場合や、ご注文後40日前後を経過しても入荷がない場合は、取り寄せ手配を終了し、この商品をキャンセルとさせていただきます。
| フォーマット | 書籍 |
| 発売日 | 2024年09月30日 |
| 国内/輸入 | 国内 |
| 出版社 | 近代科学社 |
| 構成数 | 1 |
| パッケージ仕様 | - |
| SKU | 9784764907102 |
| ページ数 | 204 |
| 判型 | B5変形 |
構成数 : 1枚
第1章 Python で強化学習を行うための環境構築
1.1 オンラインサービスを利用する方法
1.2 手元のコンピュータに実行環境を整える方法
1.3 パッケージのインストール
1.4 実行環境
第2章 Python の基礎
2.1 データ構造
2.2 科学技術計算パッケージNumPy
2.3 条件分岐
2.4 繰り返し処理
2.5 擬似乱数生成パッケージrandom
2.6 可視化ライブラリMatplotlib
2.7 関数
2.8 内包表記
第3章 強化学習の概要
第4章 マルコフ決定過程
4.1 マルコフ性
4.2 推移確率行列
4.3 マルコフ過程
4.4 マルコフ報酬過程
4.5 リターン
4.6 価値関数
4.7 方策
4.8 マルコフ決定過程
第5章 動的計画
5.1 例1: 整数の和
5.2 例2: 最短路問題
5.3 動的計画による価値関数の評価
5.4 方策評価
5.5 方策改善
5.6 方策反復
5.7 価値反復
第6章 モンテカルロ学習
6.1 全幅探索とサンプル探索
6.2 モンテカルロ方策評価
6.3 First-visit モンテカルロ方策評価
6.4 Every-visit モンテカルロ方策評価
6.5 平均の増分計算
第7章 Temporal Difference 学習
7.1 TD(0) 学習
7.2 オンポリシー学習とオフポリシー学習
7.3 オンポリシーモンテカルロ学習
7.4 オンポリシーTD 学習ーSARSA
7.5 オフポリシーTD 学習ーQ 学習

※ショッピングカートおよび注文内容の確認画面にてフラゲのお届けになるかご確認ください。
※各種前払い決済をご利用の場合、フラゲは保証しておりません。
※フラゲは配送日時指定なしでご注文いただいた場合に限ります。
読み込み中にエラーが発生しました。
画面をリロードして、再読み込みしてください。
