Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more ■状態・その他■ 手術 2021年 06 月号 [雑誌] この商品はBランクです。河合出版 共通テスト直前対策問題集 2024 英語/数学/国語/物理/化学/地理 状態良品 000L1D。 東大寺学園中学校 2015年度受験用/英俊社(単行本)