【30日間返品保証】 教育」としての職業指導の成立 - 株式会社 勁草書房 商品説明に誤りがある場合は、無条件で弊社送料負担で商品到着後30日間返品を承ります。SAPIXオープンテスト 5年2021年5月 原本。 Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more