Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more コピーして使用しておりましたので、問題・解答用紙・解説に書き込みはありません。英語らしい表現と英文法 意味のゆがみをともなう統語構造/研究社/福地肇(単行本)。 手術 2021年 06 月号 [雑誌] ※一部見落としはあるかもしれません。脳のリズム。 東大寺学園中学校 2015年度受験用/英俊社(単行本)