「Pythonで学ぶ強化学習 入門から実践まで」まとめ
作成日時: | 2019年11月19日 |
更新日時: | 2019年11月21日 |
この記事は「Pythonで学ぶ強化学習 入門から実践まで」という本のまとめです。
ニューラルネットワーク ⊃ 深層学習
モデルの持つパラメータをデータによって調整することを学習という。
学習方法は次の3つ。
#ul
教師あり学習
教師なし学習
強化学習
#ul_end
右側には行き止まりしかないのなら悪く評価しよう、右側に宝箱があるのなら高く評価しよう、ということをモデルが自動的に学ぶ。
ニューラルネットワーク ≠ 深層学習
正しくはニューラルネットワーク ⊃ 深層学習
機械学習の機械はパラメータを持った数式
機械はモデルとも呼ばれる。モデルの持つパラメータをデータによって調整することを学習という。
学習方法は次の3つ。
#ul
教師あり学習
教師なし学習
強化学習
#ul_end
強化学習のモデルは「行動の評価方法」を学ぶ
例えばエージェントが右に動いたとき、右に動くという行動の良し悪しを評価する方法を強化学習モデルは学ぶ。右側には行き止まりしかないのなら悪く評価しよう、右側に宝箱があるのなら高く評価しよう、ということをモデルが自動的に学ぶ。