強化学習 | やみとものプログラミング日記

このサイトは趣味でプログラミングや数学をしている僕の日記のようなブログです。
最近は機械学習を理解するために大学数学を勉強しています。

お知らせ

セカンドブログを始めました！
今後はセカンドブログを主に更新していこうと思います。
よろしくお願いします。

リンク↓

やみともブログセカンド - プログラミング・数学・英語の勉強記録
プログラミング・数学・英語の勉強記録

TOP ＞強化学習

機械学習強化学習

作成日時：	2020年11月5日
更新日時：	2020年11月24日

こんにちは、やみともです。最近は強化学習について勉強していて、たくさん本を買って読んでいるので購入した強化学習関連の本の感想を随時書いていこうと思います。これから紹介するどの本も多かれ少なかれ数式が出てきますが、理解のコツは、自分の手でノー

こんにちは、やみともです。最近は強化学習について勉強していて、たくさん本を買って読んでいるので購入した強化学習関連の本の感想を随時書いていこ...

Python プログラミング機械学習強化学習

作成日時：	2019年7月6日
更新日時：	2020年11月21日

追記この記事で紹介していない強化学習の本を含めた新しい記事を更新しました。僕が読んだ全ての強化学習の本の感想こんにちは、やみともです。最近は強化学習について勉強していて、たくさん本を買って読んでいるので購入した強化学習関連の本の感想を随時書

追記この記事で紹介していない強化学習の本を含めた新しい記事を更新しました。僕が読んだ全ての強化学習の本の感想こんにちは、やみともです。最近は...

機械学習強化学習 Unity

作成日時：	2020年11月8日
更新日時：	2020年11月10日

こんにちは、やみともです。これからしばらく毎週土曜日に強化学習に関する記事をアップしていこうと思います。初回のこの記事は、UnityでML-Agentsを使って強化学習始めてみた、という記事です。最終的に下の動画のようにエージェント(球)が

こんにちは、やみともです。これからしばらく毎週土曜日に強化学習に関する記事をアップしていこうと思います。初回のこの記事は、UnityでML-...

Python 機械学習強化学習

作成日時：	2019年12月31日
更新日時：	2019年12月31日

↑の本のp26〜p33の「n本腕バンディット問題」をPythonで実装してみました。楽しかった。全コードはこの記事の最後に掲載します。簡単にコードの説明をすると、貪欲戦略のエージェント(GreedyAgent)、εグリーディ手法を取るエージ

↑の本のp26〜p33の「n本腕バンディット問題」をPythonで実装してみました。楽しかった。全コードはこの記事の最後に掲載します。簡単に...

ディープラーニング Python プログラミング機械学習強化学習

作成日時：	2019年11月19日
更新日時：	2019年11月21日

この記事は「Pythonで学ぶ強化学習入門から実践まで」という本のまとめです。ニューラルネットワーク ≠ 深層学習正しくはニューラルネットワーク ⊃ 深層学習機械学習の機械はパラメータを持った数式機械はモデルとも呼ばれる。モデルの持つパラ

この記事は「Pythonで学ぶ強化学習入門から実践まで」という本のまとめです。ニューラルネットワーク ≠ 深層学習正しくはニューラルネット...

pages 1