やみとものプログラミング日記 やみとものプログラミング日記

このサイトは趣味でプログラミングや数学をしている僕の日記のようなブログです。
最近は機械学習を理解するために大学数学を勉強しています。

カテゴリ一覧へ

お知らせ

セカンドブログを始めました!
今後はセカンドブログを主に更新していこうと思います。
よろしくお願いします。

リンク↓

記事一覧

TOP  >  強化学習
僕が読んだ全ての強化学習の本の感想

僕が読んだ全ての強化学習の本の感想

作成日時: 2020年11月5日
更新日時: 2020年11月24日

こんにちは、やみともです。最近は強化学習について勉強していて、たくさん本を買って読んでいるので購入した強化学習関連の本の感想を随時書いていこうと思います。これから紹介するどの本も多かれ少なかれ数式が出てきますが、理解のコツは、自分の手でノー

こんにちは、やみともです。最近は強化学習について勉強していて、たくさん本を買って読んでいるので購入した強化学習関連の本の感想を随時書いていこ...

> 続きを読む
強化学習のおすすめの本

強化学習のおすすめの本

作成日時: 2019年7月6日
更新日時: 2020年11月21日

追記この記事で紹介していない強化学習の本を含めた新しい記事を更新しました。僕が読んだ全ての強化学習の本の感想こんにちは、やみともです。最近は強化学習について勉強していて、たくさん本を買って読んでいるので購入した強化学習関連の本の感想を随時書

追記この記事で紹介していない強化学習の本を含めた新しい記事を更新しました。僕が読んだ全ての強化学習の本の感想こんにちは、やみともです。最近は...

> 続きを読む
【ML-Agents】Unityで強化学習始めてみた

【ML-Agents】Unityで強化学習始めてみた

作成日時: 2020年11月8日
更新日時: 2020年11月10日

こんにちは、やみともです。これからしばらく毎週土曜日に強化学習に関する記事をアップしていこうと思います。初回のこの記事は、UnityでML-Agentsを使って強化学習始めてみた、という記事です。最終的に下の動画のようにエージェント(球)が

こんにちは、やみともです。これからしばらく毎週土曜日に強化学習に関する記事をアップしていこうと思います。初回のこの記事は、UnityでML-...

> 続きを読む
【強化学習】n本腕バンディット問題を実装してみた

【強化学習】n本腕バンディット問題を実装してみた

作成日時: 2019年12月31日
更新日時: 2019年12月31日

↑の本のp26〜p33の「n本腕バンディット問題」をPythonで実装してみました。楽しかった。全コードはこの記事の最後に掲載します。簡単にコードの説明をすると、貪欲戦略のエージェント(GreedyAgent)、εグリーディ手法を取るエージ

↑の本のp26〜p33の「n本腕バンディット問題」をPythonで実装してみました。楽しかった。全コードはこの記事の最後に掲載します。簡単に...

> 続きを読む

この記事は「Pythonで学ぶ強化学習 入門から実践まで」という本のまとめです。ニューラルネットワーク ≠ 深層学習正しくはニューラルネットワーク ⊃ 深層学習機械学習の機械はパラメータを持った数式機械はモデルとも呼ばれる。モデルの持つパラ

この記事は「Pythonで学ぶ強化学習 入門から実践まで」という本のまとめです。ニューラルネットワーク ≠ 深層学習正しくはニューラルネット...

> 続きを読む