オセロAIの実装にあたり色々な書籍やサイトを参考にしました.
身も蓋もないことを言ってしまうと,私の書いた文章よりも参考文献 サイトの方がはるかに分かりやすいです.
教師あり学習の部分で主に参考にしました.
AlphaGoのアルゴリズムの解説から始まり,基本となる方策ネットワーク 価値ネットワークからマルチタスク学習などの学習テクニック,モンテカルロ木探索
まで分かりやすく解説されています.
ある程度,深層学習に関して慣れている方だと読みやすいかもしれません.
AIの実装にはChainerが使用されています.
6×6のオセロの深層強化学習の部分で参考にしているほか,訓練データの作成で使ったオセロプログラムはこの本のプログラムを一部書き換えて使用しています. 深層学習・強化学習の初歩から分かりやすく解説がなされており,TF-Agentsの実装例やゲームAIの実装に必要なテクニックが説明されています. TF-Agentsの実装例は特にわかりやすく初学者の方でも安心して読めると思います.
オセロの棋譜データは フランスオセロ連盟 のサイトからダウンロードして使用しました.
オセロの棋譜に関する解説は こちら のサイトが分かりやすかったです. 訓練データには直接使用しない部分の解説もされています.
こちらの 変換用サイト を使用して棋譜の変換を行いました.
(1)の著者が書かれている こちら の8×8のオセロの深層強化学習の記事が参考になりました.