Skip to content

Latest commit

 

History

History
20 lines (17 loc) · 757 Bytes

README.md

File metadata and controls

20 lines (17 loc) · 757 Bytes

リバーシZero

AlphaZeroのアルゴリズムでリバーシするAI作った。

序盤(自分: 黒,AI: 白) デモ画像

終盤(負けた。。。) デモ画像

コード

  • game.py: ゲーム状態
  • dual_network.py: デュアルネットワーク
  • pv_mcts.py: モンテカルロ木探索
  • self_play.py: セルフプレイ
  • train_network.py: パラメータ更新
  • evaluate_network.py: 新パラメータの評価
  • evaluate_best_player.py: ベストプレーヤーの評価
  • train_cycle.py: 学習サイクル
  • human_play.py: ゲームUI(tkinter)
  • human_play.py2: ゲームUI(kivy)