月別アーカイブ: 2017年2月

CartPoleをやってみる

openAI gymのCartPoleを強化学習で解いてみました。
https://gist.github.com/threecourse/3b428c70c8fad43472affc6ede0b4e9f

  • 以下の記事を元に、まずはcartpoleから始めて見ました。理論的な解説はそちらをご参照下さい。
    https://elix-tech.github.io/ja/2016/06/29/dqn-ja.html
  • 理解しようと思ってリファクタリングした。TensorFlowの書き方が良くわからなかったので結局全部kerasで書いた(書けた)
  • kerasのactionごとのq_valueを統合するところで苦労した。2次元だとmerge(mode=”dot”)が効かないらしく、merge(mode=”mul”)からのsumでどうにかした。
  • CartPoleといえども適当にやると上手くいかない。
  • いろいろ間違ってるかもしれません。