欢迎来到天天文库
浏览记录
ID:37834401
大小:195.58 KB
页数:8页
时间:2019-06-01
《将棋棋谱利用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、将棋の棋譜を利用した,大規模な評価関数の調整金子知適†山口和紀†棋譜を教師とした評価関数の調整は古くから研究されてきたが,将棋のような複雑なゲームで実用となったのは最近のことで,明らかになっていない点も未だ多い.現在有望とされる手法は,棋譜の指手が選ばれるように評価関数を調整するもので,探索により最善応手手順を求めることと,最善応手手順後の局面を比較して評価値を調整することを繰り返す.本稿では一般的なモデルを提案し,用いる損失関数の違いや訓練例の与え方が得られる評価関数にどのように影響するかを議論する.さらに,実際に2万を越える特徴で学習させ,強いプログ
2、ラムの評価関数の作成に成功したことを報告する.LearningofEvaluationFunctionsbyGameRecordsinShogiTOMOYUKIKANEKO†andKAZUNORIYAMAGUCHI†Thispaperpresentsageneralframeworkforlearningofevaluationfunctions,basedoncom-parisonofsiblingnodesappearedinalargedatabaseofgamerecords.Intheframework,theweightsofevaluati
3、onfunctionsareadjustedsothatthevalueofthemoveselectedbyhumanplayersbecomehigherthanthatoftheotherlegalmoves,wherethevalueofamoveistheevaluationvalueofthepositionattheleafoftheprincipalvariationafterthemovecomputedbysearch.InourexperimentsinShogi,wecomparedtheeffectivenessoffourkin
4、dsoflossfunctionsaswellasotherparametersintheframework.Then,wereportthattheweightsofmorethan20thousandsoffeaturesweresuccessfullyadjustedinourmethod.評価関数の実用的な調整方法についての注目が集まっ1.はじめにている.保木の手法はプログラムが実際にコンピューゲームプログラミングにおいて評価関数を自動的にタ将棋選手権で優勝していることから有用性は疑う余求めることは重要な研究課題であり広く研究されてき地がない.し
5、かし,計算時間が長くかかる点は今後のた.強いゲームプログラムを作るためには良い評価関研究が期待されている.☆また,他の機械学習の手法数が必要であり,そのためには評価項目の設計と各項との比較についても,興味深いテーマである.本研究目の重みづけが必要である.評価項目とは局面の中ででは,ロジスティック回帰も含めて一般的な枠組で実何に注目するかであり,特徴と呼ばれる.将棋の場合,験を行う.約2万の特徴を用いて実際に強いプログラ駒の損得や玉の危険度などが知られている12).評価関ムの評価関数の作成に成功したことを報告するととも数は複数の評価項目を考慮して総合的に有
6、利・不利をに,損失関数の種類や訓練例の作成方法や学習におけ判定する.一般的に用いられる線形結合の場合は,各る様々な側面を議論する.評価項目の重みの総和が評価値となる.各評価項目の2.関連研究重みは事前に決めておく必要がある.複雑な評価関数において,プログラマが各評価項目に矛盾なく重みをオセロでは多数のパターンの重みを最小二乗法で調設定することは難しい.一方で,将棋の様々な評価項整した評価関数が早くからトップレベルの強さを実現目について自動的な調整を行うことは長らく困難と言している3).これは,局面に対し評価関数がとるべき評われていた.価値の教師を与えて調
7、整するものである.一方,将棋2006年に発表された保木19)の手法では,棋譜に指やチェスのトップレベルのプログラムでは手で調整しされた手を実際に探索が指す方向に重みを調整するこた評価関数が使われていた.その理由の一つは学習のとで1万を越える重みの調整に成功した.それ以来,ための評価値の教師を用意することが難しいことと考†東京大学大学院総合文化研究科GraduateSchoolofArtsandSciences,TheUniversityofTokyo☆2006年のゲームプログラミングワークショップの質疑では,3ヶkaneko@graco.c.u-toky
8、o.ac.jp月程度かけたとのこと.1表1アルゴリズムの比較比較PV(1)棋譜
此文档下载收益归作者所有