mgudn's

髷であり曲げでもある。

【将棋】　局後学習と言う名の幻想

電王戦

やねうら王というソフトに搭載される局後学習というプログラムが話題だ。

アイデアとして秀逸だと思うし。

但し誤解を産んでいるプログラムであるとも思う。

電王戦の様な短期の貸し出しに対する対抗策としては良く出来ている。

ところが、敗着となった手を避けて次は同じルートを通らないと言うのは

一見強くなる様に思われるが、それを認定するのが誰なのか？

でかなり違う。

人間（プロ棋士レベル）ならそもそも定跡の入れ方を戦型別にやれば良く

ソフトが自動で修正するのであれば、評価関数や探索の深さを変える事が出来ない事になる。

　（評価を変えればそもそもその局面にならなかったり、候補として違う手が上位に来る

　　探索が深くなれば評価も変わるし候補手も変わる）

ガタッっと評価が下がった指し手を敗着と認定するとしても、

どこまで遡って手を変えるのか？というのも非常に悩ましい問題である。

仮に、数兆局単位で集計した場合はかなり前に遡る事になりそうだしね。

まあ、問題点はありつつも、現在のコンピューターが自動で定跡を作る事が出来る

という意味では非常に興味深いのも確かで、これは大学とかの研究者向きの

プログラムなんだろうなぁ～と感じている。

局後学習を利用して、それなりの手数までコンピューターが作り上げた定跡データを

別の（新しいＶｅｒ．の）ソフトに搭載するのも面白い試みだと思う。

やねうら王氏が目指している方向としてはこちらだと思うのだが、

結局、集計をどこで止めるのかという問題は付いて回るので

そこに人為的な力が加わるのは可能な限り避けて欲しいとは思う。

イメージ的にアニメやマンガのような一度見た技は通用しないぜ！

というようなものではなく、コンピューターが独自に新たな定跡を作る

というプログラムなので、変な勘違いはしないようにｗ