渡辺明名人、1秒間に8000万手読むコンピュータを購入しディープラーニング系のソフトも導入(6)
罠を仕掛ける
杉村 大会で勝つためには先に考えさせておいた方がいいんです。あとはコンピュータ将棋は絶対に評価値を間違える局面というのがあるので、そういうところを先に入れておくとハメることができるみたいな。
渡辺 へえ・・・。絶対に間違える? それは短時間だからですか?
杉村 長時間でも場合によっては間違えるみたいなところがあるので。例えば最近は少なくなりましたけど、角換わりの先後同型で△4四歩と突いて▲4五歩・・・。
松本 ああ、それ有名なやつですね。
杉村 ▲4五歩△同歩▲同銀△5五銀▲2四歩△同歩▲2五歩という進行は、コンピュータ将棋では後手の勝率が極めて低いです。それでも△4四歩を突いてしまう穴があったりするので。そういうのを先に入れとくと有利みたいな。
渡辺 僕らが家でやる検討って、1局面につきけっこう止まったりするじゃないですか。ってなった場合、定跡はあまり必要ないって考えなんですかね。早指しじゃないから、どうせ読ませるからみたいな。
杉村 どうなんですかね。1局面で止まっていると、おかしな評価から抜け出せない場合もありますかね。(定跡の話に戻り)定跡の作り方も開発者によって全然違うんですけど。ひとつの方法としては、評価値のみを使った定跡ファイルってあんまりあてにならないので、どっかで打ち切って、どんどん対局させて、それでどこで勘違いするのかっていうのをデータベースにしておいて、その勘違いを突くみたいな定跡作成手法ですね。連続対局をさせて、その棋譜を枝状にしておいて、ここで勘違いするみたいなのを発見して、そこに誘導するみたいな。
渡辺 なんか人間とやってることは似てるな(笑)
杉村 それは、われわれは棋力がまったくないんで自動化するんですけど。そういう感じで。
渡辺 僕らもだいたい、罠を作ってますからね。この局面になったら、たぶん検討をはずれてたらもう間違えちゃうだろうな、みたいな。
杉村 そうですね。「コンピュータ将棋、この局面で間違えるソフトが本当に多い」みたいなのがあるので「そうやって作っておくと有利になりがち」っていう人もいますし「そもそも時間短縮のためだけだから、適当でいいや」という人もいます。
渡辺 はいはい。なんかその「ソフトの定跡」使ってるのって、棋士だと千田君ぐらいしか聞かないような。それが意味がよくわからなくて(笑)
杉村 そうですね。そもそも定跡をデータベースで使っている人が少ないと思うので。
松本 千田さんは自分で作ってるってのがすごいですよね。
杉村 しかもコンピュータ将棋向けに公開もしてくれたから。
渡辺(モニターを見て)おお、見たことない画面だ。
杉村 「ShogiGUI」の中の画面で、定跡ファイルを人間でも見られるような形にしたやつなんですけど、定跡ツリーってのがありまして。それで管理している方がいらっしゃいますね。というか、千田先生なんですけど。
松本 私もそれは使ってないんですけど、やってるうちに自然に操作とか管理方法を覚えられるものですかね。
杉村 そういう気持ちがあれば(笑)
渡辺 たぶんあんまり誰も使ってない・・・(笑)。僕らがやってるのは検討で並べて、戦型ごとに名前をつけて保存していって、検討するときにまたそのファイルを出して、また上書きしてってやり方です。
杉村 確かに棋譜ファイルで管理してる棋士の先生もおられましたね。
渡辺 で、それがどんどん増えてく。
杉村 棋譜ファイルでやってくか、定跡ファイルでやっていくか、研究のスタイルはいろいろあると思います。
松本 棋士が定跡ツリーを作りながら研究しているという話は、確かにあまり聞いたことがないような。
杉村 開発者は、定跡ファイルの作成を自動化してやっている方が多いと思います。連続対局で枝分かれしてるので、検討し忘れてる局面というのは少ないと思います。
(定跡ファイルを開いて)
杉村 「たとえばこんな感じで定跡作れます」という例で、よくある脇システムです。
渡辺 これは誰が作った定跡なんですか?
杉村 私が作りました。当然、私は全然棋力ないんですけど(笑)
渡辺 いやいやそんな(笑)
杉村 本当に棋力はないんです(笑)。こんな感じで連続対局させて勝率をはかって。そうすると「こういうところで将棋ソフトは間違えるんで、これで先手が相当有利です」みたいな定跡が作れる。
松本 素人目には、この局面はまだ矢倉脇システムのよくある序盤にしか見えませんが。
杉村 「採用率」「対局数」「勝率」っていうのが見えるので見てみると、既にこの局面で後手の勝率が15%みたいな。
渡辺 ええっ、そんなに勝てないんですか!?
杉村 それぐらいハメることができると。対コンピュータの話ですけど。なので人間の目で見たらどうというのは教えていただきたいんですけど。
渡辺 人間同士だと、この局面は五分ですよ・・・。
杉村 コンピュータ将棋で、かつ先手側が相手のソフトをハメようとする定跡を作ったら、これぐらいの勝率なんですよね。
渡辺 どこを間違えるんだろう。じゃあちょっと進めてください。前例通りですね、このへんは。・・・あ、わかった! 確かにこの定跡は読ませていくと後手がわるくなっていくんですよ。
杉村 これは(ソフト同士で)3103局も指していて、後手はしばらく最善って言うんですけど・・・。あ、たとえばこういうところですね。この局面ではだいたい△6五馬を最善っていうんです。でも実は34局しか指されていない△8六歩の方が勝率が全然高い。
渡辺 この将棋はあとでよく合流したりするんですけど、でもなんかね、ソフトだと▲1三歩成のタイミングとかもうっかりするんですよ。読ませていくと先手よしにすぐ変えたりする。でも人間同士だとやっぱり互角なんですよ。この前も天彦-梶浦(2021年7月、竜王戦本戦▲佐藤天彦九段-△梶浦宏孝七段)っていうのがあってこの将棋だったんですけど、後手勝ちでした。人間同士だと先手を持って指すの大変なんですよ。囲いがペラペラだから。
杉村(少し進めて)これだと610局で後手勝率5%とかになってるので。これで先手必勝形ですね。
渡辺 これはソフト同士だから先手が勝つんですね。でも人間同士だと先手が勝たないんですよ。なるほどなあ。
ソフトも研究手法も進化する
杉村 さっきの(前のマシンの)将棋所を見させていただいたんですけど、おそらくスレッドの設定とかちょっと甘かったかもしれないんですね。
渡辺 まったくいじってないです。
杉村 じゃあそっちも変えときますか?
渡辺 はい、お願いします。
杉村 (エンジンを見て)水匠を使っていただいてありがとうございます(笑)
渡辺 そこいじるとどれぐらい変わりますか?
杉村 考えるスピードが2倍ぐらい。あとハッシュメモリが足りないですね。これもギリギリまで増やしておいたほうがよくて。ハッシュはけっこう大事でして。局面を保存しておくテーブルなので、これをあふれさせてしまうと、局面を忘れていくんです。なのでときたま変な評価値を出してしまったりとか。水匠は初期設定で1024と上げています。でもそれだと、ちゃんと設定してる水匠には長時間の対局で7割ぐらい負けてもおかしくないかもしれません。
松本 おおお、たしかに倍ぐらいのNPSになった。
渡辺 さっきは300万ぐらいでしたっけ?
杉村 それが600万になったんで、倍ですね。
渡辺 全然使いこなせてなかったんだな(苦笑)。でもたぶんみんな、そんなんですよ。誰に聞いていいのか、わからないから(笑)。みんな藤井君ぐらいしか知らないんだろうな、とは思ってるけど、藤井君に聞くわけにはいかないから(笑)
松本 そりゃそうですね(笑)
杉村 確かに藤井先生は自分でdlshogiの設定もしてるし。
松本 藤井二冠が先手角換わりを久々にやったっていうのは、もちろん将棋界全体のトレンドをどこか反映してるところもあるんだろうし、豊島竜王(叡王)との連戦で戦法のローテーションにまぜるっていうのもあるんだろうけど、やっぱりdlshogiでどこか新しい発見もあったとも推測できますかね。
渡辺 それはありそう。彼はそういうのをインタビューで聞かれると答えてますよね。でもそういう専門的なことを聞ける人って、ほとんどいないじゃないですか。
杉村 私はどなたかの記事で「年末にdlshogiを導入しました」というのは読みましたね。なんで最近DL系が流行りだしたかっていうと(2020年11月の)電竜戦でDLが優勝したので「あ、DLってここまで強くなったんだ」ってことで、開発者はみんなDLに移行したんだけど。その年末に導入してるわけだから。
渡辺 早いね! 見てるんだ。
杉村 導入は難しいはずなんですけどね。
渡辺 いつからそんなにコンピュータに興味持ってたんだろう。奨励会三段のときに千田君に教わったぐらいなんでしょ?
松本 最初の頃は、自宅のリビングに置かれている普通のパソコンを使っていた感じだったと思いますが。そのあとで急速に詳しくなったと。
杉村 そういえばインタビューで「時間があったらコンピュータ将棋を作りたい」とか言われてましたね。
松本 そういえば谷合さん(廣紀四段)が作ってましたね。2日で完成させたとか。
杉村 谷合先生は本当に凄いですよ。
渡辺 YouTubeでやってましたね。
(7月某日、渡辺名人宅にて)