４．将棋における人間とコンピューターの戦い of 谷本誠一将棋サロン

LinkIcon

将棋論文

４．将棋における人間とコンピューターの戦い

２０１０年４月５日

谷本誠一

　ＮＨＫで放送された「運命の一手」を今視聴しました。これは、ボナンザVS渡辺竜王世紀の対決ドキュメンタリーです。感動して涙しましたね。
　先ず、コンピューターの棋力向上には目を見張りました。プログラム制作者に心より敬意を表します。そして、最後にプログラム制作者のコメントが素晴らしかったです。「人間の知性の素晴らしさを見せてもらいました」。プログラマーの謙虚さ、人間の知性の素晴らしさ、コンピューターの読破力に感動しました。
　さて、ここで解ったことは、コンピューターの局面判断を点数評価しているところです。ある局面まで高い点数評価を下していても、次の一手を渡辺竜王に指された瞬間、マイナス評価に急展開しておりました。つまり、一手を選択する際に、どこまで先を読めるかが鍵となっています。
　しらみつぶしに指し手を分岐させて全てを読む方法、即ち全幅検索というソフトの思考方法では、縦直線の読みの終結点である先の先が短縮されてしまう。その一手先まで読めていれば、マイナス評価になり、だから戻って最初の一手は選択しなかった訳です。
　一方、選択検索という従来の手法では、メモリの関係で先の先はより多く読める反面、選択の範囲から逸脱させたものに好手があるかも知れず、はなから見逃してしまうことがあるということでした。因みに人間の思考方法は、この選択検索です。これがコンピュータよりかなり優れているのが人間です。これは内藤國雄九段がよく言われています。
　ボナンザは渡辺竜王と対戦した時点で、この全幅検索と選択検索の双方を組み合わせたものに進化させていた訳ですが、得意の終盤になると、全幅検索に移行したのでしょう。先の先を見通すことに限界があったものと推察されます。
　但し、これは時間的制約があるからに他なりません。この度の対戦では持ち時間を各２時間に設定されていましたから、もし６時間だと、逆にボナンザが、渡辺竜王の勝利を決定づけた運命の一手である△３九龍を発見し、それ故に△１五金に対して実際に選択した▲２四歩を見送り、正着の▲２七香を発見していたものと推察されます。つまり、渡辺竜王の勝利は、敗北と隣合わせだったということですね。ということは、今後開発競争によって、読みのスピード化が更に進むでしょうから、今後プロ棋士最高峰をコンピューターが破ることは時間の問題でしょう。
　私見ですが、渡辺竜王の△３五銀から△４六香の攻めは無理だった訳で、それを誘発したボナンザの▲６四歩が光りますね。番組ではボナンザの思考過程が披露され、時間の制約から▲６四歩か▲８一馬の選択において、見切り発車で前者を選択したということでした。ということは、棋譜を精査した訳ではありませんが、どこかで△９二香▲９一角成の交換ができていれば、▲９一馬が▲９二馬に代わっていますので、▲６四歩はなく▲８一馬とせざるを得なかったものと推察されます。
　この▲６四歩の意図は、△同歩なら▲８一馬で馬の働きがよいということです。単に▲８一馬ならその瞬間馬が遊びます。だから渡辺竜王は△６四同歩を効かされとみて、９一馬筋が止まった瞬間、△３５銀と攻めに出たのです。それに対してボナンザの間髪入れずの▲３六歩。これが渡辺竜王をして「強過ぎる」と言わしめた手でした。これにより、▲６三歩成の後、９一馬が遠く先手の穴熊玉を守る生命線になるのでした。つまり、ボナンザが見切り発車で選択した▲６四歩は、渡辺竜王の焦りを誘い、勝っていれば勝因となるところだったのです。
　ところで以前、女流棋士がプロ棋士を破ることは時間の問題とされ、中井女流が男性棋士の池田五段を破ったことが大ニュースとなりましたね。それ以上の劇的瞬間が近々必ず訪れるでしょう。その理由は最高峰のコンピューターは悪手を指す確率がプロ棋士に比べて少ないからです。プロ棋士も人間です。時にはポカを指すことだってありますよね。あの羽生先生でも一手詰の頓死をくらったりすることがある訳ですよ。ところが高性能コンピューターが自玉の頓死を見落とすなんてことはまずあり得ないでしょう。だから、必ずそのＸデーは訪れるという訳です。
　ただ、プロ棋士が初めて敗れたからと言って、コンピューターがプロ棋士を凌駕したこと、即ち強くなったということでは決してありません。たまたま、プロ棋士が悪手を指して形勢を損ね、ずるずると敗退したというだけです。
　実は、番組の中で解ったのですが、ボナンザは序盤の指し手選択を、プロ棋士の過去のデータでの勝敗確率に頼っていました。例えば、或る局面になった時、過去の同一局面を瞬時に検索し、その中から、最も勝率の高い指し手を選択していたのです。これはどういうことかと申しますと、コンピューターと言えども、変化無限の将棋を序盤から全て読むことは不可能ということだと感じました。だから序盤は過去のデータに頼り切っている。　将棋の序盤は個性の戦いであって、どう指しても一局の将棋ということは多々あります。これがチェスや他国の将棋と日本将棋が異なる決定的な違いですよね。将棋の序盤はファジーであって、理詰めで結論が出せるものでは決してない、ということです。その原因は、日本将棋のみに認められている持駒再使用ルールであることは言うまでもありません。
　ボナンザには江戸時代の棋士の棋譜から、近年の日本将棋連盟の棋譜を合計約５０万局インプットしています。それにしてもよくこれだけの棋譜をインプットしましたね。それをデータベース化して序盤は確率検索をしているということでした。
　そしてもう一つ解ったことは、データベースにない新局面が出現すると、とたんに長考が目立つということなんですね。未経験だと、そこから実力で読みを進めて最善手を選択せねばなりませんから、時間がかかるということです。後は未経験の局面を指した後、それを自らの体験として集積する、いわゆる学習能力がどの程度あるかが、コンピューター進歩の鍵となるでしょう。この学習能力は、人間の方が圧倒的に勝っていると思われるからです。コンピューターと対戦したことのある人ならよく解ると思います。以前同様の局面で負けた場合は、その経験則を元に、人間なら工夫する訳ですよ。ところがコンピューターが過去の負けを活用して、手を工夫し、新手を創造することができるのかと言いますと、この部分は最も苦手な部分だと思われます。
　それから、読みを打ち切った時点での各枝葉の終結点の形勢判断を点数評価していますが、この形勢判断はあくまで人間がプログラムするので、本当に正しいかどうか疑問だと感じました。同じプロ棋士同士でも形勢判断が分かれるわけですから、これを真に判断するためには、全ての枝葉において詰みの局面まで読破する必要があります。これができるようになると確実にコンピューターは、プロ棋士に対して勝率が上がって来ることでしょう。
　そこで終盤は、人間ではいくらプロ棋士と言えども歯が立たなくなる訳です。では、早晩人間がコンピューターに完全凌駕されてしまうかと申しますと、私はそうは考えておりません。
　序盤では今まで出現していなかった、言い換えればボナンザにおいてデータベース化されていなかった局面は、これからどんどん現れると思います。近年において、これまで定跡ではあり得なかった指し手が新手として登場し、升田幸三賞を受賞したりしていますよね。具体的に近年において、一部を挙げてみましょう。
①初手▲７六歩に対する△３二飛（今泉元奨励会三段流）
②初手から▲７六歩△３四歩▲２六歩△９四歩▲２五歩△９五歩（佐藤康光流）
③横歩取り中座飛車、それに対し山崎流や新山崎流、今後も新手が出現する可能性大
④初手より▲７六歩△３四歩▲７五歩△８四歩▲７八飛△８五歩▲４八玉△６二銀▲７四歩△７二金▲７五飛（久保利明流）
　これらの棋譜はデータ不足のため、過去のデータから勝率の最もよい手を点数評価して選択するという手法は、コンピューターの限界だと考えます。つまり、過去のデータでこの局面に対し、最も勝率の高い手をコンピューターが選択したとしても、その後更に新手が出現し、そのデータが崩壊することなんてことはいくらでもあると予想されるからです。
　他にも序盤には未開拓の分野が沢山あり、今後もどんどん探求されることでしょう。このようないわゆる手将棋（定跡にない将棋）はコンピューターは苦手かも知れませんね。
　また、初手より▲７六歩△３四歩▲７五歩△８八角成▲同飛△６五角▲７六角△４二玉▲３八銀△５四角▲７八飛△７六角▲同飛△２八角▲５五角△３三桂▲７四歩△同歩▲８二角成△同銀▲１八飛△３九角打の局面を想定してみられて下さい。これは先頃上海で行われた前期棋王戦の、先手久保利明棋王VS佐藤康光九段戦です。この局面を将棋連盟の棋譜データベースで検索すると、既に過去に例がないとのことです。ここからプロ間でどちらが有利なのか、今後試行錯誤が繰り返されると、それをボナンザに初めて棋譜入力がされ、データ構築ができるという訳です。
　ということは、人間が先だって試行錯誤の実戦や研究を経て新定跡を構築して、それがないとコンピューターもデータを蓄積できないということなのです。しかも将棋というのは、日進月歩ですから、科学と同様に昔の理論がどんどん塗り替えられて新定跡に進化します。
　加えてその過程において、過去どちらかが有利と結論のようなものが出た局面も復活することはよくあることです。例えば角換わり相腰掛け銀先後同桂の▲７九玉・△３一玉型では、昔は升田定跡で先手よしと長い間思われて来ましたが、その後新手が続々出現し、定跡が急激に進歩しています。というのも、升田定跡での指し手は、当時の一流棋士が指したものだから、最善手順と考えられていたため、途中の変化が掘り下げられて研究されて来なかったのでした。ところが近年それに懐疑を抱いた若手棋士達が研究し、実戦に採り入れることで、これまで知られていなかった変化手順が続々開発されたのです。
　もし升田定跡で先手よし、だけのデータしかない時代でしたら、それをインプットしたところで、コンピューターの形勢判断もそのようになったでありましょう。つまり、定跡をコンピュータに教えているのは、とりも直さず人間自身です。だから人間による将棋の戦術や技術、ひいては定跡の確立がないと、コンピューターの進歩も限界があるということなのです。
　プロ棋士とコンピューターの公式戦は、近年始まったばかりです。いずれプロ棋士対コンピューターの戦いは、人間が勝ったり、負けたりということになるでしょうが、だからと言って、コンピューターが人間を凌駕し、完全勝利できる時代が来るかというと、それは不可能に近いのではないでしょうか？つまり、コンピューターがプロ棋士との対戦で勝利を収めるということと、コンピューターが人間を凌駕するというのは、別次元の話だと考えている次第です。
もう一つ付け加えますと、後手一手損角換わりのことに触れてみたいと思います。
　これは理論上あり得ない手として、長い将棋の歴史において、悪手の烙印を押され、誰も顧みなかった訳です。
　ある人は、先手が咎める最善手順をまだ発見できていないだけで、コンピューターだったら、それを咎めて先手よしに導くのではないかと、思われる向きもあるでしょう。この考えは、プロ棋士の中にもかなりおられるものと思います。その証拠に、この指し方に嫌悪感を示して、決して指さない棋士も多々存在するからに他なりません。尤も深く研究していないと、相手の研究範囲に嵌ってしまうので、敢えて後手番の際その戦法を採用しないこともあるでしょう。
　ただ、この戦法の根底にあるものは、角交換する将棋は指し手を進めるほど駒が前進するため、その結果自陣に角の打ち込むスキが生じ易いという、考えがあるのです。将棋は必ずしも指した方が有利になるとは限らない、そのような単純なゲームではないと、以前より一層考えられ始めたのです。羽生三冠王をして、「将棋の指し手は全て悪手である」と言わしめています。これは大げさではありますが、特に後手番一手損角換わり戦法を見ますと、この言葉に含蓄されている意味合いがよく解って来ます。
　この手損してまでも角を後手番で交換する理由として、飛先を２手進めている先手に対し、１手で止めている後手側から見れば、そのことで却って先手の攻めを受け易くしたり、反撃し易くしているというのです。例えば角換わり相腰掛け銀の同型で、木村定跡や升田定跡が、後手が△８五桂の余地がある一点で通じなくなるのです。だから先手は他の攻め方を模索する必要があります。
　実はこの後手番一手損角換わりのルーツは、今から３０年ほど前に遡ります。角換わり相腰掛け銀の戦いで、木村定跡や升田定跡に乗らないように、後手が同型を避け、専守防衛策を採った時代がありました。具体的には、△７三桂の代わりに△４三金右と指すのです。そうなったら先手は攻め潰すことができますか？と、問うているのです。そこで先手が▲２六角と手放し、▲４五歩を狙うと△４二金寄と５三地点を強化して、▲４五歩△同歩▲同桂△４四銀▲同角△同金▲５三桂成を防ぎます。それで攻め切る自信がないと、▲６八金右と固めたり▲４八飛とするのですが、後手も△３二玉と手待ちをする。以後は△２二玉～△３二玉を繰り返し、後手番だから千日手歓迎という思想です。
　羽生三冠王の先ほどの名言は、一手多く指すことが必ずしもプラスに働くとは限らないという意味です。即ち局面が飽和状態になった時、この状態が最善形なので、どんな手を指しても最善形を崩してしまう、ましてや攻めたら無理攻めとなる場合は、パスした方がよい訳です。そのパスの方法がないケースが将棋では多々あるのです。相掛かりの場合は、飛先交換をして最善形を崩さすに手待ちする、即ちパスすることができますが、多くの戦型ではそれができません。それで千日手が出現する訳です。
　話を元に戻しますと、角換わり相腰掛け銀における後手の手待ち戦術の対策として、先手は新たな攻め方の開発が課題となりました。そこで私の兄弟子だった東和男現七段が、飛先を２六歩で止めたまま▲３七桂の形で▲２八角の自陣角の手法を開発されました。この手法の発見で、角換わり相腰掛け銀は息を吹き返したのです。その流れの中で、後手番一手損角換わり戦法が近年誕生したのでした。
　このような戦術や新手の開発は、コンピューターには最も苦手な分野と想像されます。将棋は今後も、新定跡がどんどん誕生し、それを打ち破る手段が出ると、またそれを打ち破る手が開発される、というように技術の進歩は留まるところを知らないでしょう。ここが人間しかできない、素晴らしい分野だと考えています。
　そこで一手損角換わりが猛威を奮い出しますと、先手は腰掛け銀ではなく、後手の手の遅れを咎めようと、棒銀戦法や早繰り銀戦法が見直されて来ました。それに対する後手の対策がまた日進月歩している状況です。　
　コンピューターは、この後手一手損角換わりの手法を悪手とみているのか、どうなのか、非常に興味がありますね。ただ、この戦型での棋譜を人間がインプットしているのですから、その時々の局面における勝率の高い手を選択するのがコンピューターの手法ではないでしょうか？

ページトップへ

LinkIcon