
ポケモンを画像だけでクリアしたFable 5に、同じ条件で倉庫番をやらせてみた
ポケモンを画像だけでクリアしたFable 5に、同じ条件で倉庫番をやらせてみた


ことの発端:ポケモンを「画像だけ」でクリアしたらしい
2026年6月9日に出たAnthropicの新モデル、Claude Fable 5。発表のデモで個人的にいちばん「おっ」となったのが、ゲームをプレイする話でした。
なんでも、補助マップもナビも、ゲーム内部の状態情報も一切ナシ。生のゲーム画面のスクショだけでポケモンFireRedを最後までクリアしたとのこと。これまでのClaudeはポケモンを進めるのにゴテゴテした補助ハーネスが必要だったのに、Fable 5は目で見るだけで完走したそうです。(出典:Anthropic公式発表)
ポケモンを画像だけでクリアできるなら……もっと盤面が単純そうなパズル、倉庫番(Sokoban)だってお手のものなのでは? そう思ったのが、今回のきっかけです。
ねらい:倉庫番でFable 5の実力を見たい
倉庫番って、盤面は小さいしルールも「箱を押してゴールに乗せるだけ」。見た目はめちゃくちゃシンプルです。これならFable 5の賢さがハッキリ見えるはず。ついでに、ひとつ下のクラスにあたるOpus 4.8と並べれば、いい比較にもなりそうです。
というわけで、さっそく環境を組んでみました。
検証環境
仕組みはシンプルです。Node + Playwright でブラウザを自動操作して、
倉庫番の盤面をスクショで撮る
その画像だけをモデルに渡す(盤面のテキスト情報は教えない)
モデルが次の一手をJSONで返す
対応する矢印キーをブラウザに送る
ひたすらループ
という流れ。ポケモンのデモと同じ「画像オンリー」、つまりFableが得意なはずの条件に揃えています。
しかもフェアにいきたいので、人間プレイヤーが持っているのと同じ足場も渡しました。直近の手の履歴(記憶)、undo(取り消し)、思考の深さは両モデルとも effort = high。盤面は固定で比較できるよう、定番セット Microban の1面を使っています。
結果①:Claude Fable 5
Fable 5は、盤面の要素(作業員・箱・ゴール)はちゃんと読み取ります。箱もちゃんと押す。
……押すんですが、「とにかくゴールまで最短で運ぼう」とするだけで、その先を読みません。なので、あっという間に詰みの形を作ってしまって、あとは同じところをグルグル。せっかく用意したundoも、最後まで一度も使いませんでした。
実際のターミナルの様子がこちらです。
[turn 0] right — 作業員は中央付近、緑の箱はゴール済み、茶色の箱は右下… [turn 1] left — 茶色の箱が作業員の真下、目標は左上(列2,行1)… [turn 2] right — 緑の箱はゴール達成済み、茶色の箱は(行4,列3)… [turn 3] left — 茶色の箱は作業員の真下、目標は箱より1列左… [turn 4] down — 茶色の箱が右下、上部の目標へ運びたい… [turn 5] up — 直近の right / left / down がすべて盤面を変えなかった=右も左も下も壁… [turn 6]
おもしろいのが turn 5。「さっきの right・left・down は全部、盤面が動かなかった=壁だ」と自分でちゃんと気づいているんです。気づいているのに、そこから抜け出せずにまた彷徨い始めるという……。
結果②:Claude Opus 4.8
じゃあOpusはどうかというと、こちらは輪をかけてアレで、そもそも箱を押すことすらありませんでした。
おまけに盤面の座標の読みがターンごとにフラフラ。下の壁際がよっぽどお気に入りらしく、そのへんをウロウロして終了です。
[turn 0] right — 作業員(列2,行3)、茶色の箱は右下(列3,行4)… [turn 4] down — 作業員(列2,行4)、茶色の箱がすぐ右… [turn 5] right — 作業員(列2,行5)… [turn 6] right — 作業員(列2,行6)… ← 自己申告の座標がだんだんズレていく [turn 11] undo — 一度だけ取り消しで立て直しを試みる [turn 12]
作業員の位置を「行3 → 行4 → 行5 → 行6」とどんどん読み替えていて、そもそも盤面を正確に把握しきれていない様子。唯一、11手目でundoを1回使ったのが、せめてもの抵抗でした。
比較表
項目 | Claude Fable 5 | Claude Opus 4.8 |
|---|---|---|
箱を押したか | 押した | 押さなかった |
プレイの様子 | ゴールへ一直線→先読みせず即詰み→ループ | 箱に絡まず壁際をウロウロ |
Microban 1面クリア | ✕ | ✕ |
undoの使用 | 0回 | 1回 |
料金(per 100万トークン, 入力/出力) | $10 / $50 | $5 / $25 |
まさかの結論:比較にすらならなかった
そうなんです。両方とも1面でアウト。どっちが賢いか比べる以前の問題でした。Fableのスゴさを語るどころか、土俵にすら上がれなかったわけです。
ちなみにこの1面、実は「すでにゴールに置いてある箱を、一回どかして通路を作る」必要がある作りになっています。人間でも初見だと地味に悩むやつです。両モデルとも、この「一回どかす」という発想にはまったくたどり着けませんでした。
読者の皆さんがモヤると思うので、人間の解答どうぞ
元ゲーマーの筆者がサクッと解く様子をどうぞ。
感想:Fable 5、なんだか「ゲーム初心者」っぽい
今回いちばん感じたことを書かせてください。
子供のころ、初めてポケモン赤をやった時。小学生の自分でも、詰まった記憶ってほとんどないんですよね。そしてFable 5がリザードンだけ強化してゴリ押しで突破したやり方、これ、自分が人生で初めて殿堂入りした時とまったく同じでした(笑)。
つまりポケモンって、ゲーム初心者でもちゃんとクリアできるように作られている。だからこそあれだけ万人に受けて、大ヒットしたんだなあと。改めてすごい設計だと思いました。
逆に、倉庫番みたいに頭を使うパズルは、あの頃は苦手でした。
そう考えると、Fable 5って「ゲーム初心者くらいの感じ」なのかもしれません。寛容なゲームは勢いでクリアできるけど、ガッツリ先読みが要るやつは詰まる。なんだか昔の自分と重なって懐かしい気分になりました。
検証の限界
念のため。今回試したのは Microban 1面だけ(n=1)、しかもクセのある面です。なので「FableやOpusは倉庫番が苦手」と一般化はできません。あくまで「この条件・この面ではクリアできなかった」という話。effortやハーネスの渡し方を変えれば結果は変わるはずです。
おまけ:環境構築(再現したい人向け)
ざっくり手順だけ残しておきます(Mac前提)。
# フォルダを用意してパッケージを入れる mkdir soukoban && cd soukoban npm init -y npm pkg set type=module # import文(ESM)を使うため npm install playwright @anthropic-ai/sdk npx playwright install chromium # APIキーを環境変数にセット(※キーは公開リポジトリやスクショに絶対載せない) export ANTHROPIC_API_KEY="sk-ant-..." # run-online.js を置いて実行(モデル名を変えるだけで比較できる) MODEL=claude-fable-5 node run-online.js MODEL=claude-opus-4-8 node
ハマりどころを2つだけ。
Fable 5 / Opus 4.8 では思考の指定が
thinking: { type: "adaptive" }+output_config: { effort: "high" }です。旧来のthinking: { type: "enabled" }はエラーになります。APIは従量課金です。サブスク(Pro/Max)の無料枠はAPIには効かないので、別途クレジットが必要になります。
クレジット・出典
ゲーム:MeTool Sokoban(https://metool.online/games/sokoban/)
レベルセット:Microban(作者 David W. Skinner)
Fable 5のポケモンFireRedクリア/ビジョンのみハーネス:Anthropic公式発表(https://www.anthropic.com/news/claude-fable-5-mythos-5)
価格:Claude Fable 5 = 入力$10 / 出力$50、Claude Opus 4.8 = 入力$5 / 出力$25(いずれもper 100万トークン)
ことの発端:ポケモンを「画像だけ」でクリアしたらしい
2026年6月9日に出たAnthropicの新モデル、Claude Fable 5。発表のデモで個人的にいちばん「おっ」となったのが、ゲームをプレイする話でした。
なんでも、補助マップもナビも、ゲーム内部の状態情報も一切ナシ。生のゲーム画面のスクショだけでポケモンFireRedを最後までクリアしたとのこと。これまでのClaudeはポケモンを進めるのにゴテゴテした補助ハーネスが必要だったのに、Fable 5は目で見るだけで完走したそうです。(出典:Anthropic公式発表)
ポケモンを画像だけでクリアできるなら……もっと盤面が単純そうなパズル、倉庫番(Sokoban)だってお手のものなのでは? そう思ったのが、今回のきっかけです。
ねらい:倉庫番でFable 5の実力を見たい
倉庫番って、盤面は小さいしルールも「箱を押してゴールに乗せるだけ」。見た目はめちゃくちゃシンプルです。これならFable 5の賢さがハッキリ見えるはず。ついでに、ひとつ下のクラスにあたるOpus 4.8と並べれば、いい比較にもなりそうです。
というわけで、さっそく環境を組んでみました。
検証環境
仕組みはシンプルです。Node + Playwright でブラウザを自動操作して、
倉庫番の盤面をスクショで撮る
その画像だけをモデルに渡す(盤面のテキスト情報は教えない)
モデルが次の一手をJSONで返す
対応する矢印キーをブラウザに送る
ひたすらループ
という流れ。ポケモンのデモと同じ「画像オンリー」、つまりFableが得意なはずの条件に揃えています。
しかもフェアにいきたいので、人間プレイヤーが持っているのと同じ足場も渡しました。直近の手の履歴(記憶)、undo(取り消し)、思考の深さは両モデルとも effort = high。盤面は固定で比較できるよう、定番セット Microban の1面を使っています。
結果①:Claude Fable 5
Fable 5は、盤面の要素(作業員・箱・ゴール)はちゃんと読み取ります。箱もちゃんと押す。
……押すんですが、「とにかくゴールまで最短で運ぼう」とするだけで、その先を読みません。なので、あっという間に詰みの形を作ってしまって、あとは同じところをグルグル。せっかく用意したundoも、最後まで一度も使いませんでした。
実際のターミナルの様子がこちらです。
[turn 0] right — 作業員は中央付近、緑の箱はゴール済み、茶色の箱は右下… [turn 1] left — 茶色の箱が作業員の真下、目標は左上(列2,行1)… [turn 2] right — 緑の箱はゴール達成済み、茶色の箱は(行4,列3)… [turn 3] left — 茶色の箱は作業員の真下、目標は箱より1列左… [turn 4] down — 茶色の箱が右下、上部の目標へ運びたい… [turn 5] up — 直近の right / left / down がすべて盤面を変えなかった=右も左も下も壁… [turn 6]
おもしろいのが turn 5。「さっきの right・left・down は全部、盤面が動かなかった=壁だ」と自分でちゃんと気づいているんです。気づいているのに、そこから抜け出せずにまた彷徨い始めるという……。
結果②:Claude Opus 4.8
じゃあOpusはどうかというと、こちらは輪をかけてアレで、そもそも箱を押すことすらありませんでした。
おまけに盤面の座標の読みがターンごとにフラフラ。下の壁際がよっぽどお気に入りらしく、そのへんをウロウロして終了です。
[turn 0] right — 作業員(列2,行3)、茶色の箱は右下(列3,行4)… [turn 4] down — 作業員(列2,行4)、茶色の箱がすぐ右… [turn 5] right — 作業員(列2,行5)… [turn 6] right — 作業員(列2,行6)… ← 自己申告の座標がだんだんズレていく [turn 11] undo — 一度だけ取り消しで立て直しを試みる [turn 12]
作業員の位置を「行3 → 行4 → 行5 → 行6」とどんどん読み替えていて、そもそも盤面を正確に把握しきれていない様子。唯一、11手目でundoを1回使ったのが、せめてもの抵抗でした。
比較表
項目 | Claude Fable 5 | Claude Opus 4.8 |
|---|---|---|
箱を押したか | 押した | 押さなかった |
プレイの様子 | ゴールへ一直線→先読みせず即詰み→ループ | 箱に絡まず壁際をウロウロ |
Microban 1面クリア | ✕ | ✕ |
undoの使用 | 0回 | 1回 |
料金(per 100万トークン, 入力/出力) | $10 / $50 | $5 / $25 |
まさかの結論:比較にすらならなかった
そうなんです。両方とも1面でアウト。どっちが賢いか比べる以前の問題でした。Fableのスゴさを語るどころか、土俵にすら上がれなかったわけです。
ちなみにこの1面、実は「すでにゴールに置いてある箱を、一回どかして通路を作る」必要がある作りになっています。人間でも初見だと地味に悩むやつです。両モデルとも、この「一回どかす」という発想にはまったくたどり着けませんでした。
読者の皆さんがモヤると思うので、人間の解答どうぞ
元ゲーマーの筆者がサクッと解く様子をどうぞ。
感想:Fable 5、なんだか「ゲーム初心者」っぽい
今回いちばん感じたことを書かせてください。
子供のころ、初めてポケモン赤をやった時。小学生の自分でも、詰まった記憶ってほとんどないんですよね。そしてFable 5がリザードンだけ強化してゴリ押しで突破したやり方、これ、自分が人生で初めて殿堂入りした時とまったく同じでした(笑)。
つまりポケモンって、ゲーム初心者でもちゃんとクリアできるように作られている。だからこそあれだけ万人に受けて、大ヒットしたんだなあと。改めてすごい設計だと思いました。
逆に、倉庫番みたいに頭を使うパズルは、あの頃は苦手でした。
そう考えると、Fable 5って「ゲーム初心者くらいの感じ」なのかもしれません。寛容なゲームは勢いでクリアできるけど、ガッツリ先読みが要るやつは詰まる。なんだか昔の自分と重なって懐かしい気分になりました。
検証の限界
念のため。今回試したのは Microban 1面だけ(n=1)、しかもクセのある面です。なので「FableやOpusは倉庫番が苦手」と一般化はできません。あくまで「この条件・この面ではクリアできなかった」という話。effortやハーネスの渡し方を変えれば結果は変わるはずです。
おまけ:環境構築(再現したい人向け)
ざっくり手順だけ残しておきます(Mac前提)。
# フォルダを用意してパッケージを入れる mkdir soukoban && cd soukoban npm init -y npm pkg set type=module # import文(ESM)を使うため npm install playwright @anthropic-ai/sdk npx playwright install chromium # APIキーを環境変数にセット(※キーは公開リポジトリやスクショに絶対載せない) export ANTHROPIC_API_KEY="sk-ant-..." # run-online.js を置いて実行(モデル名を変えるだけで比較できる) MODEL=claude-fable-5 node run-online.js MODEL=claude-opus-4-8 node
ハマりどころを2つだけ。
Fable 5 / Opus 4.8 では思考の指定が
thinking: { type: "adaptive" }+output_config: { effort: "high" }です。旧来のthinking: { type: "enabled" }はエラーになります。APIは従量課金です。サブスク(Pro/Max)の無料枠はAPIには効かないので、別途クレジットが必要になります。
クレジット・出典
ゲーム:MeTool Sokoban(https://metool.online/games/sokoban/)
レベルセット:Microban(作者 David W. Skinner)
Fable 5のポケモンFireRedクリア/ビジョンのみハーネス:Anthropic公式発表(https://www.anthropic.com/news/claude-fable-5-mythos-5)
価格:Claude Fable 5 = 入力$10 / 出力$50、Claude Opus 4.8 = 入力$5 / 出力$25(いずれもper 100万トークン)



