ポケモンを画像だけでクリアしたFable 5に、同じ条件で倉庫番をやらせてみた

ポケモンを画像だけでクリアしたFable 5に、同じ条件で倉庫番をやらせてみた

ことの発端:ポケモンを「画像だけ」でクリアしたらしい

2026年6月9日に出たAnthropicの新モデル、Claude Fable 5。発表のデモで個人的にいちばん「おっ」となったのが、ゲームをプレイする話でした。

なんでも、補助マップもナビも、ゲーム内部の状態情報も一切ナシ。生のゲーム画面のスクショだけでポケモンFireRedを最後までクリアしたとのこと。これまでのClaudeはポケモンを進めるのにゴテゴテした補助ハーネスが必要だったのに、Fable 5は目で見るだけで完走したそうです。(出典:Anthropic公式発表)

ポケモンを画像だけでクリアできるなら……もっと盤面が単純そうなパズル、倉庫番(Sokoban)だってお手のものなのでは? そう思ったのが、今回のきっかけです。

ねらい:倉庫番でFable 5の実力を見たい

倉庫番って、盤面は小さいしルールも「箱を押してゴールに乗せるだけ」。見た目はめちゃくちゃシンプルです。これならFable 5の賢さがハッキリ見えるはず。ついでに、ひとつ下のクラスにあたるOpus 4.8と並べれば、いい比較にもなりそうです。

というわけで、さっそく環境を組んでみました。

検証環境

仕組みはシンプルです。Node + Playwright でブラウザを自動操作して、

  1. 倉庫番の盤面をスクショで撮る

  2. その画像だけをモデルに渡す(盤面のテキスト情報は教えない)

  3. モデルが次の一手をJSONで返す

  4. 対応する矢印キーをブラウザに送る

  5. ひたすらループ

という流れ。ポケモンのデモと同じ「画像オンリー」、つまりFableが得意なはずの条件に揃えています。

しかもフェアにいきたいので、人間プレイヤーが持っているのと同じ足場も渡しました。直近の手の履歴(記憶)、undo(取り消し)、思考の深さは両モデルとも effort = high。盤面は固定で比較できるよう、定番セット Microban の1面を使っています。

結果①:Claude Fable 5

Fable 5は、盤面の要素(作業員・箱・ゴール)はちゃんと読み取ります。箱もちゃんと押す。

……押すんですが、「とにかくゴールまで最短で運ぼう」とするだけで、その先を読みません。なので、あっという間に詰みの形を作ってしまって、あとは同じところをグルグル。せっかく用意したundoも、最後まで一度も使いませんでした。

実際のターミナルの様子がこちらです。

[turn 0] right — 作業員は中央付近、緑の箱はゴール済み、茶色の箱は右下…
[turn 1] left  — 茶色の箱が作業員の真下、目標は左上(列2,行1)…
[turn 2] right — 緑の箱はゴール達成済み、茶色の箱は(行4,列3)…
[turn 3] left  — 茶色の箱は作業員の真下、目標は箱より1列左…
[turn 4] down  — 茶色の箱が右下、上部の目標へ運びたい…
[turn 5] up    — 直近の right / left / down がすべて盤面を変えなかった=右も左も下も壁…
[turn 6]

おもしろいのが turn 5。「さっきの right・left・down は全部、盤面が動かなかった=壁だ」と自分でちゃんと気づいているんです。気づいているのに、そこから抜け出せずにまた彷徨い始めるという……。

結果②:Claude Opus 4.8

じゃあOpusはどうかというと、こちらは輪をかけてアレで、そもそも箱を押すことすらありませんでした

おまけに盤面の座標の読みがターンごとにフラフラ。下の壁際がよっぽどお気に入りらしく、そのへんをウロウロして終了です。

[turn 0]  right — 作業員(列2,行3)、茶色の箱は右下(列3,行4)…
[turn 4]  down  — 作業員(列2,行4)、茶色の箱がすぐ右…
[turn 5]  right — 作業員(列2,行5)…
[turn 6]  right — 作業員(列2,行6)…   ← 自己申告の座標がだんだんズレていく
[turn 11] undo  — 一度だけ取り消しで立て直しを試みる
[turn 12]

作業員の位置を「行3 → 行4 → 行5 → 行6」とどんどん読み替えていて、そもそも盤面を正確に把握しきれていない様子。唯一、11手目でundoを1回使ったのが、せめてもの抵抗でした。

比較表

項目

Claude Fable 5

Claude Opus 4.8

箱を押したか

押した

押さなかった

プレイの様子

ゴールへ一直線→先読みせず即詰み→ループ

箱に絡まず壁際をウロウロ

Microban 1面クリア

undoの使用

0回

1回

料金(per 100万トークン, 入力/出力)

$10 / $50

$5 / $25

まさかの結論:比較にすらならなかった

そうなんです。両方とも1面でアウト。どっちが賢いか比べる以前の問題でした。Fableのスゴさを語るどころか、土俵にすら上がれなかったわけです。

ちなみにこの1面、実は「すでにゴールに置いてある箱を、一回どかして通路を作る」必要がある作りになっています。人間でも初見だと地味に悩むやつです。両モデルとも、この「一回どかす」という発想にはまったくたどり着けませんでした。

読者の皆さんがモヤると思うので、人間の解答どうぞ

元ゲーマーの筆者がサクッと解く様子をどうぞ。

感想:Fable 5、なんだか「ゲーム初心者」っぽい

今回いちばん感じたことを書かせてください。

子供のころ、初めてポケモン赤をやった時。小学生の自分でも、詰まった記憶ってほとんどないんですよね。そしてFable 5がリザードンだけ強化してゴリ押しで突破したやり方、これ、自分が人生で初めて殿堂入りした時とまったく同じでした(笑)。

つまりポケモンって、ゲーム初心者でもちゃんとクリアできるように作られている。だからこそあれだけ万人に受けて、大ヒットしたんだなあと。改めてすごい設計だと思いました。

逆に、倉庫番みたいに頭を使うパズルは、あの頃は苦手でした。

そう考えると、Fable 5って「ゲーム初心者くらいの感じ」なのかもしれません。寛容なゲームは勢いでクリアできるけど、ガッツリ先読みが要るやつは詰まる。なんだか昔の自分と重なって懐かしい気分になりました。

検証の限界

念のため。今回試したのは Microban 1面だけ(n=1)、しかもクセのある面です。なので「FableやOpusは倉庫番が苦手」と一般化はできません。あくまで「この条件・この面ではクリアできなかった」という話。effortやハーネスの渡し方を変えれば結果は変わるはずです。

おまけ:環境構築(再現したい人向け)

ざっくり手順だけ残しておきます(Mac前提)。

# フォルダを用意してパッケージを入れる
mkdir soukoban && cd soukoban
npm init -y
npm pkg set type=module          # import文(ESM)を使うため
npm install playwright @anthropic-ai/sdk
npx playwright install chromium

# APIキーを環境変数にセット(※キーは公開リポジトリやスクショに絶対載せない)
export ANTHROPIC_API_KEY="sk-ant-..."

# run-online.js を置いて実行(モデル名を変えるだけで比較できる)
MODEL=claude-fable-5  node run-online.js
MODEL=claude-opus-4-8 node

ハマりどころを2つだけ。

  • Fable 5 / Opus 4.8 では思考の指定が thinking: { type: "adaptive" }output_config: { effort: "high" } です。旧来の thinking: { type: "enabled" } はエラーになります。

  • APIは従量課金です。サブスク(Pro/Max)の無料枠はAPIには効かないので、別途クレジットが必要になります。

クレジット・出典

  • ゲーム:MeTool Sokoban(https://metool.online/games/sokoban/)

  • レベルセット:Microban(作者 David W. Skinner)

  • Fable 5のポケモンFireRedクリア/ビジョンのみハーネス:Anthropic公式発表(https://www.anthropic.com/news/claude-fable-5-mythos-5)

  • 価格:Claude Fable 5 = 入力$10 / 出力$50、Claude Opus 4.8 = 入力$5 / 出力$25(いずれもper 100万トークン)

ことの発端:ポケモンを「画像だけ」でクリアしたらしい

2026年6月9日に出たAnthropicの新モデル、Claude Fable 5。発表のデモで個人的にいちばん「おっ」となったのが、ゲームをプレイする話でした。

なんでも、補助マップもナビも、ゲーム内部の状態情報も一切ナシ。生のゲーム画面のスクショだけでポケモンFireRedを最後までクリアしたとのこと。これまでのClaudeはポケモンを進めるのにゴテゴテした補助ハーネスが必要だったのに、Fable 5は目で見るだけで完走したそうです。(出典:Anthropic公式発表)

ポケモンを画像だけでクリアできるなら……もっと盤面が単純そうなパズル、倉庫番(Sokoban)だってお手のものなのでは? そう思ったのが、今回のきっかけです。

ねらい:倉庫番でFable 5の実力を見たい

倉庫番って、盤面は小さいしルールも「箱を押してゴールに乗せるだけ」。見た目はめちゃくちゃシンプルです。これならFable 5の賢さがハッキリ見えるはず。ついでに、ひとつ下のクラスにあたるOpus 4.8と並べれば、いい比較にもなりそうです。

というわけで、さっそく環境を組んでみました。

検証環境

仕組みはシンプルです。Node + Playwright でブラウザを自動操作して、

  1. 倉庫番の盤面をスクショで撮る

  2. その画像だけをモデルに渡す(盤面のテキスト情報は教えない)

  3. モデルが次の一手をJSONで返す

  4. 対応する矢印キーをブラウザに送る

  5. ひたすらループ

という流れ。ポケモンのデモと同じ「画像オンリー」、つまりFableが得意なはずの条件に揃えています。

しかもフェアにいきたいので、人間プレイヤーが持っているのと同じ足場も渡しました。直近の手の履歴(記憶)、undo(取り消し)、思考の深さは両モデルとも effort = high。盤面は固定で比較できるよう、定番セット Microban の1面を使っています。

結果①:Claude Fable 5

Fable 5は、盤面の要素(作業員・箱・ゴール)はちゃんと読み取ります。箱もちゃんと押す。

……押すんですが、「とにかくゴールまで最短で運ぼう」とするだけで、その先を読みません。なので、あっという間に詰みの形を作ってしまって、あとは同じところをグルグル。せっかく用意したundoも、最後まで一度も使いませんでした。

実際のターミナルの様子がこちらです。

[turn 0] right — 作業員は中央付近、緑の箱はゴール済み、茶色の箱は右下…
[turn 1] left  — 茶色の箱が作業員の真下、目標は左上(列2,行1)…
[turn 2] right — 緑の箱はゴール達成済み、茶色の箱は(行4,列3)…
[turn 3] left  — 茶色の箱は作業員の真下、目標は箱より1列左…
[turn 4] down  — 茶色の箱が右下、上部の目標へ運びたい…
[turn 5] up    — 直近の right / left / down がすべて盤面を変えなかった=右も左も下も壁…
[turn 6]

おもしろいのが turn 5。「さっきの right・left・down は全部、盤面が動かなかった=壁だ」と自分でちゃんと気づいているんです。気づいているのに、そこから抜け出せずにまた彷徨い始めるという……。

結果②:Claude Opus 4.8

じゃあOpusはどうかというと、こちらは輪をかけてアレで、そもそも箱を押すことすらありませんでした

おまけに盤面の座標の読みがターンごとにフラフラ。下の壁際がよっぽどお気に入りらしく、そのへんをウロウロして終了です。

[turn 0]  right — 作業員(列2,行3)、茶色の箱は右下(列3,行4)…
[turn 4]  down  — 作業員(列2,行4)、茶色の箱がすぐ右…
[turn 5]  right — 作業員(列2,行5)…
[turn 6]  right — 作業員(列2,行6)…   ← 自己申告の座標がだんだんズレていく
[turn 11] undo  — 一度だけ取り消しで立て直しを試みる
[turn 12]

作業員の位置を「行3 → 行4 → 行5 → 行6」とどんどん読み替えていて、そもそも盤面を正確に把握しきれていない様子。唯一、11手目でundoを1回使ったのが、せめてもの抵抗でした。

比較表

項目

Claude Fable 5

Claude Opus 4.8

箱を押したか

押した

押さなかった

プレイの様子

ゴールへ一直線→先読みせず即詰み→ループ

箱に絡まず壁際をウロウロ

Microban 1面クリア

undoの使用

0回

1回

料金(per 100万トークン, 入力/出力)

$10 / $50

$5 / $25

まさかの結論:比較にすらならなかった

そうなんです。両方とも1面でアウト。どっちが賢いか比べる以前の問題でした。Fableのスゴさを語るどころか、土俵にすら上がれなかったわけです。

ちなみにこの1面、実は「すでにゴールに置いてある箱を、一回どかして通路を作る」必要がある作りになっています。人間でも初見だと地味に悩むやつです。両モデルとも、この「一回どかす」という発想にはまったくたどり着けませんでした。

読者の皆さんがモヤると思うので、人間の解答どうぞ

元ゲーマーの筆者がサクッと解く様子をどうぞ。

感想:Fable 5、なんだか「ゲーム初心者」っぽい

今回いちばん感じたことを書かせてください。

子供のころ、初めてポケモン赤をやった時。小学生の自分でも、詰まった記憶ってほとんどないんですよね。そしてFable 5がリザードンだけ強化してゴリ押しで突破したやり方、これ、自分が人生で初めて殿堂入りした時とまったく同じでした(笑)。

つまりポケモンって、ゲーム初心者でもちゃんとクリアできるように作られている。だからこそあれだけ万人に受けて、大ヒットしたんだなあと。改めてすごい設計だと思いました。

逆に、倉庫番みたいに頭を使うパズルは、あの頃は苦手でした。

そう考えると、Fable 5って「ゲーム初心者くらいの感じ」なのかもしれません。寛容なゲームは勢いでクリアできるけど、ガッツリ先読みが要るやつは詰まる。なんだか昔の自分と重なって懐かしい気分になりました。

検証の限界

念のため。今回試したのは Microban 1面だけ(n=1)、しかもクセのある面です。なので「FableやOpusは倉庫番が苦手」と一般化はできません。あくまで「この条件・この面ではクリアできなかった」という話。effortやハーネスの渡し方を変えれば結果は変わるはずです。

おまけ:環境構築(再現したい人向け)

ざっくり手順だけ残しておきます(Mac前提)。

# フォルダを用意してパッケージを入れる
mkdir soukoban && cd soukoban
npm init -y
npm pkg set type=module          # import文(ESM)を使うため
npm install playwright @anthropic-ai/sdk
npx playwright install chromium

# APIキーを環境変数にセット(※キーは公開リポジトリやスクショに絶対載せない)
export ANTHROPIC_API_KEY="sk-ant-..."

# run-online.js を置いて実行(モデル名を変えるだけで比較できる)
MODEL=claude-fable-5  node run-online.js
MODEL=claude-opus-4-8 node

ハマりどころを2つだけ。

  • Fable 5 / Opus 4.8 では思考の指定が thinking: { type: "adaptive" }output_config: { effort: "high" } です。旧来の thinking: { type: "enabled" } はエラーになります。

  • APIは従量課金です。サブスク(Pro/Max)の無料枠はAPIには効かないので、別途クレジットが必要になります。

クレジット・出典

  • ゲーム:MeTool Sokoban(https://metool.online/games/sokoban/)

  • レベルセット:Microban(作者 David W. Skinner)

  • Fable 5のポケモンFireRedクリア/ビジョンのみハーネス:Anthropic公式発表(https://www.anthropic.com/news/claude-fable-5-mythos-5)

  • 価格:Claude Fable 5 = 入力$10 / 出力$50、Claude Opus 4.8 = 入力$5 / 出力$25(いずれもper 100万トークン)