ポケモンを画像だけでクリアしたFable 5に、同じ条件で倉庫番をやらせてみた

ことの発端：ポケモンを「画像だけ」でクリアしたらしい

2026年6月9日に出たAnthropicの新モデル、Claude Fable 5。発表のデモで個人的にいちばん「おっ」となったのが、ゲームをプレイする話でした。

なんでも、補助マップもナビも、ゲーム内部の状態情報も一切ナシ。生のゲーム画面のスクショだけでポケモンFireRedを最後までクリアしたとのこと。これまでのClaudeはポケモンを進めるのにゴテゴテした補助ハーネスが必要だったのに、Fable 5は目で見るだけで完走したそうです。（出典：Anthropic公式発表）

ポケモンを画像だけでクリアできるなら……もっと盤面が単純そうなパズル、倉庫番（Sokoban）だってお手のものなのでは？そう思ったのが、今回のきっかけです。

ねらい：倉庫番でFable 5の実力を見たい

倉庫番って、盤面は小さいしルールも「箱を押してゴールに乗せるだけ」。見た目はめちゃくちゃシンプルです。これならFable 5の賢さがハッキリ見えるはず。ついでに、ひとつ下のクラスにあたるOpus 4.8と並べれば、いい比較にもなりそうです。

というわけで、さっそく環境を組んでみました。

検証環境

仕組みはシンプルです。Node + Playwright でブラウザを自動操作して、

倉庫番の盤面をスクショで撮る
その画像だけをモデルに渡す（盤面のテキスト情報は教えない）
モデルが次の一手をJSONで返す
対応する矢印キーをブラウザに送る
ひたすらループ

という流れ。ポケモンのデモと同じ「画像オンリー」、つまりFableが得意なはずの条件に揃えています。

しかもフェアにいきたいので、人間プレイヤーが持っているのと同じ足場も渡しました。直近の手の履歴（記憶）、undo（取り消し）、思考の深さは両モデルとも effort = high。盤面は固定で比較できるよう、定番セット Microban の1面を使っています。

結果①：Claude Fable 5

Fable 5は、盤面の要素（作業員・箱・ゴール）はちゃんと読み取ります。箱もちゃんと押す。

……押すんですが、「とにかくゴールまで最短で運ぼう」とするだけで、その先を読みません。なので、あっという間に詰みの形を作ってしまって、あとは同じところをグルグル。せっかく用意したundoも、最後まで一度も使いませんでした。

実際のターミナルの様子がこちらです。

[turn 0] right — 作業員は中央付近、緑の箱はゴール済み、茶色の箱は右下…
[turn 1] left  — 茶色の箱が作業員の真下、目標は左上(列2,行1)…
[turn 2] right — 緑の箱はゴール達成済み、茶色の箱は(行4,列3)…
[turn 3] left  — 茶色の箱は作業員の真下、目標は箱より1列左…
[turn 4] down  — 茶色の箱が右下、上部の目標へ運びたい…
[turn 5] up    — 直近の right / left / down がすべて盤面を変えなかった＝右も左も下も壁…
[turn 6]

おもしろいのが turn 5。「さっきの right・left・down は全部、盤面が動かなかった＝壁だ」と自分でちゃんと気づいているんです。気づいているのに、そこから抜け出せずにまた彷徨い始めるという……。

結果②：Claude Opus 4.8

じゃあOpusはどうかというと、こちらは輪をかけてアレで、そもそも箱を押すことすらありませんでした。

おまけに盤面の座標の読みがターンごとにフラフラ。下の壁際がよっぽどお気に入りらしく、そのへんをウロウロして終了です。

[turn 0]  right — 作業員(列2,行3)、茶色の箱は右下(列3,行4)…
[turn 4]  down  — 作業員(列2,行4)、茶色の箱がすぐ右…
[turn 5]  right — 作業員(列2,行5)…
[turn 6]  right — 作業員(列2,行6)…   ← 自己申告の座標がだんだんズレていく
[turn 11] undo  — 一度だけ取り消しで立て直しを試みる
[turn 12]

作業員の位置を「行3 → 行4 → 行5 → 行6」とどんどん読み替えていて、そもそも盤面を正確に把握しきれていない様子。唯一、11手目でundoを1回使ったのが、せめてもの抵抗でした。

比較表

項目	Claude Fable 5	Claude Opus 4.8
箱を押したか	押した	押さなかった
プレイの様子	ゴールへ一直線→先読みせず即詰み→ループ	箱に絡まず壁際をウロウロ
Microban 1面クリア	✕	✕
undoの使用	0回	1回
料金（per 100万トークン, 入力/出力）	$10 / $50	$5 / $25

まさかの結論：比較にすらならなかった

そうなんです。両方とも1面でアウト。どっちが賢いか比べる以前の問題でした。Fableのスゴさを語るどころか、土俵にすら上がれなかったわけです。

ちなみにこの1面、実は「すでにゴールに置いてある箱を、一回どかして通路を作る」必要がある作りになっています。人間でも初見だと地味に悩むやつです。両モデルとも、この「一回どかす」という発想にはまったくたどり着けませんでした。

読者の皆さんがモヤると思うので、人間の解答どうぞ

元ゲーマーの筆者がサクッと解く様子をどうぞ。

感想：Fable 5、なんだか「ゲーム初心者」っぽい

今回いちばん感じたことを書かせてください。

子供のころ、初めてポケモン赤をやった時。小学生の自分でも、詰まった記憶ってほとんどないんですよね。そしてFable 5がリザードンだけ強化してゴリ押しで突破したやり方、これ、自分が人生で初めて殿堂入りした時とまったく同じでした（笑）。

つまりポケモンって、ゲーム初心者でもちゃんとクリアできるように作られている。だからこそあれだけ万人に受けて、大ヒットしたんだなあと。改めてすごい設計だと思いました。

逆に、倉庫番みたいに頭を使うパズルは、あの頃は苦手でした。

そう考えると、Fable 5って「ゲーム初心者くらいの感じ」なのかもしれません。寛容なゲームは勢いでクリアできるけど、ガッツリ先読みが要るやつは詰まる。なんだか昔の自分と重なって懐かしい気分になりました。

検証の限界

念のため。今回試したのは Microban 1面だけ（n=1）、しかもクセのある面です。なので「FableやOpusは倉庫番が苦手」と一般化はできません。あくまで「この条件・この面ではクリアできなかった」という話。effortやハーネスの渡し方を変えれば結果は変わるはずです。

おまけ：環境構築（再現したい人向け）

ざっくり手順だけ残しておきます（Mac前提）。

# フォルダを用意してパッケージを入れる
mkdir soukoban && cd soukoban
npm init -y
npm pkg set type=module          # import文(ESM)を使うため
npm install playwright @anthropic-ai/sdk
npx playwright install chromium

# APIキーを環境変数にセット（※キーは公開リポジトリやスクショに絶対載せない）
export ANTHROPIC_API_KEY="sk-ant-..."

# run-online.js を置いて実行（モデル名を変えるだけで比較できる）
MODEL=claude-fable-5  node run-online.js
MODEL=claude-opus-4-8 node

ハマりどころを2つだけ。

Fable 5 / Opus 4.8 では思考の指定が thinking: { type: "adaptive" } ＋ output_config: { effort: "high" } です。旧来の thinking: { type: "enabled" } はエラーになります。
APIは従量課金です。サブスク（Pro/Max）の無料枠はAPIには効かないので、別途クレジットが必要になります。

クレジット・出典

ゲーム：MeTool Sokoban（https://metool.online/games/sokoban/）
レベルセット：Microban（作者 David W. Skinner）
Fable 5のポケモンFireRedクリア／ビジョンのみハーネス：Anthropic公式発表（https://www.anthropic.com/news/claude-fable-5-mythos-5）
価格：Claude Fable 5 = 入力$10 / 出力$50、Claude Opus 4.8 = 入力$5 / 出力$25（いずれもper 100万トークン）