Codexで録画したスキルは、Claudeで動くのか? きっかけは「SKILL.md」というファイル名でした

Codexで録画したスキルは、Claudeで動くのか? きっかけは「SKILL.md」というファイル名でした

ITmedia NEWS で、OpenAI Codex に新機能「Record & Replay」が追加された、という記事を見かけました。Mac 上での操作を一度やって見せると、その手順を Codex が覚えて、次回からは自動で再現してくれる——という機能です。

読み進めていて、ある一文で手が止まりました。録画した操作は、編集できる SKILL.md という形式で保存される、と書いてあったんです。

SKILL.md。これ、Claude(Claude Code)のスキルとまったく同じファイル名で、同じ思想の形式です。普段から Claude Code でスキルを書いている身としては、ここで素朴な疑問が浮かびました。

形式が同じなら、Codex で録画して作ったスキル、そのまま Claude でも動くんじゃない?

ただ、「形式が同じ」と「中身に互換性がある」はまったくの別物です。名前が一緒なだけで、実際は中身が別物かもしれません。こればっかりは触ってみないと分かりません。というわけで、実機で確かめてみることにしました。

この記事は、その検証ログです。結論を先に書くことはせず、実際にたどった順番のまま記していきます。

まず前提:Record & Replay って何?

対象をざっくり整理しておきます。

  • Record & Replay は OpenAI Codex の新機能で、Mac 上の操作を録画して、再利用できる手順(スキル)に変換してくれます。

  • 土台に Computer Use(AI が画面を見て Mac を操作する機能)を使っています。

  • 利用条件は macOS 限定で、Computer Use の有効化が前提。提供地域から EEA・英国・スイスは外れています(日本は使えます)。

  • 生成物は SKILL.md として保存され、あとから編集できます。

今回の検証環境はこんな感じです。

  • Codex アプリ(ChatGPT Plus アカウントでログイン)

  • 比較対象として Claude Code(Claude Max アカウント)

  • どちらも同じ Mac 上

ちなみに環境構築の途中で細かい詰まりどころがいくつかありました。そのへんは記事の後ろの「つまずきポイント」にまとめています。

ステップ1:まず録画してみる(Record 編)

検証の出発点として、まず Codex で1本スキルを録画してみました。お題は、互換性の検証に向いていそうな「シンプル・手順が明確・機密情報を含まない」作業を選びました。

お題: Google で「大阪 南インド カレー」を検索して、上位の公式店舗ページの URL を取得し、Markdown のメモに保存する

Record & Replay の録画モードを開始して、実際に手で操作をやって見せます。検索 → 公式ページを開く → URL をコピー → メモに貼って保存、という流れです。

録画を止めると、Codex が操作内容を確認して、スキルを生成してくれました。

生成された SKILL.md の中身が、これです。


※ 実際の生成物から要点を抜粋・整形しています。

この時点で、おっと思った点が2つありました。

1つ目は、手順が「座標」じゃなくて「意図」で書かれていたこと。 録画中は当然、ブラウザの特定の位置をクリックしているはずです。でも生成された SKILL.md には座標が一切出てきません。代わりに「アドレスバーで検索する」「公式サイトらしいドメインを優先する」「ディレクトリやレビューサイトは後回しにする」みたいな、判断基準(意図) として書かれていました。

2つ目は、1回やって見せただけの操作が汎用化されていたこと。 録画したのは「大阪 南インドカレー」の1件だけなのに、本文は「任意の place / restaurant / shop の公式 URL を探してメモに追記する」という汎用スキルになっていました。具体的なお題のほうは ## Recorded Example に実例として隔離されています。しかも、こっちが指示していない「報告前に保存内容を確認する」という自己検証ステップ(## Verification)まで勝手に付いていました。

この「意図ベースで書かれている」という点が、あとの結果を大きく左右することになります。

ステップ2:本題——Claude で動くのか(A案)

素材(SKILL.md)が手に入ったので、いよいよ本題です。この Codex 製の SKILL.md を、無改造のまま Claude Code に置いて動かせるか。

検証用のディレクトリを作って、生成された SKILL.mdcp でそのままコピーしました。1文字もいじっていません。

mkdir -p ~/.../rr-skill-test/.claude/skills/google-place-url-note
cp

Claude Code を起動して、スキル一覧を見てみると——

Codex 製の SKILL.md が、Claude Code 側でちゃんと有効なスキルとして認識されました。 トークン数まで出ているので、中身もきちんと読めているようです。これで「構造の互換性」はクリア。name / description を含む YAML ヘッダの構造は、少なくとも読み込みのレベルでは完全に共通でした。

次は、実際に動かします。録画と同じお題だと面白くないので、お題を変えて実行しました。

google-place-url-note スキルを使って、「大阪 濃厚豚骨ラーメン」の公式店舗URLを調べて、osaka-tonkotsu-ramen.md に Markdown リンク形式で保存して

実行ログがこうなりました。


ここで一番の見どころが来ました。SKILL.md には「a browser available to Computer Use」と書かれています。でも、Claude Code に Codex の Computer Use はありません。普通なら「そんなブラウザ無いよ」と詰まってもおかしくないところです。

ところが Claude は、「Computer Use でブラウザを操作する」を、自前の Web Search + Fetch ツールに読み替えて実行しました。 スキルの「公式サイトの URL を探す」という意図をくみ取って、手元にある別のツールで代わりにやってのけたんです。

もし手順が「アドレスバーの座標 (x, y) をクリック」と書かれていたら、ツールの違う Claude では絶対に動かなかったはずです。意図ベースで書かれていたからこそ、ツール環境をまたいで移植できた。ここが効いたな、と思いました。

保存された実ファイルの中身も見てみます。

# 大阪 濃厚豚骨ラーメン
- [極濃豚骨 らーめん小僧(大阪市福島区)](https://kozou53.jp/kozou/)

公式サイトを Fetch で確認したうえで、ちゃんと Markdown リンク形式で保存されていました。

ステップ3:どこまで通用するのか(B案)

A案で「ツールをまたいでも動く」ことが分かりました。次に気になるのは「録画と違うお題でも動くのか」です。今度は Record & Replay の再生(Replay)側で、録画元からできるだけ遠いお題を投げてみました。

録画元は「大阪・南インドカレー・日本語」。これに対して——

お題: New Delhi Japanese restaurant(ニューデリーの日本食レストラン)

エリア(海外)・ジャンル(日本食)・言語(英語混じり)を、ぜんぶ変えています。

結果、Codex は録画時の「大阪 南インド カレー」や erickcurry の URL にまったく引きずられることなく、The Leela Palace New Delhi の日本食レストラン「Megu」の公式ページをちゃんと取得しました。

[Megu Restaurant | The Leela Palace New Delhi](https://www.theleela.com/.../megu)

念のためもう1本、ブラジル・リオデジャネイロの寿司屋でも試してみましたが、こちらもミシュラン掲載の老舗「Sushi Leblon」の公式サイトを取得できました。録画した1回の操作が、国もジャンルも言語もまたいで通用していることが分かります。

ここでもやっぱり効いているのが「意図ベース」です。SKILL.md の本文が「大阪 南インド カレー」という具体的な言葉じゃなくて、「place の公式 URL を探す」という抽象的な意図で書かれていたので、まったく別のお題にも適応できたわけです。

ステップ4:速度はどうか

ここまでで「動く」「いろんなお題に通用する」は確認できました。実用面でもう1つ気になるのが速度です。同じお題「リオデジャネイロ 寿司屋」を、A案(Claude Code)と B案(Codex Replay)の両方で測ってみました。

方式

仕組み

所要時間

A案:Claude Code

Web Search + Fetch(API 的に取得)

約 52 秒

B案:Codex Replay

Computer Use(画面操作を再現)

1 分 44 秒

差はおよそ2倍で、Codex の Replay 側のほうが遅いです。両方とも同じ店(Sushi Leblon)の公式サイトに行き着いたので、比べる条件は揃っています。

差が出る理由は、たぶん方式の違いです。Claude Code は検索 API でデータを取りに行くのに対して、Codex Replay は Computer Use で実際に画面を操作して手順を再現します。後者は画面を認識して操作する分のオーバーヘッドが乗ります。なので「Codex が劣っている」という話ではなくて、画面操作を再現する方式と、API で取得する方式の構造的な違いと見るのがフェアかなと思います。

注記: これは各1回だけ測ったオーダー感です。ネットワーク環境や検索結果の重さで変わるので、ちゃんと比べるなら複数回の平均が必要です。この記事では「秒単位 vs 分単位みたいな桁違いではなく、同じくらいのオーダーで約2倍」くらいの目安として読んでください。

ステップ5:実物を見て気づいた、出力の「クセ」

最後に、生成された4つのファイルの中身を自分の目で確認しました。ログの「保存しました」をそのまま信じず実物を見てみたら、面白い差が見つかりました。同じスキル・同じ「Markdown リンク形式で保存して」という指示なのに、出力の整形が実行するエージェントによって違っていたんです。

A案(Claude Code)の出力:

# 大阪 濃厚豚骨ラーメン
- [極濃豚骨 らーめん小僧(大阪市福島区)](https://kozou53.jp/kozou/)

B��(Codex Replay)の出力:

[Megu Restaurant | The Leela Palace New Delhi](https://www.theleela.com/.../megu)

A案は見出し付きの箇条書きリストとして整形しているのに対して、B案はリンク単体で書き出しています。Claude Code が「メモとして見やすく」整えたのに対して、Codex は録画時の操作(リンクを貼る)に忠実だった、という見方ができそうです(※これは出力から推測した解釈で、内部の挙動を確認したわけではありません)。実ファイルを見ていなかったら気づけなかった差でした。

つまずきポイント(これから試す人へ)

同じことを試す人のために、環境構築でつまずいた点を残しておきます。

  • Plus 課金の反映ラグ: 決済した直後、Codex アプリ側が「Free」表示のままでした。アプリを完全終了(⌘+Q)して再起動したら「Plus」に切り替わりました。

  • Claude Code のログイン切れ: A案の実行時に 401 Invalid authentication credentials が出ました。スキルの問題ではなくただの認証切れで、/login で入り直せば直ります。

  • PyYAML 不在: Record & Replay がスキル生成後に走らせる検証スクリプトが、環境に PyYAML が無くて起動できなかった、というメッセージが出ました(生成自体はちゃんと完了しています)。

  • 権限付与: Computer Use はアクセシビリティと画面収録の権限が必要です。macOS のシステム設定で対象アプリを許可しておきましょう。

まとめ

検証の出発点だった問い——「Codex で録画したスキルは、Claude で動くのか?」——への答えは、動きました

  • Codex 製の SKILL.md は、Claude Code で無改造のままスキルとして認識・実行できた(構造も実行も互換あり)

  • Claude には無い Computer Use を、Claude は自前のツールに読み替えて実行した(ツールをまたいで動く)

  • 録画と違う国・ジャンル・言語のお題でもちゃんと通用した(お題をまたいで動く)

  • 速度は方式の違いで差が出るけど(目安で約2倍)、どちらも実用的な範囲だった

「同じ SKILL.md 形式を名乗っているだけで、中身は別物だろう」という最初の懸念は、少なくとも今回の範囲では外れました。CodexとClaudeのスキルには、実用レベルの互換性がありました。

そして、その互換を成り立たせていた鍵は「意図ベースの記述」だったと思っています。手順が座標やUI依存で書かれていたら、ツールの違う別のエージェントでは動かなかったはずです。操作を「意図」として抽象化して記録する設計だったからこそ、ツールもお題もまたいで再利用できました。

スキルが特定のツールやエージェントに縛られず、またいで使い回せる——その入り口を実機でのぞけた、面白い検証でした。

ITmedia NEWS で、OpenAI Codex に新機能「Record & Replay」が追加された、という記事を見かけました。Mac 上での操作を一度やって見せると、その手順を Codex が覚えて、次回からは自動で再現してくれる——という機能です。

読み進めていて、ある一文で手が止まりました。録画した操作は、編集できる SKILL.md という形式で保存される、と書いてあったんです。

SKILL.md。これ、Claude(Claude Code)のスキルとまったく同じファイル名で、同じ思想の形式です。普段から Claude Code でスキルを書いている身としては、ここで素朴な疑問が浮かびました。

形式が同じなら、Codex で録画して作ったスキル、そのまま Claude でも動くんじゃない?

ただ、「形式が同じ」と「中身に互換性がある」はまったくの別物です。名前が一緒なだけで、実際は中身が別物かもしれません。こればっかりは触ってみないと分かりません。というわけで、実機で確かめてみることにしました。

この記事は、その検証ログです。結論を先に書くことはせず、実際にたどった順番のまま記していきます。

まず前提:Record & Replay って何?

対象をざっくり整理しておきます。

  • Record & Replay は OpenAI Codex の新機能で、Mac 上の操作を録画して、再利用できる手順(スキル)に変換してくれます。

  • 土台に Computer Use(AI が画面を見て Mac を操作する機能)を使っています。

  • 利用条件は macOS 限定で、Computer Use の有効化が前提。提供地域から EEA・英国・スイスは外れています(日本は使えます)。

  • 生成物は SKILL.md として保存され、あとから編集できます。

今回の検証環境はこんな感じです。

  • Codex アプリ(ChatGPT Plus アカウントでログイン)

  • 比較対象として Claude Code(Claude Max アカウント)

  • どちらも同じ Mac 上

ちなみに環境構築の途中で細かい詰まりどころがいくつかありました。そのへんは記事の後ろの「つまずきポイント」にまとめています。

ステップ1:まず録画してみる(Record 編)

検証の出発点として、まず Codex で1本スキルを録画してみました。お題は、互換性の検証に向いていそうな「シンプル・手順が明確・機密情報を含まない」作業を選びました。

お題: Google で「大阪 南インド カレー」を検索して、上位の公式店舗ページの URL を取得し、Markdown のメモに保存する

Record & Replay の録画モードを開始して、実際に手で操作をやって見せます。検索 → 公式ページを開く → URL をコピー → メモに貼って保存、という流れです。

録画を止めると、Codex が操作内容を確認して、スキルを生成してくれました。

生成された SKILL.md の中身が、これです。


※ 実際の生成物から要点を抜粋・整形しています。

この時点で、おっと思った点が2つありました。

1つ目は、手順が「座標」じゃなくて「意図」で書かれていたこと。 録画中は当然、ブラウザの特定の位置をクリックしているはずです。でも生成された SKILL.md には座標が一切出てきません。代わりに「アドレスバーで検索する」「公式サイトらしいドメインを優先する」「ディレクトリやレビューサイトは後回しにする」みたいな、判断基準(意図) として書かれていました。

2つ目は、1回やって見せただけの操作が汎用化されていたこと。 録画したのは「大阪 南インドカレー」の1件だけなのに、本文は「任意の place / restaurant / shop の公式 URL を探してメモに追記する」という汎用スキルになっていました。具体的なお題のほうは ## Recorded Example に実例として隔離されています。しかも、こっちが指示していない「報告前に保存内容を確認する」という自己検証ステップ(## Verification)まで勝手に付いていました。

この「意図ベースで書かれている」という点が、あとの結果を大きく左右することになります。

ステップ2:本題——Claude で動くのか(A案)

素材(SKILL.md)が手に入ったので、いよいよ本題です。この Codex 製の SKILL.md を、無改造のまま Claude Code に置いて動かせるか。

検証用のディレクトリを作って、生成された SKILL.mdcp でそのままコピーしました。1文字もいじっていません。

mkdir -p ~/.../rr-skill-test/.claude/skills/google-place-url-note
cp

Claude Code を起動して、スキル一覧を見てみると——

Codex 製の SKILL.md が、Claude Code 側でちゃんと有効なスキルとして認識されました。 トークン数まで出ているので、中身もきちんと読めているようです。これで「構造の互換性」はクリア。name / description を含む YAML ヘッダの構造は、少なくとも読み込みのレベルでは完全に共通でした。

次は、実際に動かします。録画と同じお題だと面白くないので、お題を変えて実行しました。

google-place-url-note スキルを使って、「大阪 濃厚豚骨ラーメン」の公式店舗URLを調べて、osaka-tonkotsu-ramen.md に Markdown リンク形式で保存して

実行ログがこうなりました。


ここで一番の見どころが来ました。SKILL.md には「a browser available to Computer Use」と書かれています。でも、Claude Code に Codex の Computer Use はありません。普通なら「そんなブラウザ無いよ」と詰まってもおかしくないところです。

ところが Claude は、「Computer Use でブラウザを操作する」を、自前の Web Search + Fetch ツールに読み替えて実行しました。 スキルの「公式サイトの URL を探す」という意図をくみ取って、手元にある別のツールで代わりにやってのけたんです。

もし手順が「アドレスバーの座標 (x, y) をクリック」と書かれていたら、ツールの違う Claude では絶対に動かなかったはずです。意図ベースで書かれていたからこそ、ツール環境をまたいで移植できた。ここが効いたな、と思いました。

保存された実ファイルの中身も見てみます。

# 大阪 濃厚豚骨ラーメン
- [極濃豚骨 らーめん小僧(大阪市福島区)](https://kozou53.jp/kozou/)

公式サイトを Fetch で確認したうえで、ちゃんと Markdown リンク形式で保存されていました。

ステップ3:どこまで通用するのか(B案)

A案で「ツールをまたいでも動く」ことが分かりました。次に気になるのは「録画と違うお題でも動くのか」です。今度は Record & Replay の再生(Replay)側で、録画元からできるだけ遠いお題を投げてみました。

録画元は「大阪・南インドカレー・日本語」。これに対して——

お題: New Delhi Japanese restaurant(ニューデリーの日本食レストラン)

エリア(海外)・ジャンル(日本食)・言語(英語混じり)を、ぜんぶ変えています。

結果、Codex は録画時の「大阪 南インド カレー」や erickcurry の URL にまったく引きずられることなく、The Leela Palace New Delhi の日本食レストラン「Megu」の公式ページをちゃんと取得しました。

[Megu Restaurant | The Leela Palace New Delhi](https://www.theleela.com/.../megu)

念のためもう1本、ブラジル・リオデジャネイロの寿司屋でも試してみましたが、こちらもミシュラン掲載の老舗「Sushi Leblon」の公式サイトを取得できました。録画した1回の操作が、国もジャンルも言語もまたいで通用していることが分かります。

ここでもやっぱり効いているのが「意図ベース」です。SKILL.md の本文が「大阪 南インド カレー」という具体的な言葉じゃなくて、「place の公式 URL を探す」という抽象的な意図で書かれていたので、まったく別のお題にも適応できたわけです。

ステップ4:速度はどうか

ここまでで「動く」「いろんなお題に通用する」は確認できました。実用面でもう1つ気になるのが速度です。同じお題「リオデジャネイロ 寿司屋」を、A案(Claude Code)と B案(Codex Replay)の両方で測ってみました。

方式

仕組み

所要時間

A案:Claude Code

Web Search + Fetch(API 的に取得)

約 52 秒

B案:Codex Replay

Computer Use(画面操作を再現)

1 分 44 秒

差はおよそ2倍で、Codex の Replay 側のほうが遅いです。両方とも同じ店(Sushi Leblon)の公式サイトに行き着いたので、比べる条件は揃っています。

差が出る理由は、たぶん方式の違いです。Claude Code は検索 API でデータを取りに行くのに対して、Codex Replay は Computer Use で実際に画面を操作して手順を再現します。後者は画面を認識して操作する分のオーバーヘッドが乗ります。なので「Codex が劣っている」という話ではなくて、画面操作を再現する方式と、API で取得する方式の構造的な違いと見るのがフェアかなと思います。

注記: これは各1回だけ測ったオーダー感です。ネットワーク環境や検索結果の重さで変わるので、ちゃんと比べるなら複数回の平均が必要です。この記事では「秒単位 vs 分単位みたいな桁違いではなく、同じくらいのオーダーで約2倍」くらいの目安として読んでください。

ステップ5:実物を見て気づいた、出力の「クセ」

最後に、生成された4つのファイルの中身を自分の目で確認しました。ログの「保存しました」をそのまま信じず実物を見てみたら、面白い差が見つかりました。同じスキル・同じ「Markdown リンク形式で保存して」という指示なのに、出力の整形が実行するエージェントによって違っていたんです。

A案(Claude Code)の出力:

# 大阪 濃厚豚骨ラーメン
- [極濃豚骨 らーめん小僧(大阪市福島区)](https://kozou53.jp/kozou/)

B��(Codex Replay)の出力:

[Megu Restaurant | The Leela Palace New Delhi](https://www.theleela.com/.../megu)

A案は見出し付きの箇条書きリストとして整形しているのに対して、B案はリンク単体で書き出しています。Claude Code が「メモとして見やすく」整えたのに対して、Codex は録画時の操作(リンクを貼る)に忠実だった、という見方ができそうです(※これは出力から推測した解釈で、内部の挙動を確認したわけではありません)。実ファイルを見ていなかったら気づけなかった差でした。

つまずきポイント(これから試す人へ)

同じことを試す人のために、環境構築でつまずいた点を残しておきます。

  • Plus 課金の反映ラグ: 決済した直後、Codex アプリ側が「Free」表示のままでした。アプリを完全終了(⌘+Q)して再起動したら「Plus」に切り替わりました。

  • Claude Code のログイン切れ: A案の実行時に 401 Invalid authentication credentials が出ました。スキルの問題ではなくただの認証切れで、/login で入り直せば直ります。

  • PyYAML 不在: Record & Replay がスキル生成後に走らせる検証スクリプトが、環境に PyYAML が無くて起動できなかった、というメッセージが出ました(生成自体はちゃんと完了しています)。

  • 権限付与: Computer Use はアクセシビリティと画面収録の権限が必要です。macOS のシステム設定で対象アプリを許可しておきましょう。

まとめ

検証の出発点だった問い——「Codex で録画したスキルは、Claude で動くのか?」——への答えは、動きました

  • Codex 製の SKILL.md は、Claude Code で無改造のままスキルとして認識・実行できた(構造も実行も互換あり)

  • Claude には無い Computer Use を、Claude は自前のツールに読み替えて実行した(ツールをまたいで動く)

  • 録画と違う国・ジャンル・言語のお題でもちゃんと通用した(お題をまたいで動く)

  • 速度は方式の違いで差が出るけど(目安で約2倍)、どちらも実用的な範囲だった

「同じ SKILL.md 形式を名乗っているだけで、中身は別物だろう」という最初の懸念は、少なくとも今回の範囲では外れました。CodexとClaudeのスキルには、実用レベルの互換性がありました。

そして、その互換を成り立たせていた鍵は「意図ベースの記述」だったと思っています。手順が座標やUI依存で書かれていたら、ツールの違う別のエージェントでは動かなかったはずです。操作を「意図」として抽象化して記録する設計だったからこそ、ツールもお題もまたいで再利用できました。

スキルが特定のツールやエージェントに縛られず、またいで使い回せる——その入り口を実機でのぞけた、面白い検証でした。