「Fable 5」と「Mythos 5」、どっちを使えばいいのか。そこから始めると話が早いです。一般ユーザーが使えるのはFable 5のみです。Mythos 5は政府連携のサイバー防衛プログラムを通過した組織限定の提供で、普通には申し込めません。
2026年6月9日、Anthropicがこの2つを同時に一般公開しました。正直なところ、速報を見た時点で「なぜOpus 5じゃないのか」と「なぜ2つに分けたのか」が最初に気になりました。性能の数字の前に、この構造を理解してからでないと使い方の判断ができません。
発表の5日前に「自社AIが自社コードの80%超を書いている」という報告を公式で公開した直後のタイミングでした。このタイミングを含め、今回は性能以外にも問うべき点があります。
FableとMythosの違いはセーフガードと使える人の範囲だけ
2つのモデルは「同一基盤の別パッケージ」です。一般ユーザーが使えるのはFable 5のみで、Mythos 5は政府連携の審査プログラムを通過した組織専用です。
2製品の仕様比較——価格・公開対象・セーフガード
| 項目 | Fable 5 | Mythos 5 |
|---|---|---|
| 基盤モデル | 同一 | 同一 |
| 公開対象 | Pro/Max/Team/Enterprise/API全ユーザー | Glasswing承認組織のみ |
| セーフガード | あり(高リスククエリをOpus 4.8へ転送) | サイバー・生物分野の一部を解除 |
| 価格 | 入力$10 / 出力$50(per 1Mトークン) | 同額 |
| データ保持 | 30日(ZDR非対応) | 30日(学習には不使用) |
セーフガードとは、危険なクエリを検知したときに拒否するのではなくOpus 4.8へ転送する安全装置のことです。Mythos 5はその転送が一部解除されている版。能力は同じでも、出せる回答の範囲が違います。
MythosクラスはOpusとSonnetの上位に新設された第4のランク
Claudeのモデルは従来、軽量の「Haiku」→ バランス型の「Sonnet」→ 最高性能の「Opus」という3段階でした。Mythosクラスはその上位に新設された第4のランクです。Opusを置き換えるのではなく、Opusの外側に飛び出した能力水準として定義されています。
| クラス | 主なモデル |
|---|---|
| Mythosクラス(最上位・新設) | Fable 5(一般公開)/ Mythos 5(招待制) |
| Opusクラス | Opus 4.8(転送先として現役) |
| Sonnetクラス | Sonnet 4.6, 4.5 |
| Haikuクラス | Haiku 4.5 |
Opus 4.8は廃止されていません。Fable 5のセーフガードが発動した際の転送先として現役で機能するからです。
FableとMythosは同一語源の兄弟語——命名が設計思想を示す
Anthropicのモデル名は一貫して文学形式に由来します。Haiku(俳句)→ Sonnet(14行詩)→ Opus(大作・楽曲)、そしてFableとMythosへ。
Fableはラテン語の fabula(「語られるもの」)が語源。Mythosはギリシャ語の「神話・原型的な語り」です。公式の定義ではこの2語は「等価な兄弟語」とされており、同一基盤から生まれた2製品であることを命名で表しています。「一般向けに語れる版(Fable)」と「より根源的・制約の少ない版(Mythos)」という対比です。
「Opus 5」でない理由——能力が別ティアに達し、安全性で2製品に分けた
Opusの連番に収まらないほど能力が飛び、かつ同じ基盤を安全性の有無で2製品に分ける必要が生まれました。この2つが重なり、命名体系ごと刷新する判断が生まれました。
脆弱性発見でトップ人材を超える水準に達した
Anthropicはこのモデルクラスを「ソフトウェアの脆弱性を発見・悪用する能力で、最も熟練した一部の人間を除くすべてを上回る水準に達した」と定義しています。Opusより「少し良い」ではなく、能力の質が変わったという判断です。
コーディング評価のSWE-Bench ProでOpus 4.8が69.2%のところFable 5は80.3%。そのスコア差以上に「このモデルをどう制御するか」という問いが先に立つほどの水準に達した——それがAnthropicの認識です。
1つのつまみで全ユーザーに合わせる設計が限界に達した
Opusまでは「1つのモデルを調整して全ユーザーに提供する」設計でした。セーフガードの強さを1本のつまみで全員に合わせる、という発想です。
このモデルではその設計が通じなくなりました。コーディング能力が突き抜けた結果、「一般ユーザーには制限が必要だが、政府のサイバー防衛チームには制限なしで使わせたい」という矛盾する要求が生まれました。1つの基盤モデルを安全装置の有無で2製品に分ける——これが「Fable」と「Mythos」という2つの名前を生んだ本質的な理由です。
「能力と安全性を、もはや1つのつまみで全対象に合わせることはできない」という考えが、製品の形を変えました。
セーフガードは拒否でなく転送——発動は全セッションの5%未満
Fable 5のセーフガードは「拒否」ではありません。危険なクエリを検知するとFable 5が回答せず、Opus 4.8へ自動転送される設計です。
転送の仕組みとAPIでの確認方法
Fable 5の本体とは別に、クエリを監視する分類器が並走しています。高リスクと判断されたクエリは拒否されるのではなく、Opus 4.8へ自動転送されます。転送が発生した場合、API上では stop_reason: "refusal" と転送先のモデル情報が返ってきます。転送が起きても、ユーザー側には必ず通知が届きます。
転送が発動するのは全セッションの5%未満。95%以上のやりとりではセーフガードは一切発動しません。
ただし分類器は「広めに設定されている」とAnthropicが認めており、正当な作業でも誤検知することがあります。APIで定義されているカテゴリは次の3種。
- cyber: マルウェア・エクスプロイト開発など(正当なセキュリティ作業も誤検知しうる)
- bio: 危険な実験手法・生物兵器関連(有益なライフサイエンス作業も誤検知しうる)
- reasoning_extraction: モデルの内部推論を引き出そうとするクエリ
転送が発動すると、その後約1時間は同じ会話がOpus 4.8にルーティングされ続けます。Fable 5はAdaptive Thinking(思考の深度を自動調整する拡張推論機能)が常時オンで、オフにする設定はありません。思考の生内容はAPIに返りませんが、thinking.display に "summarized" を指定すると要約として取得できます。
Mythos 5にアクセスできる先——200組織規模の政府連携プログラム参加者のみ
Mythos 5が届くのは「Project Glasswing」という米政府連携プログラムの承認を受けた組織のみです。
2026年4月設立。AWS、Apple、Cisco、CrowdStrike、Google、Microsoft、NVIDIAなどを含む創設パートナー約12社を核に、5月時点で約50組織、6月2日に新たに15か国以上・約150組織が加わり、合計約200組織規模に拡大しました。
目的はサイバー防衛です。攻撃者より先にMythos 5の能力を使って既知の脆弱性を修正するプログラムで、参加組織はプログラム開始から1か月で高・重大度の脆弱性を1万件超発見しています。真陽性率90.6%という数字は、候補を列挙するだけでなく実際に修正価値のある問題を見つけられていることを示します。
一般企業が業務効率化でMythos 5を使う、というシナリオは今のところありません。
サイバー・生物分野では公開版と非公開版で性能差が生まれる
非高リスク領域——コーディング全般・文書作成・視覚推論——ではFable 5とMythos 5の性能差はありません。どちらもOpus 4.8を上回ります。
差が出るのはセキュリティ・生物分野です。実際のエクスプロイト開発を評価するExploitBenchというベンチマークでMythos 5は78.0%を出す一方、Fable 5はセーフガードにより実質0%になります。能力はあっても、Fable 5では発動できない作業があります。
タスクが長く複雑になるほどOpus 4.8との差が広がる
「タスクが長く複雑になるほど、従来モデルとの差が広がる」。短い回答タスクならOpus 4.8との差は小さいですが、長時間の自律作業では別格の結果を出します。
コーディングベンチマーク
| ベンチマーク | Fable 5 | Opus 4.8 |
|---|---|---|
| SWE-Bench Verified | 95.0% | 88.6% |
| SWE-Bench Pro | 80.3% | 69.2% |
| FrontierCode Diamond(高努力量) | 29.3% | 13.4% |
| FrontierCode Main(高努力量) | 46.3% | 34.3% |
SWE-Bench Proは1,865タスクにわたる長期ソフトウェアエンジニアリング作業の評価です。コードを1行修正できるかではなく、実際の開発作業に近い難易度で計測されます。
FrontierCode Diamondで特徴的なのは努力量との相関です。Fable 5は努力量を上げるほど直線的にスコアが伸びる(最低努力量で11.5%、最高努力量で30.9%)のに対し、競合モデルは5〜6%で頭打ちになります。より多くのトークンを使って深く考えさせるほど差が開く設計です。
長時間自律タスクとStripe事例
Stripeが5,000万行のRubyコードベース移行を自律実行させたところ、「人手2か月相当」の作業が1日で完了しました。概念実証ではなく、本番コードベースでの実測値です。
個人的にこれが最も印象的でした。作業の規模が大きいほど効果が出るというFable 5の特性が、実際のビジネス現場で出た結果だからです。
ゲーム「ポケモン ファイアレッド」を補助ツールなし・画面スクリーンショットのみで自律クリアした事例や、長期記憶の評価でOpus 4.8比3倍のスコアも公式で確認されています。
知識労働・PC操作・視覚推論
| ベンチマーク | Fable 5 | Opus 4.8 |
|---|---|---|
| OSWorld(PC操作自動化) | 85.0% | 83.4% |
| HLE(難問回答、ツールあり) | 64.5% | 57.9% |
| BigLaw Bench(法律文書) | 93.4% | — |
| 視覚推論(PDF解析) | 29.8% | 22.5% |
| Blueprint-Bench(空間推論) | 38.6% | 14.5% |
空間推論(38.6% vs 14.5%)の差が顕著です。設計図・インフラ構成図・回路図の解析といった、視覚と推論を組み合わせる作業で効果が出やすい分野です。
料金はOpus 4.8の2倍——6月22日まで無料、以降はクレジット消費
Fable 5の料金はOpus 4.8の2倍。この数字だけ見て「高い」と判断するのは早計です。
モデル別の料金
| モデル | 入力(/1Mトークン) | 出力(/1Mトークン) |
|---|---|---|
| Fable 5 / Mythos 5 | $10 | $50 |
| Opus 4.8 | $5 | $25 |
| Sonnet 4.6 | $3 | $15 |
| Haiku 4.5 | $1 | $5 |
単価は2倍ですが、複雑なタスクで少ない試行で完了するケースでは、タスクあたりのコストが下がる場面もあります。Stripe事例のように「2か月が1日」になるなら、計算は根本から変わります。
6月22日まではPro/Max/Team/Enterpriseプランに含まれる形で無料提供中。6月23日以降はプランの使用クレジットから消費されます(APIは最初から$10/$50で課金)。Anthropicは容量が確保でき次第、プランへの標準組み込みを検討するとしていますが、時期は未定です。
バッチAPIは50%割引、プロンプトキャッシュは入力90%割引の$1/Mになります。繰り返しの多い処理ではバッチ・キャッシュを活用すると実コストは大きく下がります。
セーフガードが発動してOpus 4.8へ転送された場合、その部分はOpus 4.8の料金で処理されます。出力ゼロの拒否では課金されません(入力はレートリミットにはカウントされますが請求はされません)。
Fable 5 / Opus 4.8 / Sonnet 4.6の使い分け
Fable 5を選ぶ場面:複雑なコードベースの大規模変更や移行、長時間継続する自律エージェントタスク、精度が重要な法律・科学・財務文書の処理、努力量を増やすほど精度が上がる作業。
Opus 4.8が合う場面:セキュリティ・ライフサイエンス系の業務(Fable 5のセーフガードが誤発動しやすい)、コスト効率を重視する日常的なコーディング支援、Fable 5の最高性能が不要でSonnetより精度が欲しいとき。
Sonnet 4.6が合う場面:チャット・要約・日常的な文書生成、大量処理でコストを抑えたいとき、高頻度のAPIコール。
セキュリティ研究や生命科学の業務が多い場合は注意が必要です。誤転送5%未満という数字は低く見えても、1日に何十回もクエリを投げる業務では積み重なります。その場合は最初からOpus 4.8を使う方が実務的です。
通知なしで応答品質を下げるセーフガードが公式仕様に存在する
Fable 5のセーフガードには前述の3種類(cyber/bio/reasoning_extraction)とは別に、もう一系統があります。こちらは転送もエラーも発生しない——通知なしに品質が下がります。
フロンティアLLM開発向けに品質を静かに下げる仕組み
フロンティアLLM開発——大規模なモデルの事前学習パイプライン、分散学習インフラの設計、ML専用チップの設計といった作業——に関連するクエリに対して、応答の品質が静かに下がります。
Fable 5の公式システムカードに明記された仕様です。手法はプロンプトへの介入、モデル内部の調整、またはその組み合わせが使われ、ユーザーへの通知はありません。発動頻度は全トラフィックの約0.03%。
この設計に対して「通知なしでAIの知能を自動的に下げる仕組みは根本的にずれている」という批判がAI研究者の間から出ています。推測ではなく、公式仕様に対する正当な批判です。
影響が出うる作業と確認方法
発動頻度0.03%は低い数値です。通常のコーディング・ビジネス文書・研究作業では発動しません。
影響が出うるのは、LLMの学習コードを書いている、カスタムモデルの分散学習インフラを設計している、AI専用ハードウェアを設計しているといった、AIそのものを開発している作業者です。「フロンティアLLM開発」の境界が曖昧なため、社内ファインチューニング作業やMLパイプラインの最適化が誤発火する懸念は残ります。
Anthropicはこの仕組みを「競合するAI開発の加速を防ぐための措置」と位置づけていますが、実際にどの程度の品質低下が起きるかは公開されていません。AI関連の開発業務でFable 5の回答が妙に中途半端に感じる場面があれば、Opus 4.8と比較してみる価値があります。
よくある質問
Mythos 5は個人で申し込めますか?
申し込めません。Project Glasswingの承認を受けた政府連携組織のみが対象です。一般企業・個人向けの提供ルートは現時点では存在しません。
Fable 5はClaude.aiの無料プランで使えますか?
使えません。Pro・Max・Team・EnterpriseプランとAPIユーザーが対象です。
Opus 5は今後出ますか?
Anthropicの公式発表にOpus 5の情報はありません。今回のリリースでモデル命名体系が刷新され、FableとMythosが最上位クラスになりました。Opusの連番を使わず新クラスを立てた判断そのものが、このモデルが従来と別の能力水準に達したことを示しています。
何から始めるか
コーディング・開発が主用途なら
まず手を付けやすいのは、普段Opus 4.8に投げていた「大きくて複雑なタスク」をFable 5に差し替えることです。数千行規模のリファクタリングや、長い文脈を読んだ上での複雑な推論が、体感でわかるくらい変わります。6月22日まで、プラン内の追加料金なし。
セキュリティ・生命科学業務が中心なら
セキュリティ・生命科学の業務が中心なら、誤転送の問題を先に確認しておく方がいいでしょう。Fable 5を使い始めてから「セーフガードが邪魔だ」と気づくより、最初からOpus 4.8を使い続ける選択肢も現実的です。
LLM開発者は「静かな品質低下」に注意
LLMの学習コードや分散学習インフラを扱う場合は、「静かな品質低下」が自分の作業に影響していないかを意識的に確認するといいです。Fable 5の回答が妙に薄いと感じたら、Opus 4.8と比較してみてください。
命名体系を変えてまで新しいランクを作ったモデルが一般向けに出てきました。性能の天井が上がっただけでなく、安全性の設計が製品の形そのものを変え始めた——それが今回の発表の本質です。


