「あ、また俺なんかやっちゃいました?」
2026年4月7日、米AI企業Anthropicは衝撃的な発表を行った。
新たなフロンティアモデル「Claude Mythos」を開発したものの、一般公開を凍結。代わりに「Project Glasswing」と名付けた大規模コンソーシアムを立ち上げ、Apple、Google、Microsoft、AWS、NVIDIAなど世界の主要テック企業12社(および今後40社以上に拡大予定)と連携し、限定提供を開始した。
この決定の背景にあるのは、単なる「性能向上」ではなさそうだ。Claude Mythosは、熟練の人間エンジニアすら見逃してきたゼロデイ脆弱性を自律的に発見・悪用する能力を、文字通り「化け物レベル」で備えている。Anthropicの「これまでで最も強力なモデル」でありながら、同時に「最も危険なモデル」でもある。
少し前から言われていた、AIによる脆弱性クラックの脅威が、ついに大衆にも危機感を抱かせ始めたのだ。OSや金融システムなどの社会を支えるシステムが壊される危機感が迫ってきている。
リークから公式発表まで
事の始まりは3月末の内部資料流出だった。不適切に公開されたAnthropicのCMSから、未発表モデルの存在が明らかになった。コードネーム「Capybara」とも呼ばれていたこのモデルは、Claude Opus 4.6を大幅に上回る性能を予告。ベンチマークではSWE-bench Verifiedで93.9%(Opus 4.6比+13.1ポイント)、CyberGymで83.1%(同+16.5ポイント)と、業界記録を塗り替える数字が並んだ。
リーク時は多くの人が信じていなかった。筆者もその一人だ。GPT-3以来の成長ペースを明らかに上回っているベンチマーク結果なのだ。次の他社フロンティアモデルがこれに追い付いてこれるかどうかも怪しいと思ってしまう数字だ。
Anthropicは4月7日に正式発表。モデル名「Mythos」は古代ギリシャ語で「物語」や「神話」を意味する。Anthropicの説明によると、これは「知識を織りなす物語の体系」を象徴する。一方、プロジェクト名「Glasswing」は透明な羽を持つ蝶「ツマジロスカシマダラ」に由来し、「景色に溶け込んで見えない脆弱性」をイメージしているらしい。
うん、なろう系物語にか見えない。
なろう系主人公すぎる性能
Mythos Previewの真価は、汎用モデルでありながらエージェント型コーディングとサイバーセキュリティで突出している点にある。Anthropicの公式評価からの情報によると、
- OpenBSDのTCP SACK脆弱性:27年間未発見の署名付き整数オーバーフロー問題を発見。
- FFmpeg H.264デコーダー:16年間、500万回の自動テストをすり抜けたメモリ安全問題。
- FreeBSD NFS:17年前のスタックバッファオーバーフローで、認証なしroot権限取得。
- Linuxカーネルや主要ブラウザ:JITヒープスプレーやROPチェーンを活用したサンドボックス脱出・カーネルコード実行。
これらはすべて人間の介入なしで、Mythos Previewがソースコード解析→仮説立案→テスト→エクスプロイト生成までを自律的にこなした結果だ。従来モデル(Opus 4.6)では部分的なクラッシュしか起こせなかったFirefox JavaScriptエンジンでも、Mythosは181回中多数で完全コード実行を達成。Cybenchでは100%パス、CyberGymでも圧倒的スコアを記録した。
以前からAnthropicとMozillaは提携して、脆弱性発見のテストを行っており、かなり優秀な成果を残していたが、今回のMythosモデルはそれを上回ってきた形と言えるだろう。
興味深いのは、この能力が「サイバーセキュリティ特化訓練」の結果ではないこと。純粋なコーディング能力と推論力の向上から、自然発生的に生まれた「副産物」だという。AnthropicのJared Kaplan CSOは「AIモデルが人間の専門家を凌駕するレベルに達した」と明言する。
“最強”だった専門家たちをしれっと超えてきたわけだ。
まさに異世界勇者。
なぜ公開しない?
Anthropicの決断は、業界史上初の「自ら開発した最強モデルを封印」という異例のもの。
理由は明確で、攻撃者側への悪用リスクが防御益を上回るからだ。非専門家でも高度なエクスプロイトを「数時間」で作成可能になれば、サイバー攻撃の敷居が劇的に下がる。最も倫理的なモデルでありながら「これまでで最大のリスク」と評価されている。
もし、プロンプトインジェクションで悪用されてしまったら大変なことになるということだ。
Project Glasswingでは、Mythos Previewを防御専用に限定。参加企業は自社・オープンソースの重要コードベースをスキャンし、脆弱性を先回り修正できる。Anthropicは1億ドル相当の利用クレジットと400万ドルの寄付(Linux Foundation、Apache Software Foundationなど)を投じ、業界全体への知見共有を約束した。CiscoのAnthony Grieco SVPは「古い守り方ではもう通用しない」と語り、CrowdStrikeのElia Zaitsev CTOは「攻撃者のAI活用を想定した準備が急務」と発信している。
GPT-2においても、「このモデルは危険すぎるから…」と世に出すのが遅れるということはあったが、今回はどうやら本気でヤバそうだ。
「使わせてくれ」と頼み込まないといけないかも
MythosのようなAIツールが限定提供された今、日本企業(特に金融・製造・公共セクター)は現状出遅れている。なんてったって「使えない」わけだ。
最近は日本企業開発のAIモデルの性能も向上しており、フロンティアからは一足遅れている状態にまで食らいついていた。しかし、今回の一件でまた引き離されたという感覚だ。
料金は現時点でOpus 4.6の5倍クラスの超高額$25 / $125 per million tokens(入力/出力)となると推測されている。また、モデル自体の大きさは5兆パラメータ~10兆パラメータのMoEだと噂されている。これを開発、運用できる体力がある企業・団体は相当少ないだろう。
直近のClaude Codeの流出事件がお茶目なやらかしに見えるくらい、インパクトのあるAIモデル Mythos。本気で世界を変えに来た存在と言えるだろう。
冗談抜きに、MythosがAnthropicの報告通りの性能を発揮するのであれば、急に異世界からやってきた存在に思える。
