AI テクノロジー

東京発・Sakana AIの「Sakana Fugu」徹底解説!次世代マルチエージェントがAIの常識を変える

2026年6月22日、東京に本社を置く有力なAI研究開発企業である(Sakana AI)は、同社にとって極めて重要な商用プロダクトである(Sakana Fugu)(サカナ・フグ)の一般提供を開始しました。

このシステムは、単一の大規模言語モデル(LLM)のパラメータ数や計算資源を際限なく拡大し続けるという従来のフロンティアAI開発の潮流に対し、明確なアーキテクチャ上のアンチテーゼを提示するものです。Sakana Fuguは、それ単体で全ての推論を行うモノリシックなモデルではありません。複数の異なるAIモデルを動的に編成し、外部からは一つの統合された基盤モデル(Foundation Model)として振る舞う(マルチエージェント・オーケストレーション・システム)です。

本システムの最大の特徴は、ユーザーから送られたプロンプトに対して自ら直接回答を生成するだけではなく、背後に控えるエージェントプール(GPT-5.5Gemini 3.1 ProClaude Opus 4.8、および各種オープンソースモデル等)の中から、タスクの性質に応じて最適なモデルを選択し、複雑な問題を分割・委譲し、最終的な出力結果を検証・統合するメタ的な役割を担う点にあります。

Sakana AIは、Fuguの最上位構成である(Fugu Ultra)モデルが、厳格なエンジニアリング、科学的推論、およびエージェント機能ベンチマークにおいて、現在の業界最高峰でありながら厳格なアクセス制限下にあるAnthropicの(Claude Fable 5)や(Mythos Preview)に匹敵、あるいは一部凌駕する性能を達成したと公表しています。

この発表は単なる技術的なマイルストーンにとどまらず、世界のAI業界を覆う地政学的力学と深く結びついています。特定企業のAPIに依存することのリスクを回避し、いかなる状況下でもフロンティアレベルのAI性能を提供する(AI主権)(AI Sovereignty)の実現手段として戦略的に位置づけられています。

企業背景とエコシステム:東京から世界へ発信する「集合知」のビジョン

Sakana Fuguの革新性を理解するためには、開発元であるSakana AIの組織的背景と、同社が一貫して追求してきた(集合知)(Collective Intelligence)という設計思想を紐解く必要があります。

東京発のユニコーン企業を牽引する経営陣

Sakana AIは2023年7月に東京で設立されたフロンティアR&D企業です。Google Brain東京チームを率いたDavid Ha(CEO)、現代のLLMの基盤となるTransformerアーキテクチャを提唱した画期的な論文「Attention Is All You Need」の共同著者であるLlion Jones(CTO)、そしてMercari等で要職を務めたRen Ito(会長)によって共同創業されました。

設立からわずかな期間で世界のAIコミュニティから極めて高い評価を獲得し、NVIDIAや日本のメガバンクなど有力企業・投資機関から資金を調達。日本を代表するユニコーン企業として確固たる地位を築いています。

社名である「Sakana(魚)」は、自然界における魚の群れのように、個々の小さな知能が協調して動的に環境に適応し、巨大な一つの集合知を形成するという生体模倣の哲学に由来しています。単一の巨大なモデルで力技で計算資源を消費するのではなく、特化型の比較的小規模なエージェント群を連携させることで、単一モデルの限界を超える能力を創出するというのが同社の中核的な信念です。

プロダクトエコシステム:Sakana Marlinとの強力な連携

Sakana AIのこの哲学は、Fuguのリリース直前に発表された同社初の商用プロダクト(Sakana Marlin)にも色濃く反映されています。Marlinは仮想CSO(最高戦略責任者)として機能するB2B向けの自律型リサーチエージェントです。

最大8時間という長大な時間軸で推論ループを自律的に回し続け、最大100ページに及ぶ戦略レポートとプレゼンテーション用スライドを生成します。Marlinが特定業務に特化した垂直統合型のソリューションであるとすれば、今回リリースされたFuguは、あらゆるアプリケーションに集合知を組み込むための水平型のインフラストラクチャAPIと言えます。

地政学的カタリスト:Claude Fable 5の輸出規制とAI主権の顕在化

Sakana Fuguの市場価値を決定づけたのは、2026年6月に発生した前代未聞の地政学的インシデントです。

Anthropic社が最高性能モデル(Claude Fable 5)を発表したわずか数日後、米国政府は国家安全保障上の懸念を理由に、米国内外を問わず全ての外国籍者に対する同モデルへのアクセス停止を命じる緊急指令を下しました。特定の米国プロバイダーのAPI上にインフラを構築することは、政府の政策決定一つで一夜にしてシステムが機能停止する(重大な脆弱性)であることを世界中の企業が痛感したのです。

Sakana Fuguは、この問題に対するアーキテクチャレベルでの直接的な解答として設計されています。Fuguのエージェントプールは完全にスワップ(入れ替え)可能であり、仮にあるプロバイダーへのアクセスが遮断されても、即座に他国のオープンソースモデルなどを組み合わせてワークフローを動的に再構築します。これにより企業はインフラストラクチャの崩壊を回避し、AI主権を維持することが可能となります。

アーキテクチャの深層:自律的に学習されたオーケストレーション

従来のマルチエージェントシステムは、開発者自身がルーティングのロジックや役割分担をハードコーディングする必要がありました。しかし、Sakana Fuguはそれ自体が(他のLLMを呼び出し、連携させる方法)を学習した言語モデルです。ユーザーから見れば単一のAPIコールに過ぎませんが、内部では適応的かつ極めて複雑な協調トポロジーが自動的に構築されています。

この革新的なアプローチの根底には、(TRINITY)と(Conductor)という二つの画期的な技術が存在します。

TRINITY:進化型戦略による軽量コーディネーター

TRINITYは、非常に軽量なコーディネーターモデルを用いて、多様なLLM群を多段階で編成するシステムです。システム全体の学習可能な総パラメータ数は2万未満に抑えられており、驚異的な計算効率を実現しています。

実際のタスク処理において、TRINITYはマルチターンの対話を通じて、プール内のLLMに対して以下の3つの明確な役割のいずれかを動的に割り当てます。

  • Thinker(思考役): 高レベルの戦略立案や問題の分解を行う。
  • Worker(実行役): 具体的な問題解決のステップを直接実行する。
  • Verifier(検証役): 蓄積された解答の正確性を評価し、承認する。

Conductor:強化学習による自然言語でのトポロジー設計

Conductorは、システム自体を複数のLLMに対するメタプロンプト・エンジニアとして機能させます。ユーザーからの複雑な問題を受け取ると、単にモデルを選ぶだけでなく、タスクを論理的なステップに分割し、どのエージェントにどのサブタスクを割り当てるかを動的に決定します。

純粋なエンドツーエンドの報酬最大化の過程で、「どのフロンティアモデルがどの領域に強いか」という固有の特性を自然に学習し、人間の熟練エンジニアのチーム編成に酷似したワークフローを自動的に構築します。

再帰的テスト時スケーリング

Fuguの最も特筆すべき機能の一つが、(再帰的呼び出し)によるテスト時スケーリングの実現です。自らが構成したチームが一度の推論で正答に到達できなかった場合、エラーや不足を特定し、それを修正するための新たなワークフローを動的に立ち上げます。

単に考える時間を長くするのではなく、エラーに反応して新たな役割分担のチームを再構築するという新しい次元でのスケーリングを達成しており、極めて精度の高い回答を導き出すことが可能となりました。

定量評価:フロンティアモデルとのベンチマーク比較

Sakana AIは、Fuguおよび最高峰のFugu Ultraのスコアを、既存のフロンティアモデルと直接比較したベンチマーク結果を公開しています。(※Fable 5は輸出規制対象のため、Fuguのエージェントプールには含まれていません)

以下は主要なベンチマークにおけるスコアの一部抜粋です。

  • SWE-Bench Pro(ソフトウェア開発): Fugu Ultra(73.7) / GPT-5.5(58.6) / Opus 4.8(69.2)
  • LiveCodeBench(ライブコーディング): Fugu Ultra(93.2) / GPT-5.5(88.4) / Opus 4.8(84.8)
  • GPQA-Diamond(大学院レベルの科学推論): Fugu Ultra(95.5) / GPT-5.5(93.6) / Opus 4.8(94.3)

データが示す通り、Fugu Ultraはプール内にFable 5を含まないにもかかわらず、ソフトウェアエンジニアリングや高度な推論において、既存のアクセス可能な全てのモデルを凌駕する性能を記録しました。ただし、コンテキストの検索能力など一部の特定領域では、依然として他の単一モデルが強みを持つ場面も確認されており、マルチエージェント特有の適材適所の重要性が示唆されています。

定性的評価:実世界のワークフローとベータテスターの洞察

ベンチマーク以上にFuguの真価を証明しているのが、実世界における長大なワークフローでのパフォーマンスです。500名近いエンジニアや研究者からのフィードバックにより、数十ステップに及ぶ多段階の作業における圧倒的な優位性が確認されています。

  • サイバーセキュリティ: 情報収集から脆弱性検査、完全なレポート作成までを一気通貫で自律的に完了。危険なアクションを回避する高い自己制御能力が評価されました。
  • コードレビュー: 巨大なコードベースに対し、他のツールが見逃す微細なロジックの欠陥やエッジケースを20件以上網羅的に洗い出しました。
  • ペルソナの安定性: 長時間の対話セッションにおいて、他の巨大モデルが陥りやすいコンテキストの忘却(ペルソナの崩壊)を起こさず、一貫したアイデンティティと論理性を維持しました。

プロダクトラインナップと経済モデルの受容性

FuguはOpenAIフォーマットと完全な互換性を持つAPIとして提供され、日常利用向けの標準モデル「Sakana Fugu」と、高負荷タスク向けの最上位モデル「Sakana Fugu Ultra」の2つのバリエーションがあります。

サブスクリプションと従量課金体系

  • Standardプラン: 月額20ドル(小規模チーム向け)
  • Proプラン: 月額100ドル(集中的な作業向け)
  • Maxプラン: 月額200ドル(高負荷な長期実行向け)

エンタープライズ向けのAPI従量課金では、Fugu Ultraは100万トークンあたり入力5.00ドル、出力30.00ドルに設定されています。長大なコンテキストでは価格が変動する仕組みや、単純なタスクの場合は基盤モデルの標準レートのみが請求されるコスト最適化ロジックも組み込まれています。

開発者コミュニティの反応

この料金体系については、背後で呼び出すモデルの直接利用価格以上の「プレミアム価格」が設定されているとして、一部の開発者から議論を呼んでいます。

しかし、Fuguが提供する(複雑性の完全な隠蔽)は、自力で連携フローを構築・運用する莫大なエンジニアリングコストを削減します。簡単なタスクには安価なモデルを、複雑なタスクのみに巨大モデルを自動で割り当てるため、結果的に長期的・平均的なコストは最適化されるという強力な経済的合理性が存在します。

EU市場におけるコンプライアンスの壁と今後の課題

Fuguが抱える実務上の課題として、EU特有の厳格なAI法規(GDPR等)への対応が挙げられます。現時点ではEUおよびEEA圏内では利用不可となっています。

これは、マルチエージェント特有の「データが背後のどのプロバイダーでどのように処理されたか」というトラッキングが技術的に複雑化しているためです。Sakana AIは特定のプロバイダーを除外するオプトアウト機能を提供していますが、本格的なエンタープライズ導入に向けては、完全な監査証跡の提示が今後の鍵となります。

結論:AI開発のネクスト・フロンティア

Sakana AIの「Sakana Fugu」は、AIモデルを単なる情報引き出しツールから、自律的にリソースを編成してプロジェクトを完遂するマネージャーへと昇華させる歴史的なシステムです。

米中対立や輸出規制という地政学的な逆風の中、基盤モデルへのアクセスを確保し(AI主権)を担保する実用的なソリューションを、東京から世界へいち早く投入したSakana AIの戦略的先見性は極めて高く評価されます。

AI開発の主戦場は「単一の巨大な知能の創造」から、「多様な知能の集合をいかに指揮するか」という(オーケストレーション)の領域へと移行しました。Sakana Fuguは、今後のエンタープライズAIインフラの標準を根本から再定義する可能性を秘めています。

-AI, テクノロジー
-, , , , , , , ,