Sakana「Fugu」とは?複数のAIを束ねて1つに使う、日本発のオーケストレーションをわかりやすく解説

2026 年 6 月、東京の AI スタートアップ Sakana AI が公開した「Fugu(フグ)」が話題になっています。一言でいえば、Claude・GPT・Gemini といった複数の最先端 AI を“裏で”束ね、利用者からは 1 つのモデルのように見える仕組みです。
「新しい AI モデルがまた 1 つ増えた」という話ではありません。むしろ逆で、すでにある優秀な AI たちを“指揮”して、どれか 1 社のモデル単体よりも良い答えを出そうという発想です。なぜそれが今これほど注目されているのか——仕組みから注意点、そして私たち中小企業にとっての意味まで、順番に見ていきます。
まず一言でいうと:AI たちの「優秀なマネージャー」
Fugu をイメージするなら、優秀なプロジェクトマネージャーが近いです。あなたが仕事を 1 つ渡すと、マネージャーは「これは自分で片付けられる」「これは A さんと B さんに分けて任せ、最後に自分がまとめよう」と判断し、結果を 1 つの成果物にして返してくれる。誰に何を頼むかの采配と、バラバラの結果を 1 つにまとめる作業を、すべて裏側でやってくれるわけです。
技術的にはこれを「マルチエージェント・オーケストレーション」(複数の AI エージェントの指揮・調整)と呼びます。
仕組み:どうやって複数の AI を束ねるのか
流れはこうです。
- あなたは1 つの APIにリクエストを送る(普段使っているツールの接続先を変えるだけ。OpenAI 互換なので大きな改修は不要)。
- Fugu 本体が司令塔になり、「自分で答えるか、誰に振り分けるか」を判断する。
- 必要なら、モデルのプール(Claude・GPT・Gemini など)の中から適切なものに作業を振る。
- 返ってきた答えを検証し、統合して、1 つの答えとしてあなたに返す。
面白いのは、この司令塔(Fugu)自体が、「いつ・誰に・どう任せるか」を学習した 1 つの言語モデルだという点です。人間が「この作業はこのモデル」とルールを決め打ちするのではなく、協調のやり方そのものを Fugu が学んでいる。この仕組みは、Sakana AI が ICLR 2026 で発表した 2 本の論文(TRINITY と Conductor)が土台になっています。
なぜ「束ねる」と強いのか
そもそも、なぜ複数を束ねると良いのか。理由はシンプルで、どの AI も、すべてが得意なわけではないからです。
あるモデルは難しい推論が得意でも、別の場面では自信満々に間違える。別のモデルなら、その間違いに気づける。それぞれの「得意」を活かし、「苦手」を他でカバーし合えば、単体よりも正確で、騙されにくい答えになる——これが束ねる発想の核心です(専門的には「Mixture-of-Agents」と呼ばれる手法の一種です)。
2 つのモデル:Fugu と Fugu Ultra
Fugu は 2 種類が提供されていて、用途で選びます。
- Fugu:速さ重視。日常的なコーディング支援、チャット、コードレビューなど「サッと良い答えがほしい」場面向け。
- Fugu Ultra:品質重視。難しく、何段階もあるタスク(研究の再現、複雑な分析、セキュリティ調査など)向け。
なぜ今、これが大きなニュースなのか
Fugu がここまで注目される理由は、性能だけではありません。「1 社の AI に依存することのリスク」を真正面から突いているからです。
直接のきっかけは、Anthropic 社の Fable/Mythos モデルが輸出規制で突然使えなくなった出来事でした。重要な業務を 1 社の API に頼っていると、規制や外交の変化で、ある日突然止まる可能性がある。Fugu なら、プールの中のモデルを差し替えながら、その中断を回避できる——Sakana はこれを「AI 主権(AI sovereignty)」と呼んでいます。
性能(※ここは Sakana 自身の公表値)
Sakana の発表によれば、Fugu Ultra は、輸出規制中の Fable 5・Mythos Preview と肩を並べる性能を、それらをプールに含めずに達成したとされます。たとえば、ソフトウェア開発の難問を集めた指標「SWE-Bench Pro」では——
| モデル | SWE-Bench Pro |
|---|---|
| Fugu Ultra | 73.7% |
| Claude Opus 4.8 | 69.2% |
| GPT-5.5 | 58.6% |
| Gemini 3.1 Pro | 54.2% |
ただし、ここは冷静に。これらはすべて Sakana 自身が公開した数値であり、比較対象のスコアは各社の公表値、内部のモデル選択ロジックは非公開です。第三者による独立した検証ではない点は、押さえておくべきです。
鵜呑みにしないための 4 つの留意点
- 「主権」の主張には反論もある:結局はプール内のモデル(Claude の Opus 等)に依存しており、自社ベンチマークにも他社の独自モデルを使っている、という指摘があります。
- コストは未知数:複数モデルを動かすぶん、トークン消費・費用がどれだけ増えるかは、発表で明示されていません。
- 実利用の評価はまちまち:あるテストでは、Fugu Ultra が Claude Opus 4.8 より大幅に速く・安く仕上げた一方、「出力の質は Opus の方が好み」という声もありました。
- “束ねる”工夫自体は新しくない:複数モデルをうまく組み合わせる「ハーネス・エンジニアリング」は、以前からある考え方です。
料金
- サブスク:Standard 月$20、Pro 月$100(10 倍枠)、Max 月$200(30 倍枠)。従量課金(pay-as-you-go)も選べます。
- Fugu Ultraは、入力 $5/100 万トークン、出力 $30/100 万トークン。
- OpenAI 互換 API。Fugu と Fugu Ultra は全プランに含まれます。
中小企業にとっての実務的な意味
最後に、私たちのような立場——中小企業で AI を業務に取り入れている側——から見た、現実的な話を。
率直に言うと、Fugu は開発者・技術的なワークフロー向けの API プロダクトです。チャットやチームプランで AI を使っている段階の会社が、今すぐ乗り換える類のものではありません。
ただし、Fugu が突きつける論点——「1 社の AI に業務を預けすぎるリスク」は、私たちにとっても他人事ではありません。実際にモデルが規制で止まった例がある以上、AI に任せる範囲が広がるほど、「使えなくなったら、どう続けるか」を考えておく価値があります。
結論として、今は乗り換えを急ぐより“注視”する対象。そして、特定のツール 1 つに業務を縛られすぎない設計にしておく——この姿勢こそが、Fugu の話から私たちが持ち帰るべき、いちばん実務的な教訓です。
まとめ
- Fugu は、複数のフロンティア AI を束ねて 1 つのモデルのように使う、Sakana AI のオーケストレーションシステム。
- 売りは性能と「1 社依存からの脱却」。背景に Anthropic Fable/Mythos の輸出規制がある。
- 性能の数字は Sakana の自己申告であり、コストや独立検証には未知数が残る。
- 中小企業は、今すぐ採用というより「ベンダーに依存しすぎない設計」という教訓を受け取るのが実際的。
出典・参考
- Sakana AI 公式「Sakana Fugu: One Model to Command Them All」 https://sakana.ai/fugu-release/
- Sakana AI 公式「Sakana Fugu」製品ページ https://sakana.ai/fugu/
- Sakana AI 公式「Sakana Fugu(ベータ告知)」 https://sakana.ai/fugu-beta/
- DataCamp「Sakana Fugu: Features, Benchmarks, and How It Works」 https://www.datacamp.com/blog/sakana-fugu
- The Decoder「Sakana AI's Fugu orchestrates multiple LLMs to match Anthropic's Fable and Mythos benchmarks」 https://the-decoder.com/sakana-ais-fugu-orchestrates-multiple-llms-to-match-anthropics-fable-and-mythos-benchmarks/
- MarkTechPost「Sakana AI Launches Sakana Fugu」 https://www.marktechpost.com/2026/06/22/sakana-ai-launches-sakana-fugu-an-orchestration-model-that-routes-tasks-across-a-swappable-pool-of-frontier-llms/
本記事の数値・ベンチマークは、特記なき場合 Sakana AI の公表値に基づきます(2026 年 6 月時点)。性能比較は同社の自己申告であり、第三者による独立した検証ではありません。
Read next
他の記事

2025年の崖から、2030年の奈落へ|技術的負債は“複利”で膨らみ、AIに乗れない会社を生む
「2025年の崖」は、越えれば終わりではありません。データを整理せず属人化したシステムを膨らませ続けると、技術的負債が“複利”で膨らみ、いざという時のDXコストが跳ね上がります。さらにAI時代には、データが汚いままではAIすら効かない——。中小企業がこの“奈落”を避けるための考え方を、最新データとともに解説します。
読む
発注した業務システムが“現場で使われない”のはなぜか|7割が陥る失敗と、“使われる形”にする進め方
高い費用をかけて導入した業務システムやAIツールが、数ヶ月後には誰も触らない“置物”に——。各種調査では、導入企業のおよそ7割が「成果に結びつかない・定着しない」と答えています。現場でシステムが使われなくなる6つの共通原因と、“使われる形”へ変える具体的な進め方を、中小企業の目線で解説します。
読む
【2026年最新】結局どのAIを使えばいい? 中小企業が“業務で使う”ためのAI比較 — ChatGPT・Claude・Gemini・新興勢
2026年、AIは「チャットの道具」から「作業を代行する働き手」に変わりました。ChatGPT・Claude・Gemini・Copilot、そして急成長中のDeepSeek・Grok・Mistralまで、中小企業が“業務で使う”目線でやさしく比較。AI選びと導入で失敗しない勘所を最新情報で解説します。
読む