← ブログ一覧

Sakana「Fugu」とは?複数のAIを束ねて1つに使う、日本発のオーケストレーションをわかりやすく解説

Sakana AIFugu生成AIマルチエージェントAIオーケストレーションベンダーロックイン中小企業AI活用

2026 年 6 月、東京の AI スタートアップ Sakana AI が公開した「Fugu(フグ)」が話題になっています。一言でいえば、Claude・GPT・Gemini といった複数の最先端 AI を“裏で”束ね、利用者からは 1 つのモデルのように見える仕組みです。

「新しい AI モデルがまた 1 つ増えた」という話ではありません。むしろ逆で、すでにある優秀な AI たちを“指揮”して、どれか 1 社のモデル単体よりも良い答えを出そうという発想です。なぜそれが今これほど注目されているのか——仕組みから注意点、そして私たち中小企業にとっての意味まで、順番に見ていきます。

まず一言でいうと:AI たちの「優秀なマネージャー」

Fugu をイメージするなら、優秀なプロジェクトマネージャーが近いです。あなたが仕事を 1 つ渡すと、マネージャーは「これは自分で片付けられる」「これは A さんと B さんに分けて任せ、最後に自分がまとめよう」と判断し、結果を 1 つの成果物にして返してくれる。誰に何を頼むかの采配と、バラバラの結果を 1 つにまとめる作業を、すべて裏側でやってくれるわけです。

技術的にはこれを「マルチエージェント・オーケストレーション」(複数の AI エージェントの指揮・調整)と呼びます。

仕組み:どうやって複数の AI を束ねるのか

Fuguの仕組み:1つのAPIに送ると、司令塔のFuguが判断してモデルのプールに振り分け、統合して1つの答えを返す

流れはこうです。

  1. あなたは1 つの APIにリクエストを送る(普段使っているツールの接続先を変えるだけ。OpenAI 互換なので大きな改修は不要)。
  2. Fugu 本体が司令塔になり、「自分で答えるか、誰に振り分けるか」を判断する。
  3. 必要なら、モデルのプール(Claude・GPT・Gemini など)の中から適切なものに作業を振る。
  4. 返ってきた答えを検証し、統合して、1 つの答えとしてあなたに返す。

面白いのは、この司令塔(Fugu)自体が、「いつ・誰に・どう任せるか」を学習した 1 つの言語モデルだという点です。人間が「この作業はこのモデル」とルールを決め打ちするのではなく、協調のやり方そのものを Fugu が学んでいる。この仕組みは、Sakana AI が ICLR 2026 で発表した 2 本の論文(TRINITYConductor)が土台になっています。

なぜ「束ねる」と強いのか

そもそも、なぜ複数を束ねると良いのか。理由はシンプルで、どの AI も、すべてが得意なわけではないからです。

あるモデルは難しい推論が得意でも、別の場面では自信満々に間違える。別のモデルなら、その間違いに気づける。それぞれの「得意」を活かし、「苦手」を他でカバーし合えば、単体よりも正確で、騙されにくい答えになる——これが束ねる発想の核心です(専門的には「Mixture-of-Agents」と呼ばれる手法の一種です)。

2 つのモデル:Fugu と Fugu Ultra

Fugu は 2 種類が提供されていて、用途で選びます。

  • Fugu:速さ重視。日常的なコーディング支援、チャット、コードレビューなど「サッと良い答えがほしい」場面向け。
  • Fugu Ultra:品質重視。難しく、何段階もあるタスク(研究の再現、複雑な分析、セキュリティ調査など)向け。

なぜ今、これが大きなニュースなのか

Fugu がここまで注目される理由は、性能だけではありません。「1 社の AI に依存することのリスク」を真正面から突いているからです。

1社のAIに依存すると止まったとき業務も止まるが、Fuguはプール内のモデルを差し替えて継続できる

直接のきっかけは、Anthropic 社の Fable/Mythos モデルが輸出規制で突然使えなくなった出来事でした。重要な業務を 1 社の API に頼っていると、規制や外交の変化で、ある日突然止まる可能性がある。Fugu なら、プールの中のモデルを差し替えながら、その中断を回避できる——Sakana はこれを「AI 主権(AI sovereignty)」と呼んでいます。

性能(※ここは Sakana 自身の公表値)

Sakana の発表によれば、Fugu Ultra は、輸出規制中の Fable 5・Mythos Preview と肩を並べる性能を、それらをプールに含めずに達成したとされます。たとえば、ソフトウェア開発の難問を集めた指標「SWE-Bench Pro」では——

モデルSWE-Bench Pro
Fugu Ultra73.7%
Claude Opus 4.869.2%
GPT-5.558.6%
Gemini 3.1 Pro54.2%

ただし、ここは冷静に。これらはすべて Sakana 自身が公開した数値であり、比較対象のスコアは各社の公表値、内部のモデル選択ロジックは非公開です。第三者による独立した検証ではない点は、押さえておくべきです。

鵜呑みにしないための 4 つの留意点

  1. 「主権」の主張には反論もある:結局はプール内のモデル(Claude の Opus 等)に依存しており、自社ベンチマークにも他社の独自モデルを使っている、という指摘があります。
  2. コストは未知数:複数モデルを動かすぶん、トークン消費・費用がどれだけ増えるかは、発表で明示されていません。
  3. 実利用の評価はまちまち:あるテストでは、Fugu Ultra が Claude Opus 4.8 より大幅に速く・安く仕上げた一方、「出力の質は Opus の方が好み」という声もありました。
  4. “束ねる”工夫自体は新しくない:複数モデルをうまく組み合わせる「ハーネス・エンジニアリング」は、以前からある考え方です。

料金

  • サブスク:Standard 月$20、Pro 月$100(10 倍枠)、Max 月$200(30 倍枠)。従量課金(pay-as-you-go)も選べます。
  • Fugu Ultraは、入力 $5/100 万トークン、出力 $30/100 万トークン。
  • OpenAI 互換 API。Fugu と Fugu Ultra は全プランに含まれます。

中小企業にとっての実務的な意味

最後に、私たちのような立場——中小企業で AI を業務に取り入れている側——から見た、現実的な話を。

率直に言うと、Fugu は開発者・技術的なワークフロー向けの API プロダクトです。チャットやチームプランで AI を使っている段階の会社が、今すぐ乗り換える類のものではありません。

ただし、Fugu が突きつける論点——「1 社の AI に業務を預けすぎるリスク」は、私たちにとっても他人事ではありません。実際にモデルが規制で止まった例がある以上、AI に任せる範囲が広がるほど、「使えなくなったら、どう続けるか」を考えておく価値があります。

結論として、今は乗り換えを急ぐより“注視”する対象。そして、特定のツール 1 つに業務を縛られすぎない設計にしておく——この姿勢こそが、Fugu の話から私たちが持ち帰るべき、いちばん実務的な教訓です。

まとめ

  • Fugu は、複数のフロンティア AI を束ねて 1 つのモデルのように使う、Sakana AI のオーケストレーションシステム。
  • 売りは性能と「1 社依存からの脱却」。背景に Anthropic Fable/Mythos の輸出規制がある。
  • 性能の数字は Sakana の自己申告であり、コストや独立検証には未知数が残る。
  • 中小企業は、今すぐ採用というより「ベンダーに依存しすぎない設計」という教訓を受け取るのが実際的。

出典・参考

本記事の数値・ベンチマークは、特記なき場合 Sakana AI の公表値に基づきます(2026 年 6 月時点)。性能比較は同社の自己申告であり、第三者による独立した検証ではありません。

Read next

他の記事

AI・DXの導入、どこから手をつけるか迷ったら

Acetyl:Techが、あなたの会社で「本当に使われる形」まで設計します。まずはお気軽にご相談ください。

無料で相談する