第3回で扱ったフルスクラッチ主権型は、基盤モデルそのものを自社で握ることに価値を置いていた。今回扱う一群は、逆の判断をしている。基盤を一から作らない。強い土台を借りるか、自前でも汎用フロンティアの規模を追わず小さく抑え、浮いた資源を日本語・業種知識・エージェント接続に注ぐ。第1回の分類でいう「派生・特化型」、代表は ELYZA / cotomi v3 / Takane だ。
ひとつ先に整理しておく。この「派生・特化型」というくくりは、厳密には二つの異なる作り方を含んでいる。海外の強い公開モデルを土台に日本語と特化を重ねる派生(ELYZA、Takane)と、自前ながら汎用の規模競争に乗らず小型・特化へ振り切る独自特化(cotomi)だ。土台の出どころは違うが、共通点は一点——「汎用基盤の規模競争には乗らない」。今日の論点は、その判断が生む二つの実利、垂直特化の経済学とエージェント適性である。
基盤を作らない、という判断
フルスクラッチは、基盤モデルの自前開発に最大の資源を割く。派生・特化型はそこを節約する。資源の重心が、土台の構築から、その上の日本語・ドメイン・エージェント接続へと移る。
「土台を借りる」が現実にどう動くかは、ELYZAを見るとわかる。源内に選定されたのはLlama-3.1-ELYZA-JP-70Bで(KDDI・ELYZA共同応募体はその後辞退——第2回参照)、これはMetaのLlama 3.1がベースだ。だが同社の現行フラッグシップELYZA-Shortcut-1.0-Qwen-32Bは、アリババのQwen2.5-32B-Instructをベースにしている。さらに2026年1月には、香港大の拡散モデルDreamを土台にしたELYZA-LLM-Diffusionも公開した。土台はLlama→Qwen→Dreamと移り変わっている。これは一貫性のなさではなく、派生型の経済そのものだ。公開モデルのフロンティアが動けば、土台を載せ替える。基盤の開発費を払い続けない。
土台を小さく保つ道もある。NECのcotomiは130億パラメータ級に抑えてGPU効率と省電力を稼ぎ、富士通のTakane 32Bは、Cohereの基盤モデルを量子化・蒸留する「生成AI再構成技術」でメモリ消費を最大94%削減し、エッジデバイス上でのエージェント実行まで視野に入れている。
経済の要点はシンプルだ。借り物か小型の土台は、推論が安く、デプロイが速く、オンプレやエッジに載せやすい。汎用ベンチの総合点では譲るが、特定業務で「十分使える」水準には最短で届く。第3回で見たオンプレTCOの逆転とも噛み合う——小さいモデルほど少ないGPUで回り、逆転点が手前に来る。
エージェント適性——評価軸が「賢さ」から「使いこなし」へ移る
もう一つの実利は、時代の変わり目に効く。エージェントが普及すると、モデルに問われることが変わる。「どれだけ賢いか」から「どれだけ業務をやり切れるか」へ。総合ベンチの首位争いではなく、ツールを正しく叩けるか、長い文脈を保てるか、タスクを手順に割れるか、出力を根拠で検証できるか——この4つだ。
この土俵に、三者は明確に賭けている。
cotomi v3は、エージェント連携の標準プロトコルMCP(Model Context Protocol)に準拠し、コンテキスト長を128K(日本語で約20万字)へ拡大した。タスク分解とツール選択の精度を学習で強化し、Boxが提供するBox MCPサーバーのβに国内ISVとして初参画している。さらに、暗黙知をデータ化してWeb上の業務を自動実行するcotomi Actを2026年1月から本格提供しており、モデル単体ではなくエージェント基盤として売っている。
Takaneは、出力の正確さと監査の軸が際立つ。Cohere由来のRAGに、富士通独自のナレッジグラフ拡張RAGと「生成AI監査技術」を重ね、法規制や社内ルールへの準拠を検証できるようにしている。中央省庁とのパブリックコメント業務の実証では、約12万文字の意見を約10分で分類・要約した。エージェントが扱うのが「来歴を問われる業務」であるほど、この監査の軸が効く。
ELYZAは、タスク分解と計画の軸を研究で押している。Reasoningモデル「ELYZA-Thinking」を持ち、外部情報へのアクセスやプログラム実行を伴う複数ステップのLLMエージェントを研究している。強化学習(GRPO系)でツール使用と多段推論を鍛える方向だ。
三者の個性
ELYZA(KDDIグループ)。 2018年に東大松尾研からスピンアウトし、2019年からLLM研究開発に取り組む老舗。2024年4月にKDDIの連結子会社となり、現在はKDDIのGPU基盤を使い、セキュリティやカスタマイズを重視する大企業向けにAPI・共同開発を提供する。源内に選定されたのはMeta LlamaベースのLlama-3.1-ELYZA-JP-70B(KDDI・ELYZA共同応募体。その後辞退)だが、最新の主力はQwenベースのELYZA-Shortcut/ELYZA-Thinking、加えて拡散モデルELYZA-LLM-Diffusionと幅を広げている。土台を選び直しながら、日本語と特化、そしてエージェントへ投資を寄せる典型例だ。
cotomi v3(NEC)。 三者のなかで唯一、土台まで自前の独自開発モデル。v1(2023年7月・130億パラメータ)→v2(2024年12月)→v3(2025年7月)と速い周期で進化し、汎用の規模を追わず小型・高速・特化に振り切っている。重点は医療・金融・製造の3業種。v3ではPro/Fastを一本化し、MCP準拠・128K・エージェント性能の強化を前面に出した。源内には2026年3月に選定されている。「派生」ではなく「独自の小型特化」という第三の立ち位置だ。
Takane(富士通)。 カナダCohereのCommand R+をベースに、富士通が日本語の追加学習とファインチューニングを重ねた業務特化型LLM。プライベート環境での運用、RAGと監査、そして量子化・蒸留による軽量化を強みにする。金融・行政・医療・安全保障のように秘匿性と準拠が重い領域に向けて設計されており、源内には軽量版のTakane 32Bで選ばれた。
主権の但し書き
第3回で、派生型は土台の学習データが海外提供元のものであり、来歴を完全には自社で説明しきれない、と書いた。ELYZA(Llama=Meta/Qwen=アリババ)とTakane(Command R+=カナダCohere)は、この一歩を譲っている。基盤の「何で学習されたか」は、土台の提供元に委ねる部分が残る。cotomiは自前なのでこの問題が小さい——派生と独自の分かれ目は、ここにはっきり出る。
ただし、譲った分を運用で補う設計になっている。プライベート環境での運用、ファインチューニングに使うデータの自社統制、生成AI監査による準拠の検証、そして土台が「公開モデル」であること(重みが手に入り、自社環境に閉じられる)。源内の調達要件——学習用データの法令遵守の状況を説明できること、そして2027年度向け公募(2026年11月実施予定)に向けて評価テストを50問から300問へ拡充すると予告されたこと——に対し、派生型は土台分の説明という宿題を抱えるが、それを監査と運用の層で埋めにいく。主権の軸では一歩譲り、特化とエージェント適性の軸で取り返す、という賭けだ。
まだ言えないこと
派生型は、土台のライセンスと来歴という主権コストを構造的に抱える。エージェント適性は各社が「強化した」と謳うが、ツール実行の信頼性を第三者が横並びで測る評価は、まだ乏しい。源内に選ばれた版(Llama-3.1-ELYZA-JP-70B、cotomi v3、Takane 32B)と各社の最新版にはズレがあり、ELYZAのように土台ごと動くケースもある。そもそも源内の「選定」と「契約」は別物だ。2026年3月の選定は7件だが、同年5月に評価検証の契約に進んだのは5社で、cotomi v3とTakane 32Bは契約済み、KDDI・ELYZA共同応募体は選定後に辞退し、契約には至っていない。汎用ベンチの「賢さ」で派生・特化型を選ぶ理由は、依然として弱い。
それでも、エージェントの普及で評価軸が「使いこなし」へ移るなら、特化型の土俵は確実に広がる。汎用フロンティアの代替としてではなく、「特定の業務をやり切る道具」として読むなら、これらはすでに実戦配備の段階にある。第1回の地図でいえば、横軸(汎用性能)では中位でも、縦軸(特化)と「エージェント適性」という新しい物差しでは、十分に戦える位置にいる。
まとめ
- 派生・特化型は「基盤を作らない」戦略。強い土台を借りる(ELYZA、Takane)か、自前でも小型に振り切る(cotomi)かの違いはあるが、汎用の規模競争には乗らない点で共通する
- 垂直特化の経済学:基盤の開発費を払わない分、推論が安く・デプロイが速く・オンプレ/エッジに載せやすい。特定業務で「十分使える」水準に最短で届く
- エージェント適性:評価軸が「賢さ」から「業務をやり切る力」へ移る。長い文脈・ツール接続(MCP)・タスク分解・出力監査の4要素で測る土俵に、三者は資源を寄せている
- 三者三様:ELYZAは土台を載せ替えつつ推論・エージェントを研究、cotomiは独自小型+MCP・cotomi Act、Takaneは監査つきRAGと軽量化
- 主権の但し書き:派生型は土台の来歴で一歩譲る。だがプライベート運用・データ統制・監査・公開モデルの重み取得で補い、特化とエージェント適性で取り返しにいく
次回は、3つ目の戦略——汎用基盤の自前開発も特化への振り切りもせず、複数のモデルを「束ねる」ことに賭ける一群を扱う。第5回、Sakana AIとオーケストレーション思想。
参考情報
この記事をシェアする