第1回で、国産LLMの地図には「高性能×高主権」という空白地帯があり、国産勢は3つの戦略でそこを攻めている、と書いた。第2回では、政府がその足元に「安定需要」という荷重をかけ、縦軸(主権)の床を踏み固めにきた、という話をした。
今回からは各論に降りる。最初に扱うのは、その床を最も深く掘っている一群——汎用基盤を他社モデルに頼らず、一から自前で作る「フルスクラッチ主権型」だ。代表はNTTのtsuzumi 2、Preferred NetworksのPLaMo、SB Intuitions(ソフトバンク)のSarashina。
汎用ベンチマークの総合点で見れば、これらは海外3強に及ばない。それでも一から作ることに賭けるのは、性能とは別の物差しで効く実利があるからだ。理由は二つある。オンプレ運用のコスト逆転と、学習データの法的クリーンさ。順に見ていく。
三者三様、しかし思想は同じ
まず全体像を押さえておく。
| tsuzumi 2 | PLaMo | Sarashina | ||
|---|---|---|---|---|
| 開発元 | NTT(提供:NTTデータ等) | Preferred Networks | SB Intuitions(ソフトバンク) | |
| 規模 | 約30B・GPU1基で動作 | 31B(2.0 Prime)。3.0 Primeのパラメータ数は非公開 | mini〜大型(数千億規模) | |
| 価格 | 法人問い合わせ | 公開(Standardプラン:入力60円/出力250円・100万トークンあたり) | 法人向け | |
| 主権の作り方 | フルスクラッチ純国産 | フルスクラッチ純国産・NICT共同 | フルスクラッチ純国産・国内クラウド | |
| 源内の契約版 | tsuzumi 2 | PLaMo 2.0 Prime | Sarashina3 mini | |
| 最新版・特徴 | Vision対応・金融/医療/公共に強い | 3.0 Prime(256Kコンテキスト・推論/非推論の2系統) | Oracle Alloyでデータ主権を担保 |
規模は数十billion〜数千billionまで幅があるが、共通しているのは「基盤モデルそのものを自社で握る」という一点だ。海外製のモデルを土台にせず、トークナイザから学習データまで自前で組む。この共通点が、これから話す二つの実利の源になる。
理由その1:オンプレ運用のコスト逆転
エージェントが普及すると、AIのコストは「呼び出し回数」で膨らむ。1回の処理で何度もモデルを叩くため、従量課金のAPIは利用量に比例して青天井に伸びていく(この力学は別連載『AIエージェント構築、その前に』第1回で詳述した)。
一方、自前のGPUでモデルを動かすオンプレ運用は、初期投資こそ重いが、その後の増え方はゆるやかだ。だから利用量がある水準を超えると、累積コストはどこかでオンプレ側が安くなる。これが「逆転」だ。
この逆転点を企業の手元に引き寄せようとしているのが、フルスクラッチ勢だ。tsuzumi 2が「30Bという規模でGPU1基で動くこと」に執着するのは、まさにそのためで、NTTは大規模モデル(400B〜700B級)と比べて推論コストを約10〜20分の1に抑えられるとしている。PLaMoも1GPUで動かせる設計で、しかも料金を公開している(Standardプラン:入力60円/出力250円・100万トークンあたり)。価格が見えるので、中小企業でも試算しやすい。
ただし、逆転は「必ず起きる」ものではない。逆転点は利用量・モデルサイズ・GPUの調達と運用の費用で大きく動く。高頻度・大量利用の企業ほど早く訪れるが、利用が散発的ならAPIが有利なままだ。自社の利用量と運用体力で試算すべき問題であって、一般論で「オンプレが得」とは言えない。
理由その2:学習データの法的クリーンさ
二つ目は、コストよりも本質的かもしれない。フルスクラッチであることは、学習データの権利処理と法令遵守を、最初から最後まで自社で統制できることを意味する。
派生型——たとえば海外製の基盤モデルを土台に日本語を足したモデル——は、土台部分の学習データが他社(多くは海外企業)のものだ。何で学習されたか、権利関係はどうか、を自社で完全には説明できない。フルスクラッチは、その土台ごと自前で作る。
この差が効くのは、金融・医療・行政・防衛のように、データの行き先と来歴を説明する責任が重い領域だ。「このモデルは何で学習され、データは国外に出ないか」を自社の言葉で答えられること。それは性能の話ではなく、統制の話だ。性能で追いつかれても、統制の所在は動かない——第1回で「縦軸は消えない」と書いたのは、この意味だった。
この「来歴を説明できること」は、すでに調達の入口で問われ始めている。デジタル庁は源内の選定で「学習用データに関する法令遵守の状況」を具体的に説明できることを条件に挙げ、2027年度向けの公募でも応募書類に学習データの法令遵守状況の説明を求めている(行政実務を測る評価テストも50問から300問へ拡充された)。学習データの法的クリーンさは、作り手の自己申告ではなく、政府調達の審査項目になりつつある。
三者の個性
同じフルスクラッチでも、三者の狙いは少しずつ違う。
tsuzumi 2(NTT)。 NTTが長年の自然言語処理研究を結集した完全国産モデル。30Bという軽さでGPU1基動作・低い推論コストを武器に、金融・医療・公共の知識をあらかじめ強化している。オンプレ運用と機密性の高さを求める企業・官公庁に向く設計で、引き合いも旺盛だと報じられている。2026年5月には画像も扱えるVisionモデルが加わった(NTTグループ各社を通じて順次提供)。
PLaMo(Preferred Networks)。 純国産フルスクラッチで、料金を公開し一般APIを提供している点が特徴的だ。OpenAI互換APIで導入しやすく、中小企業でも今すぐ試せる。2026年6月22日には最新版のPLaMo 3.0 Primeを正式リリースし、推論/非推論の2系統と256Kコンテキストを備えた。提供形態もクラウドAPI・オンプレミスに加えAmazon Bedrock MarketplaceとSnowflakeへ広がり、既存のクラウド基盤からそのまま試せる。NICTとの共同開発やGENIAC(GENerative AI Accelerator Challenge。経産省・NEDOのプログラム)採択など、国の育成策とも噛み合っている。源内に選定されたのは前世代の「2.0 Prime」だが、モデルは速い周期で進化している。
Sarashina(SB Intuitions)。 ソフトバンク傘下が開発する純国産モデル。軽量な「Sarashina3 mini」から数千億規模の大型版まで幅を持つ。注目点は、Oracle Alloyを採用した国内クラウド「Cloud PF Type A」上での提供によってデータ主権を確保していることだ。2026年6月から順次提供が始まった。データを国外に出せない要件を持つ顧客にとって、これは性能以前の前提条件になる。
まだ言えないこと
フルスクラッチ勢は、汎用ベンチマークの総合点では依然として海外3強に及ばない。横軸(汎用性能)で選ぶ理由はまだ弱い。オンプレのコスト逆転は高頻度利用が前提で、GPUを調達し運用する体力も要る。価格を公開していないモデルは、導入前の比較がしづらい。そして源内に採用された版(PLaMo 2.0 Prime、Sarashina3 mini)と各社の最新版にはズレがあり、モデルは絶えず動いている。
それでも、「総合では負けるが、特定の業務では伍する」「主権とコストの軸では強い」という第1回の結論は、フルスクラッチ勢において最も純度高く成り立つ。汎用代替ではなく、主権の保険・オンプレの経済として読むなら、これらはすでに実用段階にある。
まとめ
- フルスクラッチ主権型(tsuzumi 2 / PLaMo / Sarashina)の共通点は、基盤モデルそのものを自社で握ること
- 自前が効く理由その1はコスト。高頻度利用なら、累積コストはどこかでオンプレがAPIを下回る(逆転点は条件次第)
- 理由その2は法的クリーンさ。学習データの権利・来歴・行き先を自社で統制できる。これは性能ではなく統制の価値で、金融・医療・行政で重い
- 三者三様:tsuzumiは軽量・低推論コスト、PLaMoは料金公開と速い進化、SarashinaはOracle Alloyでのデータ主権
- ただし汎用性能では海外3強に及ばず、オンプレ逆転は利用量と運用体力が前提。汎用代替ではなく「主権の保険・オンプレの経済」として読むのが正しい
次回は、もう一つの戦略——汎用基盤の開発を捨て、ベースモデルに日本語と特化を重ねる「派生・特化型」を扱う。ELYZA / cotomi v3 / Takane。垂直特化の経済学と、エージェント適性(MCP準拠など)が論点になる。
参考情報
この記事をシェアする