国産LLMの現在地　第3回：フルスクラッチ主権型 — tsuzumi 2 / PLaMo / Sarashina。「自前」が効く二つの理由 - Blog - unType Inc. | 株式会社アンタイプ

第1回で、国産LLMの地図には「高性能×高主権」という空白地帯があり、国産勢は3つの戦略でそこを攻めている、と書いた。第2回では、政府がその足元に「安定需要」という荷重をかけ、縦軸（主権）の床を踏み固めにきた、という話をした。

今回からは各論に降りる。最初に扱うのは、その床を最も深く掘っている一群——汎用基盤を他社モデルに頼らず、一から自前で作る「フルスクラッチ主権型」だ。代表はNTTのtsuzumi 2、Preferred NetworksのPLaMo、SB Intuitions（ソフトバンク）のSarashina。

汎用ベンチマークの総合点で見れば、これらは海外3強に及ばない。それでも一から作ることに賭けるのは、性能とは別の物差しで効く実利があるからだ。理由は二つある。オンプレ運用のコスト逆転と、学習データの法的クリーンさ。順に見ていく。

三者三様、しかし思想は同じ

まず全体像を押さえておく。

	tsuzumi 2	PLaMo	Sarashina
開発元	NTT（提供：NTTデータ等）	Preferred Networks	SB Intuitions（ソフトバンク）
規模	約30B・GPU1基で動作	31B（2.0 Prime）。3.0 Primeのパラメータ数は非公開	mini〜大型（数千億規模）
価格	法人問い合わせ	公開（Standardプラン：入力60円／出力250円・100万トークンあたり）	法人向け
主権の作り方	フルスクラッチ純国産	フルスクラッチ純国産・NICT共同	フルスクラッチ純国産・国内クラウド
源内の契約版	tsuzumi 2	PLaMo 2.0 Prime	Sarashina3 mini
最新版・特徴	Vision対応・金融／医療／公共に強い	3.0 Prime（256Kコンテキスト・推論／非推論の2系統）	Oracle Alloyでデータ主権を担保

規模は数十billion〜数千billionまで幅があるが、共通しているのは「基盤モデルそのものを自社で握る」という一点だ。海外製のモデルを土台にせず、トークナイザから学習データまで自前で組む。この共通点が、これから話す二つの実利の源になる。

理由その1：オンプレ運用のコスト逆転

エージェントが普及すると、AIのコストは「呼び出し回数」で膨らむ。1回の処理で何度もモデルを叩くため、従量課金のAPIは利用量に比例して青天井に伸びていく（この力学は別連載『AIエージェント構築、その前に』第1回で詳述した）。

一方、自前のGPUでモデルを動かすオンプレ運用は、初期投資こそ重いが、その後の増え方はゆるやかだ。だから利用量がある水準を超えると、累積コストはどこかでオンプレ側が安くなる。これが「逆転」だ。

この逆転点を企業の手元に引き寄せようとしているのが、フルスクラッチ勢だ。tsuzumi 2が「30Bという規模でGPU1基で動くこと」に執着するのは、まさにそのためで、NTTは大規模モデル（400B〜700B級）と比べて推論コストを約10〜20分の1に抑えられるとしている。PLaMoも1GPUで動かせる設計で、しかも料金を公開している（Standardプラン：入力60円／出力250円・100万トークンあたり）。価格が見えるので、中小企業でも試算しやすい。

ただし、逆転は「必ず起きる」ものではない。逆転点は利用量・モデルサイズ・GPUの調達と運用の費用で大きく動く。高頻度・大量利用の企業ほど早く訪れるが、利用が散発的ならAPIが有利なままだ。自社の利用量と運用体力で試算すべき問題であって、一般論で「オンプレが得」とは言えない。

理由その2：学習データの法的クリーンさ

二つ目は、コストよりも本質的かもしれない。フルスクラッチであることは、学習データの権利処理と法令遵守を、最初から最後まで自社で統制できることを意味する。

派生型——たとえば海外製の基盤モデルを土台に日本語を足したモデル——は、土台部分の学習データが他社（多くは海外企業）のものだ。何で学習されたか、権利関係はどうか、を自社で完全には説明できない。フルスクラッチは、その土台ごと自前で作る。

この差が効くのは、金融・医療・行政・防衛のように、データの行き先と来歴を説明する責任が重い領域だ。「このモデルは何で学習され、データは国外に出ないか」を自社の言葉で答えられること。それは性能の話ではなく、統制の話だ。性能で追いつかれても、統制の所在は動かない——第1回で「縦軸は消えない」と書いたのは、この意味だった。

この「来歴を説明できること」は、すでに調達の入口で問われ始めている。デジタル庁は源内の選定で「学習用データに関する法令遵守の状況」を具体的に説明できることを条件に挙げ、2027年度向けの公募でも応募書類に学習データの法令遵守状況の説明を求めている（行政実務を測る評価テストも50問から300問へ拡充された）。学習データの法的クリーンさは、作り手の自己申告ではなく、政府調達の審査項目になりつつある。

三者の個性

同じフルスクラッチでも、三者の狙いは少しずつ違う。

tsuzumi 2（NTT）。 NTTが長年の自然言語処理研究を結集した完全国産モデル。30Bという軽さでGPU1基動作・低い推論コストを武器に、金融・医療・公共の知識をあらかじめ強化している。オンプレ運用と機密性の高さを求める企業・官公庁に向く設計で、引き合いも旺盛だと報じられている。2026年5月には画像も扱えるVisionモデルが加わった（NTTグループ各社を通じて順次提供）。

PLaMo（Preferred Networks）。 純国産フルスクラッチで、料金を公開し一般APIを提供している点が特徴的だ。OpenAI互換APIで導入しやすく、中小企業でも今すぐ試せる。2026年6月22日には最新版のPLaMo 3.0 Primeを正式リリースし、推論／非推論の2系統と256Kコンテキストを備えた。提供形態もクラウドAPI・オンプレミスに加えAmazon Bedrock MarketplaceとSnowflakeへ広がり、既存のクラウド基盤からそのまま試せる。NICTとの共同開発やGENIAC（GENerative AI Accelerator Challenge。経産省・NEDOのプログラム）採択など、国の育成策とも噛み合っている。源内に選定されたのは前世代の「2.0 Prime」だが、モデルは速い周期で進化している。

Sarashina（SB Intuitions）。 ソフトバンク傘下が開発する純国産モデル。軽量な「Sarashina3 mini」から数千億規模の大型版まで幅を持つ。注目点は、Oracle Alloyを採用した国内クラウド「Cloud PF Type A」上での提供によってデータ主権を確保していることだ。2026年6月から順次提供が始まった。データを国外に出せない要件を持つ顧客にとって、これは性能以前の前提条件になる。

まだ言えないこと

フルスクラッチ勢は、汎用ベンチマークの総合点では依然として海外3強に及ばない。横軸（汎用性能）で選ぶ理由はまだ弱い。オンプレのコスト逆転は高頻度利用が前提で、GPUを調達し運用する体力も要る。価格を公開していないモデルは、導入前の比較がしづらい。そして源内に採用された版（PLaMo 2.0 Prime、Sarashina3 mini）と各社の最新版にはズレがあり、モデルは絶えず動いている。

それでも、「総合では負けるが、特定の業務では伍する」「主権とコストの軸では強い」という第1回の結論は、フルスクラッチ勢において最も純度高く成り立つ。汎用代替ではなく、主権の保険・オンプレの経済として読むなら、これらはすでに実用段階にある。

まとめ

フルスクラッチ主権型（tsuzumi 2 / PLaMo / Sarashina）の共通点は、基盤モデルそのものを自社で握ること
自前が効く理由その1はコスト。高頻度利用なら、累積コストはどこかでオンプレがAPIを下回る（逆転点は条件次第）
理由その2は法的クリーンさ。学習データの権利・来歴・行き先を自社で統制できる。これは性能ではなく統制の価値で、金融・医療・行政で重い
三者三様：tsuzumiは軽量・低推論コスト、PLaMoは料金公開と速い進化、SarashinaはOracle Alloyでのデータ主権
ただし汎用性能では海外3強に及ばず、オンプレ逆転は利用量と運用体力が前提。汎用代替ではなく「主権の保険・オンプレの経済」として読むのが正しい

次回は、もう一つの戦略——汎用基盤の開発を捨て、ベースモデルに日本語と特化を重ねる「派生・特化型」を扱う。ELYZA / cotomi v3 / Takane。垂直特化の経済学と、エージェント適性（MCP準拠など）が論点になる。

参考情報

この記事をシェアする

X (Twitter) LinkedIn Facebook Bluesky Threads

国産LLMの現在地　第3回：フルスクラッチ主権型 — tsuzumi 2 / PLaMo / Sarashina。「自前」が効く二つの理由

三者三様、しかし思想は同じ

理由その1：オンプレ運用のコスト逆転

理由その2：学習データの法的クリーンさ

三者の個性

まだ言えないこと

まとめ

参考情報

山下太郎

Categories

あわせて読みたい

国産LLMの現在地　第2回：国家戦略編 — 「源内」7モデル選定と2027年調達が、民需に効く理由

国産LLMの現在地　第1回：二層構造の地図 — 「海外3強の代替」という問いが、答えを取り違えさせる

国産LLMの現在地 第3回：フルスクラッチ主権型 — tsuzumi 2 / PLaMo / Sarashina。「自前」が効く二つの理由

三者三様、しかし思想は同じ

理由その1：オンプレ運用のコスト逆転

理由その2：学習データの法的クリーンさ

三者の個性

まだ言えないこと

まとめ

参考情報

山下 太郎

Categories

あわせて読みたい

国産LLMの現在地 第2回：国家戦略編 — 「源内」7モデル選定と2027年調達が、民需に効く理由

国産LLMの現在地 第1回：二層構造の地図 — 「海外3強の代替」という問いが、答えを取り違えさせる

国産LLMの現在地　第3回：フルスクラッチ主権型 — tsuzumi 2 / PLaMo / Sarashina。「自前」が効く二つの理由

山下太郎

国産LLMの現在地　第2回：国家戦略編 — 「源内」7モデル選定と2027年調達が、民需に効く理由

国産LLMの現在地　第1回：二層構造の地図 — 「海外3強の代替」という問いが、答えを取り違えさせる