Works
Blog Recruit Contact AI互換性診断
国産LLM
calendar_today
[国産LLMの現在地 Vol.3] 山下 太郎 山下 太郎

国産LLMの現在地 第3回:フルスクラッチ主権型 — tsuzumi 2 / PLaMo / Sarashina。「自前」が効く二つの理由

tsuzumi 2/PLaMo/Sarashina。基盤モデルを自前で一から作る「フルスクラッチ主権型」は、なぜ性能で海外勢に及ばずとも選ばれるのか。オンプレのコスト逆転と学習データの法的クリーンさ、二つの実利を解説する連載第3回。

国産LLMの現在地 第3回:フルスクラッチ主権型 — tsuzumi 2 / PLaMo / Sarashina。「自前」が効く二つの理由

第1回で、国産LLMの地図には「高性能×高主権」という空白地帯があり、国産勢は3つの戦略でそこを攻めている、と書いた。第2回では、政府がその足元に「安定需要」という荷重をかけ、縦軸(主権)の床を踏み固めにきた、という話をした。

今回からは各論に降りる。最初に扱うのは、その床を最も深く掘っている一群——汎用基盤を他社モデルに頼らず、一から自前で作る「フルスクラッチ主権型」だ。代表はNTTのtsuzumi 2、Preferred NetworksのPLaMo、SB Intuitions(ソフトバンク)のSarashina。

汎用ベンチマークの総合点で見れば、これらは海外3強に及ばない。それでも一から作ることに賭けるのは、性能とは別の物差しで効く実利があるからだ。理由は二つある。オンプレ運用のコスト逆転と、学習データの法的クリーンさ。順に見ていく。

三者三様、しかし思想は同じ

まず全体像を押さえておく。

tsuzumi 2PLaMoSarashina
開発元NTT(提供:NTTデータ等)Preferred NetworksSB Intuitions(ソフトバンク)
規模約30B・GPU1基で動作31B(2.0 Prime)。3.0 Primeのパラメータ数は非公開mini〜大型(数千億規模)
価格法人問い合わせ公開(Standardプラン:入力60円/出力250円・100万トークンあたり)法人向け
主権の作り方フルスクラッチ純国産フルスクラッチ純国産・NICT共同フルスクラッチ純国産・国内クラウド
源内の契約版tsuzumi 2PLaMo 2.0 PrimeSarashina3 mini
最新版・特徴Vision対応・金融/医療/公共に強い3.0 Prime(256Kコンテキスト・推論/非推論の2系統)Oracle Alloyでデータ主権を担保

規模は数十billion〜数千billionまで幅があるが、共通しているのは「基盤モデルそのものを自社で握る」という一点だ。海外製のモデルを土台にせず、トークナイザから学習データまで自前で組む。この共通点が、これから話す二つの実利の源になる。

理由その1:オンプレ運用のコスト逆転

エージェントが普及すると、AIのコストは「呼び出し回数」で膨らむ。1回の処理で何度もモデルを叩くため、従量課金のAPIは利用量に比例して青天井に伸びていく(この力学は別連載『AIエージェント構築、その前に』第1回で詳述した)。

一方、自前のGPUでモデルを動かすオンプレ運用は、初期投資こそ重いが、その後の増え方はゆるやかだ。だから利用量がある水準を超えると、累積コストはどこかでオンプレ側が安くなる。これが「逆転」だ。

オンプレTCOの逆転 API従量課金は利用量に比例して直線的に累積コストが増えるのに対し、オンプレ運用は初期投資が重いが増え方がゆるやか。高頻度利用ではおよそ3年前後で累積コストが逆転し、オンプレが安くなる、という概念図。 オンプレTCOの逆転——いつ自前運用が安くなるか API従量課金とオンプレ運用の累積コスト(概念図。逆転点は利用量・モデルで変動) 逆転点 ≈ 3年前後 API(従量課金) オンプレ運用 この差がオンプレの節約分 0 1 2 3 4 5 運用期間(年) 累積コスト ※ 概念図。逆転点は利用量・モデルサイズ・GPU調達/運用費で変わる。 高頻度・大量利用ほど早く訪れ、低頻度ならAPIが有利なまま。

この逆転点を企業の手元に引き寄せようとしているのが、フルスクラッチ勢だ。tsuzumi 2が「30Bという規模でGPU1基で動くこと」に執着するのは、まさにそのためで、NTTは大規模モデル(400B〜700B級)と比べて推論コストを約10〜20分の1に抑えられるとしている。PLaMoも1GPUで動かせる設計で、しかも料金を公開している(Standardプラン:入力60円/出力250円・100万トークンあたり)。価格が見えるので、中小企業でも試算しやすい。

ただし、逆転は「必ず起きる」ものではない。逆転点は利用量・モデルサイズ・GPUの調達と運用の費用で大きく動く。高頻度・大量利用の企業ほど早く訪れるが、利用が散発的ならAPIが有利なままだ。自社の利用量と運用体力で試算すべき問題であって、一般論で「オンプレが得」とは言えない。

理由その2:学習データの法的クリーンさ

二つ目は、コストよりも本質的かもしれない。フルスクラッチであることは、学習データの権利処理と法令遵守を、最初から最後まで自社で統制できることを意味する。

派生型——たとえば海外製の基盤モデルを土台に日本語を足したモデル——は、土台部分の学習データが他社(多くは海外企業)のものだ。何で学習されたか、権利関係はどうか、を自社で完全には説明できない。フルスクラッチは、その土台ごと自前で作る。

フルスクラッチが握る3つの層 学習データ・基盤モデル・追加学習/デプロイの3層について、フルスクラッチ主権型は全層を自社・国内で統制できるのに対し、派生型は基盤モデルとその学習データが海外提供元に依存する、という対比図。 フルスクラッチが握る「3つの層」 学習データ・基盤モデル・デプロイを、どこまで自前・国内に閉じられるか フルスクラッチ主権型 tsuzumi 2 / PLaMo / Sarashina 派生・特化型(比較) 例:ELYZA=MetaのLlamaベース 学習データ 権利・法令を自社で統制 基盤モデル 自社で一から開発 追加学習・デプロイ オンプレ運用も可能 学習データ 基盤分は海外提供元に依存 基盤モデル 海外製の重みを継承 日本語追加学習・デプロイ 自社で実施 自社・国内で統制 海外に依存 ※ フルスクラッチ型は、学習データの権利処理から重みの開発、デプロイ先まで自社・国内に閉じられる。 これが「法的クリーンさ」と主権の源泉になる。派生型は土台が海外製のため、この点で一歩譲る。

この差が効くのは、金融・医療・行政・防衛のように、データの行き先と来歴を説明する責任が重い領域だ。「このモデルは何で学習され、データは国外に出ないか」を自社の言葉で答えられること。それは性能の話ではなく、統制の話だ。性能で追いつかれても、統制の所在は動かない——第1回で「縦軸は消えない」と書いたのは、この意味だった。

この「来歴を説明できること」は、すでに調達の入口で問われ始めている。デジタル庁は源内の選定で「学習用データに関する法令遵守の状況」を具体的に説明できることを条件に挙げ、2027年度向けの公募でも応募書類に学習データの法令遵守状況の説明を求めている(行政実務を測る評価テストも50問から300問へ拡充された)。学習データの法的クリーンさは、作り手の自己申告ではなく、政府調達の審査項目になりつつある。

三者の個性

同じフルスクラッチでも、三者の狙いは少しずつ違う。

tsuzumi 2(NTT)。 NTTが長年の自然言語処理研究を結集した完全国産モデル。30Bという軽さでGPU1基動作・低い推論コストを武器に、金融・医療・公共の知識をあらかじめ強化している。オンプレ運用と機密性の高さを求める企業・官公庁に向く設計で、引き合いも旺盛だと報じられている。2026年5月には画像も扱えるVisionモデルが加わった(NTTグループ各社を通じて順次提供)。

PLaMo(Preferred Networks)。 純国産フルスクラッチで、料金を公開し一般APIを提供している点が特徴的だ。OpenAI互換APIで導入しやすく、中小企業でも今すぐ試せる。2026年6月22日には最新版のPLaMo 3.0 Primeを正式リリースし、推論/非推論の2系統と256Kコンテキストを備えた。提供形態もクラウドAPI・オンプレミスに加えAmazon Bedrock MarketplaceとSnowflakeへ広がり、既存のクラウド基盤からそのまま試せる。NICTとの共同開発やGENIAC(GENerative AI Accelerator Challenge。経産省・NEDOのプログラム)採択など、国の育成策とも噛み合っている。源内に選定されたのは前世代の「2.0 Prime」だが、モデルは速い周期で進化している。

Sarashina(SB Intuitions)。 ソフトバンク傘下が開発する純国産モデル。軽量な「Sarashina3 mini」から数千億規模の大型版まで幅を持つ。注目点は、Oracle Alloyを採用した国内クラウド「Cloud PF Type A」上での提供によってデータ主権を確保していることだ。2026年6月から順次提供が始まった。データを国外に出せない要件を持つ顧客にとって、これは性能以前の前提条件になる。

まだ言えないこと

フルスクラッチ勢は、汎用ベンチマークの総合点では依然として海外3強に及ばない。横軸(汎用性能)で選ぶ理由はまだ弱い。オンプレのコスト逆転は高頻度利用が前提で、GPUを調達し運用する体力も要る。価格を公開していないモデルは、導入前の比較がしづらい。そして源内に採用された版(PLaMo 2.0 Prime、Sarashina3 mini)と各社の最新版にはズレがあり、モデルは絶えず動いている。

それでも、「総合では負けるが、特定の業務では伍する」「主権とコストの軸では強い」という第1回の結論は、フルスクラッチ勢において最も純度高く成り立つ。汎用代替ではなく、主権の保険・オンプレの経済として読むなら、これらはすでに実用段階にある。

まとめ

  • フルスクラッチ主権型(tsuzumi 2 / PLaMo / Sarashina)の共通点は、基盤モデルそのものを自社で握ること
  • 自前が効く理由その1はコスト。高頻度利用なら、累積コストはどこかでオンプレがAPIを下回る(逆転点は条件次第)
  • 理由その2は法的クリーンさ。学習データの権利・来歴・行き先を自社で統制できる。これは性能ではなく統制の価値で、金融・医療・行政で重い
  • 三者三様:tsuzumiは軽量・低推論コスト、PLaMoは料金公開と速い進化、SarashinaはOracle Alloyでのデータ主権
  • ただし汎用性能では海外3強に及ばず、オンプレ逆転は利用量と運用体力が前提。汎用代替ではなく「主権の保険・オンプレの経済」として読むのが正しい

次回は、もう一つの戦略——汎用基盤の開発を捨て、ベースモデルに日本語と特化を重ねる「派生・特化型」を扱う。ELYZA / cotomi v3 / Takane。垂直特化の経済学と、エージェント適性(MCP準拠など)が論点になる。

参考情報
山下 太郎

山下 太郎

代表取締役 / CEO

2000年、Webデザイナーとしてこの世界に飛び込み、フリーランスを経て2007年に株式会社アンタイプを創業。AI時代の到来とともに、効率だけを追うAI活用に違和感を覚えながら、それでも最前線でツールを使い続ける。企業のWebとコミュニケーションを設計する仕事を通じて、「人間らしさとは何か」を問い直す視点を発信し続けている。

View Profile arrow_outward

Related

あわせて読みたい