第1回では、国産LLMの現在地を二本の軸で描いた。横軸が汎用フロンティア性能、縦軸が主権・特化。そして右上——高性能かつ高主権——の象限が世界中でほぼ空白で、国産勢はそこを3つの戦略で攻めている、と書いた。
だが、その地図の上でこの半年に最も大きく動いた一手は、企業のものではない。国のものだ。
2026年3月、デジタル庁が政府の生成AI基盤「源内(げんない)」で使う国産LLMとして7モデルを選定した。見出しだけ追えば「政府が国産AIを採用」という行政ニュースにすぎない。だが、この一手は民間——とりわけ中小企業——のモデル選定にまで効いてくる構造を持っている。今日は、その「効き方」を分解する。
「源内」とは何か
源内は、デジタル庁が開発・運用する政府職員向けの生成AI利用環境だ。名前は「Generative AI(Gen AI)」の読みと、江戸時代の発明家・平賀源内の精神を掛け合わせたものとされる。2025年5月にデジタル庁内で運用が始まり、各府省庁へ展開されてきた。
背景には制度がある。2025年5月に成立したAI法(人工知能関連技術の研究開発及び活用の推進に関する法律)と、同年12月23日に閣議決定されたAI基本計画(正式名称「人工知能基本計画」)だ。基本計画は「隗(かい)より始めよ」——政府自らが先導してAIを使う——という方針を掲げた。源内はその第一歩にあたる。
技術的には、源内は単一のLLMではない。チャット・要約・翻訳に加え、国会答弁の作成支援や法令検索といった行政実務向けアプリを載せた基盤であり、内部ではAmazon NovaやClaude、OpenAIなど複数のモデルを束ねるマルチモデル構成になっている。そして2026年5月28日、デジタル庁は全府省庁39機関・約18万人の政府職員を対象とする大規模実証を開始した。開始時点で利用可能なのは約10万人で、防衛省・文科省・経産省などを順次追加し、2026年度中に約18万人へ拡大する段階展開だ。
ここに「国産LLM」を本格的に組み込むのが、今回の段である。
選ばれた7モデル
公募は2025年12月2日から2026年1月末まで行われ、15件の応募があった。書類審査と評価テストを経て、3月6日に7件が選定された。報道では「7人の侍」とも呼ばれた。
選ばれた7モデルを、第1回の3分類に当てはめると次のようになる。
| 提供者 | モデル | 第1回の分類 | ひとこと | |
|---|---|---|---|---|
| NTTデータ | tsuzumi 2 | フルスクラッチ主権型 | 30B・GPU1基で動作・金融/医療/公共に強い | |
| Preferred Networks | PLaMo 2.0 Prime | フルスクラッチ主権型 | 純国産31B・料金公開・PLaMo翻訳は源内で先行利用中 | |
| ソフトバンク(SB Intuitions) | Sarashina3 mini | フルスクラッチ主権型 | 軽量・日本語の語彙と文化への適応 | |
| KDDI/ELYZA(辞退) | Llama-3.1-ELYZA-JP-70B | 派生・特化型 | MetaのLlamaベース・70B・長文に強い | |
| NEC | cotomi v3 | 派生・特化型 | MCP対応・エージェント適性 | |
| 富士通 | Takane 32B | 派生・特化型 | 量子化・蒸留・行政実務での実証実績 | |
| カスタマークラウド(辞退) | CC Gov-LLM | 特化型(セキュリティ/ローカル) | 外部クラウドに依存しない構成 |
その後KDDI/ELYZAとカスタマークラウドの2社が辞退し、源内で試用評価を行う契約を締結したのは5社——NTTデータ(tsuzumi 2)、ソフトバンク(Sarashina3 mini)、NEC(cotomi v3)、富士通(Takane 32B)、Preferred Networks(PLaMo 2.0 Prime)——だ(公募予告の別紙に明記)。これは2026年度に試用評価を行う契約であって、2027年度の有償調達(後述)とは別だ。契約段階でソフトバンクのモデル名は「Sarashina2 mini」から「Sarashina3 mini」に更新された。
ここで気づくことが2つある。
ひとつは、政府が第1回の分類のほぼ全レンジを一度に拾っていることだ。フルスクラッチ主権型も派生・特化型も、規模も30Bから70Bまで、横並びで選ばれている。1社に絞らず7モデルを並行で採ったこの設計は、あとで触れる「比較可能性」と「ベンダーロックイン回避」の意図と繋がっている。
もうひとつは、第1回の3つ目の戦略——Sakana AIのような「束ねる型」が、この7件に入っていないことだ。理由は単純で、束ねる役は源内そのものが担っているからだ。複数モデルを抱えて束ねるオーケストレーション層を政府が自前で持ち、その下で動かす単体モデルを選んでいる。源内は、行政が自ら運用する「束ねる型」のプラットフォームなのだ。
いつ、何が起きるのか
選定はゴールではなく、長い手続きの一里塚にすぎない。デジタル庁が公表したスケジュールを時間軸に並べると、現在地がはっきりする。
いま私たちがいるのは、大規模実証が始まったばかりの地点だ。現行5モデルの試用そのものは2026年8月頃から、行政実務での評価・検証結果の一部が公表されるのが2027年1月頃——ここまでが「試用評価」のトラックだ。
そして有償の本格調達は、この5社をそのまま採用するのではなく、別個の再公募を通る。デジタル庁は2026年5月、令和9年度(2027年度)向けの国産基盤モデル公募を予告した。スケジュールは2026年11月公募開始→12月締切・一次審査→2027年1〜2月に評価テストと入札→3月落札者決定→4月から有償で使用開始、という段取りだ。今度の評価テストは初回の50問から300問(8領域・35観点)に拡充され、1社1モデルに絞って競わせる。
現時点はまだ試用評価の段階であり、有償調達は確定していない。政府が国産モデルにお金を払って本格採用するかどうかは、これからの実務評価と再公募の結果にかかっている。
なぜ国産なのか——「愛国」でも「性能」でもない
選定基準を並べると、政府が何を見ていたかがわかる。国内で開発されたLLMであること。デジタル庁が作成し、試験当日に初めて開示した50問の評価テストで優秀な結果を出すこと。海外主要LLMとの比較ベンチマーク結果を提出すること。ハルシネーション・バイアス・差別的表現・有害コンテンツ生成への対策を説明できること。政府職員が機密性2情報を扱えるよう、ガバメントクラウド上の推論環境で動くこと。2026年度中に無償提供が可能なこと。そして、評価結果の一部公表に同意すること。
試験当日に初めて配る50問、という設計が象徴的だ。事前にテスト対策を仕込めないようにして、素の実力を測ろうとしている。
ここで効いてくるのが、第1回の縦軸だ。これらの基準は、汎用性能(横軸)だけを測っていない。言語への適合、監査のしやすさ、契約と統制、供給の安定、主権、そして行政業務への載せやすさ——第1回で「主権・特化」と呼んだ軸を、政府が運用要件の言葉に翻訳したものになっている。国産にこだわる理由は愛国でも性能でもなく、LLMを「チャットツール」ではなく「国家業務に組み込むソフトウェア」として扱い始めたからだ。
言い換えれば、政府は縦軸の評価ルーブリックを実質的に公開した。これが次の話に繋がる。
「政府のお墨付き」が民需に効く、3つの経路
デジタル庁は、この取り組みの狙いを公式に3点挙げている。(1)政府における安全・安心な国産AIの利用推進、(2)行政現場からのフィードバックによる国産AIの性能向上、(3)政府調達を通じた国産AIに対する安定的な需要創出。これにより国産AIの育成・強化を進め、民間投資を喚起し、日本の自律性を確保する、という。
この狙いは、ひとつの好循環(フライホイール)として描ける。
公式の言葉は政府目線だが、これを民間——特に自前で大規模なAI評価を回せない中小企業——の目線に翻訳すると、3つの経路で効いてくる。
ひとつ、供給の安定(=保険になる)。 第1回で、可用性リスクの事例としてClaude Fable 5・Mythos 5の突然の停止を挙げた。重要業務を単一の海外ベンダーに預ける怖さだ。国産を「保険」として置けるかどうかは、その国産ベンダーが事業として生き残るかにかかっている。政府が2027年から安定的に有償調達する見込みは、ベンダーの事業継続性を底上げする。第1回で言った「降りる先の床」が、政府需要という荷重で補強されるということだ。
ふたつ、評価の物差しを借りられる。 2027年1月に、行政実務での評価・検証結果の一部が公表される。中小企業が自社で大規模な比較評価を組むのは現実的でないが、政府の実務評価は参照できる。さらに、試験当日に配る50問・安全性の説明責任・機密性2対応という審査の枠組みそのものが、自社のモデル選定チェックリストの叩き台になる。政府は、民間が持ちにくい「評価インフラ」を肩代わりしている。
みっつ、ロックイン回避の前例。 デジタル庁は7モデルを並行で選び、有償調達でも単年で固定せず年度ごとに再公募で競わせる設計にした。さらに2026年4月24日、源内の一部を商用利用可能なライセンス(MITライセンス/ドキュメントはCC BY 4.0)でOSSとして公開している。重複開発の防止、特定ベンダーへの過度な依存の回避、調達仕様の共通化——この設計思想は、自治体や民間がそのまま自社のAI調達に転用できる。基盤は公開・その上のモデルは差し替え可能・調達は定期的に競争にさらす、というレイヤー設計は、第6回で扱う「ベンダーロックイン耐性」の実装見本でもある。
まだ確定していないこと
いまは試用評価の段階であり、有償調達は確定していない。スケジュールは行政の手続き次第で動きうる。公表されるのは評価結果の「一部」で、全項目が出るとは限らない。現行の7件は選定であって契約ではなく、その後2社が辞退して契約は5社になった。さらに有償調達は別個の再公募を経るため、この5社がそのまま2027年度に採用される保証もない。7モデルは行政の要件で選ばれたものであって、あなたの業務にとっての最適解とは限らない。選定された版も時点のものだ——たとえばPLaMoは「2.0 Prime」で選ばれているが、Preferred Networksはすでに3.0 Prime(2026年6月22日リリース)を出している。モデルは動く。
そして源内は国産専用ではない。NovaやClaudeやOpenAIを併存させたマルチモデル基盤であり、性能が要る業務には海外モデル、主権が要る業務には国産、という現実的な棲み分けで動いている。政府の選定が示したのは「国産という床が、行政の実務要件を満たす水準で存在し始めた」ことの公的な確認であって、汎用性能で海外3強を超えたという話ではない。第1回の地図でいえば、縦軸(主権)の床を政府が踏み固めた、ということだ。
まとめ
- 2026年3月、デジタル庁が源内で使う国産LLMを7モデル選定した(15件→7件)。その後2社が辞退し、契約は5社。有償の本格調達は2027年度向けの別個の再公募(評価テストは50問→300問に拡充)を経て2027年4月から
- 選定基準は性能だけでなく、言語適合・安全性・機密性2・供給の安定まで及ぶ。第1回の「主権の軸」を行政が運用要件に翻訳したものだ
- 政府の狙いは公式に「安定的な需要創出→民間投資の喚起→自律性の確保」。これが民需に効く3経路(供給の安定/評価の物差し/ロックイン回避の前例)を生む
- 源内基盤はOSSとして公開(商用利用可)。国産の「床」を政府が公的に底上げし始めた
- ただし現時点は試用段階で、政府の選定=最良ではない。海外モデルとの棲み分けは続く
政府は、空白地帯そのものを埋めたわけではない。だが、そこへ向かう国産勢の足元に「安定需要」という荷重をかけ、縦軸の床を踏み固めにきた。次回からは各論に降りる。第3回は、その床を最も深く掘っている一群——tsuzumi 2/PLaMo/Sarashinaの「フルスクラッチ主権型」を、オンプレTCOの逆転と学習データの法的クリーンさという観点から扱う。
参考情報
この記事をシェアする