イグナイトbiz|ビジネス&テクノロジーサイト
  • AI・人工知能
  • テクノロジー・宇宙
  • 新製品・ガジェット
  • プレスリリース
メニュー
  • AI・人工知能
  • テクノロジー・宇宙
  • 新製品・ガジェット
  • プレスリリース
カテゴリ
  • ビジネス 35
  • AI・人工知能 30
  • テクノロジー・宇宙 22
  • 社会・経済・政治 19
  • 新製品・ガジェット 7
  • プレスリリース 3
  1. ホーム
  2. AI・人工知能
  3. 国産LLM「LLM-jp-4」が公開、一部ベンチマークでGPT-4oを超える 
AI・人工知能

国産LLM「LLM-jp-4」が公開、一部ベンチマークでGPT-4oを超える 

AI・人工知能 2026年4月3日 Seita Namba 3分で読める

国立情報学研究所(NII)の大規模言語モデル研究開発センター(LLMC)が、新たな国産LLM「LLM-jp-4 8Bモデル」と「LLM-jp-4 32B-A3Bモデル」をオープンソースライセンスで公開した。

約12兆トークンのコーパスでフルスクラッチ学習したこのモデル、日本語ベンチマークではGPT-4oを上回るスコアを出している。

「フルスクラッチ」という点は、このプロジェクトの性格を考えると重要だ。

既存モデルのファインチューニングではなく、ゼロから学習を行っており、学習データも第三者が入手可能なソースに限定している。オープンソースAIの定義(OSAID)に沿って、データの透明性を担保した形で構築されている。「誰でも再現できる」ことを意識した設計で、国産LLMの研究基盤として使えるモデルを目指している。

モデルの詳細

モデルの詳細を見ると、8BモデルはLlama 2ベースで約86億パラメータ。32B-A3BモデルはQwen3 MoE(Mixture of Experts)ベースで総パラメータ数は約320億だが、推論時にアクティブになるのは約38億パラメータ分(8エキスパート)というアーキテクチャ構成だ。最大約6万5千トークンまで処理できる。

学習データの規模は前世代「LLM-jp-3.1」シリーズの約6倍。事前学習コーパスは総計約19.5兆トークンで、日本語約7,000億、英語約17.8兆、中国語・韓国語約8,500億、プログラムコード約2,000億トークンで構成されている。このうち実際に事前学習に使ったのは約10.5兆トークン。その後、合成データを加えた1.2兆トークンで中間学習も実施している。

気になる性能

ベンチマーク結果が興味深い。日本語理解を測る「日本語MT-Bench」では、8Bモデルが7.54、32B-A3Bモデルが7.82を記録。GPT-4oの7.29、Qwen3-8Bの7.14をいずれも上回っている。英語のMT-Benchでも8Bモデルが7.79、32B-A3Bモデルが7.86で、GPT-4oの7.69と同等以上だ。パラメータ規模を考えると、なかなか効率のいい結果といえる。

※国立情報学研究所(NII)のニュースリリースより引用

ただし、評価にGPT-5.4をジャッジとして使っているなど、LLM-as-a-Judge手法(モデルの出力品質を人間ではなく別のLLMに採点させる評価手法)特有の留意点はある。42種類の評価データを使う「llm-jp-eval v2.1.3」でも検証しており、日本語性能でQwen3-8Bと同等と確認されている。

LLM-jpは、NIIが主宰するLLM研究開発コミュニティで、大学・企業などから2,600名以上が参加している。早稲田大学、東北大学、東京大学、東京科学大学、名古屋大学など複数の大学の教授陣が各ワーキンググループを率いる、わりと大規模な産学連携の取り組みだ。学習にはAIST(産業技術総合研究所)のABCI 3.0を使用。コーパス面では国立国語研究所や国立国会図書館からも協力を得ている。

今後はより大規模な「LLM-jp-4 32Bモデル」と「LLM-jp-4 332B-A31Bモデル」を2026年度中に公開予定。軽量モデルの開発も並行して進めるとしている。

モデルやツール、コーパスの詳細は https://llm-jp.nii.ac.jp/release で公開されている。

https://llm-jp.nii.ac.jp/release/

https://huggingface.co/llm-jp

引用:国立情報学研究所(NII)のニュースリリース

https://www.nii.ac.jp/news/release/2026/0403.html

シェア シェア シェア ブックマーク
カテゴリ: AI・人工知能
タグ: #AI #GPT #LLM-jp #LLMC #NII #フルスクラッチ #日本 #生成AI
この記事を書いた人
Seita Namba
イグナイトbiz 編集長

X (Twitter)

目次

モデルの詳細気になる性能引用:国立情報学研究所(NII)のニュースリリース

人気記事

1

【噂】Taalas社、Qwen 3.5-27Bを搭載したPCIe ASICボードを2026年春にも一部提供か

2

生成AI、うちも入れたけど微妙…の正体。9割が感じた”期待外れ”の理由と、22%の勝ち組が違うこと

3

いま、”二重の嵐”が日本製造業を直撃している「米10%関税×中国禁輸」見直しが迫られるサプライチェーン戦略

4

ミームコインの法的危うさと悪質な信用創造の実態『掴めそうな夢は誰かの作った罠』

5

スペースXが月面マスドライバーをガチでやる計画らしい コンセプト動画を公開

1

GoogleがGemma 4を公開、Apache 2.0に移行 30B台が400B超と並ぶ性能

2

AIで日本は本当に儲かるのか? インフラ特需の中、本質を探してみる

3

Anthropicの「Claude Code」ソースコードが流出 どれくらい深刻なのか?

4

金ピカ「米国製」スマホがついに出荷! いろんな意味で最高にイカれた愛国スマホ

5

AIエージェントが自己アップデート?【OpenClaw】

1

楽天、国内最大規模のAIモデル「Rakuten AI 3.0」を公開——GPT-4oを超える日本語性能、ベースモデルはDeepSeek-V3かも

2

【月報】2026年4月1日現在の住宅ローン金利動向と市場調査

3

アメリカではデータセンターのために航空転用ガスタービンを使っている【米中AI競争の最前線】

4

iPhone 17e ついに発表!A19チップとMagSafeでそこそこコスパの新モデル - ほぼ16eとは言わせない

5

「欧州産」に日本と英国?EUが仕掛ける異例の”身内”拡大戦略

カテゴリ

  • ビジネス 35
  • AI・人工知能 30
  • テクノロジー・宇宙 22
  • 社会・経済・政治 19
  • 新製品・ガジェット 7
  • プレスリリース 3

最近の投稿

  • 次世代Grokは Chat-GPTを超えるか?
  • スペースXとANTHROPIC 犬猿の彼らが組めるのか?
  • 金ピカ「米国製」スマホがついに出荷! いろんな意味で最高にイカれた愛国スマホ
  • 脳なき生命の記憶 単細胞生物にも「知性」はあるか?
  • 需要高まるパワー半導体 GaNは日本の生命線になるか

アーカイブ

  • 2026年5月
  • 2026年4月
  • 2026年3月
  • 2026年2月

関連記事

次世代Grokは Chat-GPTを超えるか?

AI・人工知能
#AI #AIエージェント #Claude
2026.05.27

スペースXとANTHROPIC 犬猿の彼らが組めるのか?

ビジネス
#AI #AIエージェント #Anthropic
2026.05.20

需要高まるパワー半導体 GaNは日本の生命線になるか

ビジネス
#AI #EV #GaN
2026.04.29

マルチエージェントLLM推論の効率化技術特集 同一パラメーターで複数エージェントを動かす

AI・人工知能
#AI #GPU #LLM
2026.04.19

Claude Opus 4.7 レビュー:「軽くなった推論」で何が変わった?

AI・人工知能
#AI #AIエージェント #Claude
2026.04.17

Alibaba、Qwen3.6-35B-A3Bが登場 Qwen3.5-27Bを超えるMoEモデル

AI・人工知能
#AI #LLM #Qwen
2026.04.17

Claude Mythos は、なろう系主人公かもしれない

AI・人工知能
#AI #AIエージェント #Anthropic
2026.04.11

トヨタEVが米国市場で急伸中 EV市場の現状と日本企業の立ち位置を分析する

ビジネス
#EV #アメリカ #テスラ
2026.04.06

AIで日本は本当に儲かるのか? インフラ特需の中、本質を探してみる

AI・人工知能
#AI #アメリカ #フランス
2026.04.05
イグナイトbiz|ビジネス&テクノロジーサイト

カテゴリ

  • ビジネス
  • AI・人工知能
  • テクノロジー・宇宙
  • 社会・経済・政治
  • 新製品・ガジェット

リンク

  • ShelfHub|プレプリントサーバー
  • Zborra 経理&経営支援ソフト
  • ネタ提供 / 誤字脱字報告
  • プレスリリース掲載依頼

運営者について

  • 運営者情報
  • 編集方針
  • お問い合わせ
  • 運営会社サイト

© 2026 イグナイトbiz|ビジネス&テクノロジーサイト. All rights reserved.

プライバシーポリシー 利用規約