日別アーカイブ: 2025年9月13日

GeminiとGemmaシリーズの特徴まとめてみた

バージョンがちょっとわかりにくいのでまとめてみました。

Geminiシリーズ

Google DeepMindが開発する最先端の大規模AIモデル群です。

多モーダルな大規模言語モデル(LLM)であり、自然言語処理はもちろん、画像や音声など複数モーダルの入力・出力を扱えるのが特徴です。

バージョンリリース日主な特徴
Gemini 1.02023年12月 ・Ultra/Pro/Nanoの3構成
・多モーダル対応(テキスト・画像・音声・動画)
・32Kトークンの長文コンテキスト
Gemini 1.52024年2月
(限定公開)
・Mixture-of-Experts(MoE)導入
・最大100万トークンの超長コンテキスト
・Pro(大規模版)とFlash(蒸留軽量版)の2構成
Gemini 2.0 Flash2025年1月 ・マルチモーダルLive API導入
・ネイティブ画像生成・音声出力
・外部ツール連携(検索・計算機能)
Gemini 2.0 Pro2025年2月 ・高性能モデル
・リアルタイム音声・映像対応継続
・エージェンティック機能強化
Gemini 2.0 Flash-Lite2025年2月 ・低コスト版
Gemini 2.5 Pro2025年6月 ・Deep Thinkモード導入
・ネイティブ音声応答
・安全性強化
Gemini 2.5 Flash2025年6月 ・軽量高速版
・Deep Think一部対応
・応答速度最適化
Gemini 2.5 Flash-Lite2025年7月 ・低コスト版
Gemini 2.5 Deep Think2025年7月 ・並列思考技術
・国際数学オリンピック金メダル相当
Gemini 2.5 Flash Image
(nano-banana)
2025年8月
(Preview)
・画像生成に特化
・キャラクターの一貫性を保てる
画像生成してみた。一貫性あって凄い

Gemmaシリーズ

Geminiと同じ技術を基に作られた軽量でオープンソースの生成AIモデル群です。

Geminiがクラウド上の強力なLLM群であるのに対し、Gemmaはパラメータ数を抑えてPCやモバイル端末上でも動作可能なよう最適化されており、モデルの重み(学習済みパラメータ)は無償・オープンライセンスで公開されています

バージョンリリース日主な特徴
Gemma 12024年2月 ・テキスト専用
・パラメータ数:2B, 7B
・商用利用可
Gemma 22024年6月 ・高速推論対応
・パラメータ数:9B, 27B
・オープンライセンス
Gemma 32025年3月 ・マルチモーダル・マルチリンガル対応
・パラメータ数:1B, 4B, 12B, 27B
・128Kトークン長
LM StudioでGemma3を動かしてみた
Gemma 3n2025年6月 ・モバイル最適化
・パラメータ数:5B, 8B相当
・PLE技術で低メモリ
Gemma 3 270M2025年8月 ・超小型AIモデル(300MB以下)
・パラメータ数:0.27B
・ファインチューニング用
VaultGemma2025年9月 ・差分プライバシーで完全にプライバシー保護
・パラメータ数:1B
・Gemma 2ベース

まとめ

GeminiはProが高性能版、Flashが通常版、Flash-Liteが軽量版。
そしてGemmaは3nがモバイル用ということでした。