08 | 6月 | 2025 | 神代のかなたブログ

バージョンがちょっとわかりにくいのでまとめてみました。

Geminiシリーズ

Google DeepMindが開発する最先端の大規模AIモデル群です。

多モーダルな大規模言語モデル（LLM）であり、自然言語処理はもちろん、画像や音声など複数モーダルの入力・出力を扱えるのが特徴です。

バージョン	リリース日	主な特徴
Gemini 1.0	2023年12月	・Ultra/Pro/Nanoの3構成・多モーダル対応（テキスト・画像・音声・動画）・32Kトークンの長文コンテキスト
Gemini 1.5	2024年2月（限定公開）	・Mixture-of-Experts（MoE）導入・最大100万トークンの超長コンテキスト・Pro（大規模版）とFlash（蒸留軽量版）の2構成
Gemini 2.0 Flash	2025年1月	・マルチモーダルLive API導入・ネイティブ画像生成・音声出力・外部ツール連携（検索・計算機能）
Gemini 2.0 Pro	2025年2月	・高性能モデル・リアルタイム音声・映像対応継続・エージェンティック機能強化
Gemini 2.0 Flash-Lite	2025年2月	・低コスト版
Gemini 2.5 Pro	2025年6月	・Deep Thinkモード導入・ネイティブ音声応答・安全性強化
Gemini 2.5 Flash	2025年6月	・軽量高速版・Deep Think一部対応・応答速度最適化
Gemini 2.5 Flash-Lite	2025年7月	・低コスト版
Gemini 2.5 Deep Think	2025年7月	・並列思考技術・国際数学オリンピック金メダル相当

Geminiと同じ技術を基に作られた軽量でオープンソースの生成AIモデル群です。

Geminiがクラウド上の強力なLLM群であるのに対し、Gemmaはパラメータ数を抑えてPCやモバイル端末上でも動作可能なよう最適化されており、モデルの重み（学習済みパラメータ）は無償・オープンライセンスで公開されています

バージョン	リリース日	主な特徴
Gemma 1	2024年2月	・オープンソース (2B/7B) ・テキスト専用・商用利用可
Gemma 2	2024年6月	・大規模化 (9B/27B) ・高速推論対応・オープンライセンス
Gemma 3	2025年3月	・マルチモーダル・マルチリンガル対応・1B/4B/12B/27Bサイズ・128Kトークン長
Gemma 3n	2025年6月	・モバイル最適化・PLE技術で低メモリ・5B/8B相当