Geminiシリーズ
Google DeepMindが開発する最先端の大規模AIモデル群です。
多モーダルな大規模言語モデル(LLM)であり、自然言語処理はもちろん、画像や音声など複数モーダルの入力・出力を扱えるのが特徴です。
バージョン | リリース日 | 主な特徴 |
---|---|---|
Gemini 1.0 | 2023年12月 | ・Ultra/Pro/Nanoの3構成 ・多モーダル対応(テキスト・画像・音声・動画) ・32Kトークンの長文コンテキスト |
Gemini 1.5 | 2024年2月 (限定公開) | ・Mixture-of-Experts(MoE)導入 ・最大100万トークンの超長コンテキスト ・Pro(大規模版)とFlash(蒸留軽量版)の2構成 |
Gemini 2.0 Flash | 2025年1月 | ・マルチモーダルLive API導入 ・ネイティブ画像生成・音声出力 ・外部ツール連携(検索・計算機能) |
Gemini 2.0 Pro | 2025年2月 | ・高性能モデル ・リアルタイム音声・映像対応継続 ・エージェンティック機能強化 |
Gemini 2.0 Flash-Lite | 2025年2月 | ・低コスト版 |
Gemini 2.5 Pro | 2025年6月 | ・Deep Thinkモード導入 ・ネイティブ音声応答 ・安全性強化 |
Gemini 2.5 Flash | 2025年6月 | ・軽量高速版 ・Deep Think一部対応 ・応答速度最適化 |
Gemini 2.5 Flash-Lite | 2025年7月 | ・低コスト版 |
Gemini 2.5 Deep Think | 2025年7月 | ・並列思考技術 ・国際数学オリンピック金メダル相当 |
Gemini 2.5 Flash Image (nano-banana) | 2025年8月 (Preview) | ・画像生成に特化 ・キャラクターの一貫性を保てる ・画像生成してみた。一貫性あって凄い |
Gemmaシリーズ
Geminiと同じ技術を基に作られた軽量でオープンソースの生成AIモデル群です。
Geminiがクラウド上の強力なLLM群であるのに対し、Gemmaはパラメータ数を抑えてPCやモバイル端末上でも動作可能なよう最適化されており、モデルの重み(学習済みパラメータ)は無償・オープンライセンスで公開されています
バージョン | リリース日 | 主な特徴 |
---|---|---|
Gemma 1 | 2024年2月 | ・テキスト専用 ・パラメータ数:2B, 7B ・商用利用可 |
Gemma 2 | 2024年6月 | ・高速推論対応 ・パラメータ数:9B, 27B ・オープンライセンス |
Gemma 3 | 2025年3月 | ・マルチモーダル・マルチリンガル対応 ・パラメータ数:1B, 4B, 12B, 27B ・128Kトークン長 ・LM StudioでGemma3を動かしてみた |
Gemma 3n | 2025年6月 | ・モバイル最適化 ・パラメータ数:5B, 8B相当 ・PLE技術で低メモリ |
Gemma 3 270M | 2025年8月 | ・超小型AIモデル(300MB以下) ・パラメータ数:0.27B ・ファインチューニング用 |
VaultGemma | 2025年9月 | ・差分プライバシーで完全にプライバシー保護 ・パラメータ数:1B ・Gemma 2ベース |
まとめ
GeminiはProが高性能版、Flashが通常版、Flash-Liteが軽量版。
そしてGemmaは3nがモバイル用ということでした。