Gemma
ModelleGemma ist Googles quelloffene Modellfamilie für effiziente lokale und Edge-Deployments – von 2B bis 27B Parametern.
Was ist Gemma?
Gemma ist eine Familie leichtgewichtiger Open-Source-Sprachmodelle von Google DeepMind, erstmals im Februar 2024 veröffentlicht. Im Gegensatz zu Googles proprietärem Gemini-Modell sind Gemma-Gewichte offen verfügbar (lizenziert unter Googles eigener Gemma Terms of Use, die kommerzielle Nutzung erlaubt). Die aktuelle Generation Gemma 3 (2025/26) umfasst Modellgrößen von 1B bis 27B Parametern.
Gemma-Modelle basieren auf denselben Forschungsgrundlagen wie Gemini, sind jedoch für Effizienz auf Consumer- und Edge-Hardware optimiert. Besondere Aufmerksamkeit erfährt Gemma durch seine Integration in Googles KI-Ökosystem (Vertex AI, Keras, Hugging Face) und starke Tool-Use-Fähigkeiten.
Eigenschaften und Varianten
Die Gemma-Familie bietet spezialisierte Modelle für unterschiedliche Anforderungen:
- Gemma 3 (1B–27B): Sprachmodelle für Text-Generierung, Zusammenfassung, QA
- PaliGemma 2: multimodales Modell für Bild-Text-Aufgaben (VLM)
- CodeGemma: spezialisiert auf Code-Generierung und Code-Completion
- Gemma 3 ShieldGemma: Safety-Classifier für Content-Moderation
- Geringe Hardwareanforderungen: 2B-Modell läuft auf modernen Smartphones und Einplatinenrechnern
Besonderheit
Gemma 3 unterstützt nativ einen 128.000-Token-Kontext – deutlich mehr als die meisten vergleichbar kleinen Open-Source-Modelle.
Relevanz für den Mittelstand
Gemma ist besonders attraktiv für KMU, die KI lokal betreiben wollen: Die kleineren Modelle (2B, 7B) laufen auf Standard-Serverhardware ohne dedizierte High-End-GPUs. Die Integration in Googles Ökosystem erleichtert den Einstieg für Teams, die bereits Cloud-Dienste von Google nutzen. Für Anwendungen auf Edge-Geräten – z. B. lokale Sprachassistenten oder offline-fähige Dokumentenanalyse in der Produktion – ist Gemma eine der praktikabelsten Open-Source-Optionen 2026.
← Zurück zum Glossar