Multimodal
ArchitekturKI-Modelle, die verschiedene Medientypen verarbeiten: Text, Bilder, Audio, Video. GPT-4V, Gemini sind multimodal.
Was ist Multimodal?
KI-Modelle, die verschiedene Medientypen verarbeiten: Text, Bilder, Audio, Video. GPT-4V, Gemini sind multimodal.
Warum ist das relevant?
Für Unternehmen, die KI einsetzen möchten, ist ein Grundverständnis von Multimodal hilfreich, um fundierte Entscheidungen treffen zu können und mit KI-Dienstleistern auf Augenhöhe zu kommunizieren.
Im Unternehmenskontext
Bei der Einführung von KI-Lösungen werden Sie diesem Begriff begegnen. Unser Team erklärt Ihnen gerne im Detail, wie Multimodal in Ihrem spezifischen Anwendungsfall relevant ist.
← Zurück zum Glossar