Glossar
Multimodale KI
KI, die mehrere Arten von Inhalten versteht, etwa Text und Bild.
Multimodale KI kann verschiedene Eingabearten gleichzeitig verarbeiten, zum Beispiel Text, Bilder, Ton oder Tabellen. So lässt sich etwa ein Foto beschreiben oder eine Frage zu einem Diagramm beantworten. Diese Fähigkeit macht KI-Werkzeuge im Alltag vielseitiger als reine Textmodelle.