Top
bild von: Unsplash

Visual ChatGPT: Microsoft ergänzt ChatGPT um visuelle KI-Fähigkeiten mit Bildern

April 17, 2023

Kategorie:

Mit Visual ChatGPT hat Microsoft ein multimodales Konversationsmodell veröffentlicht, das auf ChatGPT aufbaut und OpenAIs KI-System mit verschiedenen Visual Foundation Models (VFM) wie Stable Diffusion kombiniert. Mit solchen visuellen Basismodellen können Computer komplexe Bilder analysieren und selbst erzeugen. Dabei betont das Team aus Wissenschaftlern rund um den Senior Researcher Dr. Chenfei Wu von Microsoft Asia in Peking, kein multimodales ChatGPT von Grund auf neu trainieren zu wollen. Stattdessen wähle der für Visual ChatGPT zentrale Prompt Manager anhand der Nutzeranweisungen jeweils zum Auftrag passende Modelle aus. Bei Visual ChatGPT dürfte es sich um eines der Anfang März 2023 von Microsoft Germany angekündigten multimodalen Modelle handeln.

Mehr Lesen auf Heise Online