Machine-Learning-Expert:innen bei iteratec haben für das interne Marketing-Team einen Text- und Bild-Generator entwickelt. Damit können Champion Stories zu erfolgreichen Kundenprojekte einfach und schnell geschrieben werden.
Wie viele andere Fachbereiche stellen wir uns seit dem Launch von ChatGPT die Frage, wie Künstliche Intelligenz im Allgemeinen und Large Language Models im Spezifischen gewinnbringend eingesetzt werden können. Hier möchten wir die gewonnen Erkenntnisse aus unserem Projekt teilen. Relevant sind diese für alle, die strukturierte Texte oder Berichte mit der Hilfe von generativer KI erstellen, Bilder mit der Hilfe von generativer KI erstellen oder etwas über Prompting Engineering anhand eines Use Cases lernen möchten.
- Ziel: Ein intuitives Tool für das Marketing-Team
- Herausforderung 1: Prompt Engineering
- Herausforderung 2: Prompting für Texte
- Herausforderung 3: Prompting für Bildgenerierung
- Herausforderung 4: Datenschutz
- Vom ersten Use Case zu weiteren spannenden Projekten
Ziel: Ein intuitives Tool für das Marketing-Team
Ein intuitives Tool entwickeln, das den Text sowie passende Bilder für Champion Stories - Kundenprojekte auf unserer Webseite - erstellt. Das war das Ziel. Die Champion Stories boten sich als Use Case an, da sie stets nach einer einheitlichen Struktur aufgebaut sind: von Kundenherausforderung bis -lösung. So konnte ein Prompt nach genauen Vorgaben entwickelt werden. Am Ende stand eine Weboberfläche, die ein unstrukturiertes Briefing zunächst in ein strukturiertes Briefing überführte und daraus einen Text und Bilder entwickelte.
Im Hintergrund nutzt das Tool die OpenAI API, verschiedene Bildgenerierung-APIs wie DALL-E und Stable Diffusion und hat Zugriff auf Stock-Fotos. Zusätzlich wurden während des Projekts ChatGPT und GitHub Copilot verwendet, um das volle Potenzial der generativen KI auszunutzen und Erfahrungswerte zu sammeln.
Herausforderung 1: Prompt Engineering
Am wichtigsten für den Erfolg der Anwendung war das Prompt Engineering. Prompts, also Anweisungen an das KI-Tool, müssen dabei so formuliert werden, dass die Erwartung der Anwender:innen und das Ergebnis bestmöglich miteinander übereinstimmen. Zwar geben mittlerweile viele Unternehmen im Tech-Bereich in Blogs und Dokumentationen Tipps für das Prompt Engineering, jedoch fehlt meist eine klare Anleitung, wie man zu dem gewünschten Ergebnis gelangt. Wir experimentierten.
Die größte Herausforderung war es, die langen, oftmals zwei-seitig generierten Texte stets in aller Tiefe strukturiert zu analysieren und zu bewerten. Warum? Erstens, können Kleinigkeiten im Prompt große Wirkung auf das Ergebnis haben. Dadurch war es schwer nachzuvollziehen, welche Änderung im Prompt das Ergebnis verändert hat. Zweitens, variiert der ausgegebene Text aufgrund eines gewissen Maßes an Zufall und somit ist es schwer festzustellen, ob das Ergebnis wirklich konstant gut ist oder die Ausgabe eine glückliche Ausnahme war. Zu entscheiden, ob ein generierter Text gut geschrieben und inhaltlich sinnvoll ist, braucht Zeit und ist oft subjektiv.
Man kann zudem davon ausgehen, dass viele verschiedene Prompts zu guten Ergebnissen führen. Daher reicht es aus, einen guten Prompt zu finden. Zügiges und iteratives Testen verschiedener Prompt-Variationen ist somit weitaus effizienter als eine akribische Einzelbewertung jeder Änderung.
Am Ende stand unsere Erkenntnis, dass die Bewertungskriterien (z. B., Sprachstil und Textlänge, wenig Halluzinationen, Informationsgehalt, oder Konsistenz) und Bewertungsmethoden (z. B. Expertenbewertungen, Definieren einer Punkteskala, oder automatische Textanalyse) bereits am Anfang festgelegt und priorisiert werden sollten. Auch die Ziele müssen klar definiert sein und können bei Bedarf iterativ angepasst werden.
Uns half zudem, das Minimal Viable Product (MVP) in Form einer Applikation schnell zur Verfügung zu stellen. So konnte das Team möglichst früh testen, ob der Prompt die gewünschten Texte generiert. Alternativ konnte der Prompt auch direkt in ChatGPT getestet werden.
Mehr Informationen zu Best-Practices beim Prompting hat OpenAI hier bereitgestellt.
Herausforderung 2: Prompting für Texte
Generative KI ist noch weit davon entfernt, die Prompts wie ein Mensch zu verstehen und dementsprechend zu handeln. Vielmehr wird mit dem Prompt ein Text generiert, der am wahrscheinlichsten passend ist. Diese Wahrscheinlichkeit beruht auf allen Trainingsdaten, quasi dem gesamten Internet. Und so tat sich das Tool schwer, längere Texte mit vordefinierter inhaltlicher Struktur zu erstellen.
Beispielsweise waren Wiederholungen eine Herausforderung. Viele Inhalte tauchten in mehreren Absätzen wiederholt auf, und der generierte Text lieferte nicht den gewünschten Inhalt je Absatz. Die Ursache lag darin, dass das Briefing ursprünglich für Menschen, nicht für ChatGPT geschrieben wurde und somit viel Flexibilität erlaubte. Das Briefing wurde also viel strikter formuliert und Wortwiederholungen vermieden.
Darüber hinaus neigt ChatGPT dazu, Aufgabenstellungen zu ignorieren, selbst wenn der Prompt eine explizite Anforderung enthält. Ein Beispiel ist, dass unsere Champion Stories drei unterschiedliche Überschriften brauchen. Trotz ausführlicher Anweisung im Prompt, setzte ChatGPT nicht immer zuverlässig um. Die Lösung bestand darin, zwei separate Prompts zu nutzen: Mit dem ersten Prompt wird eine Story mit nur einer Überschrift erstellt, und der zweite Prompt dient anschließend dazu weitere Überschriften zu generieren. Dies führte zu einer deutlich verbesserten Textqualität.
Herausforderung 3: Prompting für Bildgenerierung
Um passende Bilder für die Champion Stories zu erstellen, haben wir mithilfe von ChatGPT kurze und prägnante Ideen für Bilder generieren lassen. Der Nutzer kann in der Anwendung aus fünf Optionen wählen.
Die entscheidende Herausforderung lag in der Gestaltung des Prompts für ChatGPT, um qualitativ hochwertige Ideen und Anleitungen für die Bildgenerierung zu erzeugen. Die generierten Ideen für die Bilderstellung klangen oft vielversprechend und waren thematisch stimmig. Dennoch traten beim Erstellen der Bilder Probleme auf, darunter verschiedene Artefakte, Fehler in Gesichtern und in Details, und nicht immer wurden alle Vorgaben eingehalten. Um dieses Problem zu lösen, versuchten wir, mithilfe der Prompts feine Strukturen in den Bildern zu unterbinden, um mögliche Artefakte und Fehler zu vermeiden. Dies führte zu gewissen Verbesserungen, aber die resultierenden Bilder waren nach wie vor eindeutig als künstlich und inkohärent erkennbar.
Zusammenfassend lässt sich sagen: Mit einer kurzen Projektbeschreibung oder einem Briefing ist es möglich, themenrelevante Bilder zu generieren und verschiedene Optionen zur Verfügung zu stellen. Ein GenAI-Tool wie ChatGPT kann, wenn es mit dem richtigen Prompt versorgt wird, Informationen liefern, um geeignete Prompts zur Bildgenerierung zu erstellen. Allerdings gestaltet sich die Generierung von Bildern, die den Ansprüchen von iteratec an fotorealistische Darstellungen und idealerweise die Einbeziehung von Menschen erfüllen, nach wie vor als äußerst anspruchsvoll.
Herausforderung 4: Datenschutz
Zum Start wurden die klassische API von OpenAI genutzt und somit die Daten des Briefings und Informationen über Kundenprojekte auf amerikanischen Servern gespeichert. Daher nutzten wir zu Trainingszwecken ausschließlich Champion Stories und Inhalte, die bereits für die Veröffentlichung freigeben waren.
Eine Lösung war jedoch die Umstellung auf den Azure OpenAI Service. Dieser Service bietet Zugang zu OpenAI's GPT-3 Modellen mit erweiterten Unternehmensfunktionen, darunter Sicherheit, Compliance und regionale Verfügbarkeit. Durch die Nutzung des Azure OpenAI Services können wir die Daten lokal und unter Einhaltung der Datenschutzrichtlinien speichern, während wir weiterhin von den leistungsstarken Textgenerierungsfähigkeiten profitieren.
Vom ersten Use Case zu weiteren spannenden Projekten
Die fertige Webanwendung, inklusive Prompts, wurde bereits erfolgreich für Tests verwendet. Obwohl der generierte Text nicht fehlerfrei ist und im Nachhinein weiter verfeinert und angepasst wird, stellt die Anwendung eine bedeutende Unterstützung dar, um eine initiale Struktur, Überschriften, Absatzinhalte und kreative Formulierungen zu erhalten. Das Tool beschleunigt das Erstellen von Champion Stories erheblich. Die Erkenntnisse, die wir im Bereich des Prompt Engineerings und der Integration von ChatGPT gewonnen haben, sind eine solide Grundlage für weitere Projekte.
Haben Sie Fragen oder benötigen Sie Unterstützung?
Mehr zu den Möglichkeiten von Künstlicher Intelligenz für Ihr Unternehmen finden Sie auf unserer Webseite.
Sprechen Sie uns auch gerne an.