K12

Bild-KI-Detektoren im Test

14. September 2023 · von Joerg Hoewner · Keine Kommentare

Ein wichtiges Element für den Umgang mit KI-generierten (vermeintlichen) Fake-Inhalten sind KI-Detektoren. Wir haben für die Ausgabe 5/2023 des prmagazins verschiedene Detektoren für KI-Texte getestet und die meisten von ihnen für untauglich befunden. Inzwischen sieht selbst OpenAI in, dass die KI-Detektoren für Text Schrott sind. 

Doch wie sieht es mit Detektoren für KI-generierte Bilder aus? Besteht da noch Hoffnung?

Wir haben vier verschiedene Fotos getestet, von denen eines (angeblich) Nicht-KI-generiert ist, die anderen drei nachweislich mit KI. Alle Fotos waren unter einer Creative Commons-Lizenz verfügbar.

  • Batikmacher – angeblich Nicht-KI-generiert (Link) – wobei wir da erhebliche Zweifel haben
  • Kloster Paulinzella – Nicht-KI-generiert
  • Mädchen mit Katze – KI-generiert (leichter zu erkennen, imho)
  • Polizisten in Paris – KI-generiert (schwierig aus unserer Sicht, Indizien sind die seltsamen Kameras, aber der Rest wirkt echt)
  • Trumps Verhaftung – KI generiert (hier sind Artefakte erkennbar, aber erst auf dem zweiten Blick)

Verschiedene Tools wurden ausprobiert, die Ergebnisse im Einzelnen:


Prob. = Probability / Wahrscheinlichkeit

Testbild Huggingface.co (Maybe´s AI Art Detector)illuminarty.aidetecting-ai.comhivemoderation.comisitai.comfakeimagedetector.comV7 Chrome extension
BatikmacherAI prob.  7%
(ok)
AI prob. 45%
(ok)
AI prob. 8.3% 
(ok)
AI prob. 0%
(ok)
AI prob. 17.54%
(ok)
Not AI
(ok)
Not AI
(ok)
Kloster PaulinzellaAI prob. 38%
(ok)
AI prob. 0.8%
(ok)
AI prob. 38.3%
(ok)
AI prob. 0%
(ok)
AI prob. 93.91%AI
(fail)
Not AI
(ok)
Mädchen mit KatzeAI prob. 14%
(fail)
AI prob. 98%
(ok)
AI prob. 13.8%
(fail)
AI prob. 99.9%
(ok)
AI prob. 85.47%
(ok)
AI
(ok)
Not AI
(fail)
Polizisten in ParisAI prob. 8%
(fail)
AI prob.  98.4%
(ok)
AI prob. 5.5%
(fail)
AI prob. 99.9%
(ok)
AI prob. 97.22%
(ok)
AI
(ok)
Not AI
(fail)
Trumps VerhaftungAI prob. 63%
(ok)
AI prob. 96.9%
(ok) 
AI prob. 62.2%
(ok)
AI prob. 99.9%
(ok)
AI prob. 94.04%
(ok)
AI
(ok)
Not AI
(fail)
Trefferquote60%100%60%100%80%80%40%

Hinweis: Das neue SynthID von Google konnten wir leider noch nicht testen.

Fazit: Die Ergebnisse sind besser als bei der Erkennung von KI-generierten Texten. Allerdings auch hier nicht durchgehend zuverlässig – am besten schneiden illuminarty.ai und hivemoderation.com ab. Perspektivisch dürfte es für Tools immer schwieriger werden, KI-generierte Fotos automatisiert zu erkennen.

Buchtipp: „Design for Cognitive Bias“ von David Dylan Thomas

Design for cognitive bias

23. August 2023 · von Joerg Hoewner · Keine Kommentare

Fazit: sehr empfehlenswert

Ich stehe auf der Kirmes vor einer Losbude und habe zwei Auswahlmöglichkeiten. Auf der ersten Lostrommel steht: „Los nur 5 Euro. Sie können bis zu 50 Euro gewinnen!“ Auf der zweiten Lostrommel steht: „Sie können bis zu 5 Euro verlieren, aber auch 50 EUR gewinnen.“

Obwohl die Aussagen inhaltlich identisch sind, also der Einsatz und die Gewinnmöglichkeiten in beiden Fällen gleich sind, werden die meisten Menschen so reagieren wie ich: Sie greifen in die erste Lostrommel. Aber warum?

Der Grund dafür sind zwei kognitive Verzerrungen, Denkmuster, die unsere Wahrnehmung und die daraus resultierenden Entscheidungen beeinflussen. In diesem Fall sind es gleich zwei: Zum einen das so genannte Framing, also die Darstellung von Informationen in einer Weise, die ihre Interpretation beeinflusst. Zum Beispiel mit dem – negativ besetzten – Begriff „verlieren“ in der zweiten Variante, die das Risiko in den Vordergrund stellt und erst danach die Gewinnmöglichkeit. Gleichzeitig wird eine vielfach belegte, psychologische Verzerrung genutzt, die „Verlustaversion“ („Loss Aversion Fallacy“): Wir neigen dazu, auf wahrgenommene Verluste stärker zu reagieren als auf mögliche Gewinne, ein Denk- und Verhaltensmuster, das erstmals von den Psychologen Daniel Kahnemann und Amos Twersky beschrieben wurde („Schnelles Denken, Langsamen Denken“) – als eines von vielen weiteren „cognitive biases“, die die klassische Vorstellung vom rational entscheidenden „homo oeconomicus“ ins Wanken gebracht haben. 

Inzwischen spielt der Einfluss kognitiver Verzerrungen in vielen Anwendungsfeldern eine immer größere Rolle. Was sich daraus speziell für das Design von Kommunikationsprodukten ergibt, ist Thema von David Dylan Thomas lesenswertem Buch „Design for cognitive biases“. Mit gutem Design, das den Einfluss kognitiver Verzerrungen berücksichtigt, können Nutzer:innen zu besseren, bewussteren Entscheidungen geführt werden. Oder auch gezielt manipuliert werden.

Wie das (im positiven Sinne) geht, zeigt das Buch anhand vieler Beispiele. Zunächst werden im 1. Kapitel die wichtigsten Biases vorgestellt. Im anschließenden 2. Kapitel werden „User Biases“ zusammen mit Ansatzpunkten für ein besseres Design diskutiert. Der Fokus liegt dabei auf digitalen Anwendungen. 

Richtig spannend wird es in der zweiten Hälfte des Buches. Im 3. Kapitel geht es um „Stakeholder Biases“, also um kognitive Verzerrungen beispielsweise auf Kundenseite, wenn es um Design- und Produktentscheidungen geht.

Im 4. und letzten Kapitel schließlich stehen die Designer:innen selbst im Mittelpunkt. Beschrieben werden neben den kognitiven Verzerrungen, von denen natürlich auch Designer:innen und Kommunikationsexpert:innen nicht ausgenommen sind, sondern dazu Methoden und praktische Lösungsansätze vorgestellt, um den eigenen Biases entgegenzuwirken. 

Ein wichtiges Thema und deshalb eine klare Leseempfehlung für alle, die eine kluge, kurze und knackige Einführung suchen. Wie alle Bücher in der Reihe „A book apart“ ist kurzweilig geschrieben, lesefreundlich gestaltet und bringt auf rund 100 Seiten das Wesentliche auf den Punkt.

Wer noch tiefer in die Themen Design und Verhaltenspsychologie einsteigen möchte, wird in dem schon etwas älteren, deutlich umfangreicheren und ebenfalls sehr empfehlenswerten Buch von Stephen Wendel fündig: „Designing for Behavior Change: Applying Psychology and Behavioral Economics“ (O´Reilly-Link). 

„Design for cognitive bias“ kann hier bestellt werden: https://abookapart.com/products/design-for-cognitive-bias

Aus der Reihe außerdem rezensiert haben wir:

KI in Bewegtbildformaten – Tools & Learnings

18. Juli 2023 · von Markus Girrulat · Keine Kommentare

Künstliche Intelligenz macht auch beim Bewegtbild nicht halt. Die Anwendungsgebiete sind allerdings längst nicht so überschaubar, wie bei reinen Einzelbildern oder Text-KIs. Grob kann man die Anwendungsgebiete künstlicher Intelligenz im Kontext von Bewegtbildformaten auf drei Anwendungsfelder unterteilen.

1. Generative KI:


Hier geht es konkret um das generieren von Bewegtbildern. Nach dem Hype um Midjourney und Dall E tauchten in den sozialen Netzen auch etliche Videos auf, die entweder komplett KI-generiert sind und mit Prompts erstellt wurden (text to video), als auch sogenannte video-to-video-Inhalte. Hier nimmt man ein bestehendes Video und lässt die KI die Bildinhalte nach Wunsch (und eingegebenen Prompts) umgestalten. Basis bleibt aber hier der Bildaufbau des Source-Videos. Die bewegten Inhalte sind oft noch nicht perfekt oder fotorealistisch, was vor allem auf ein Flimmern im Bild zurückzuführen ist. Schaut man diese Videos an, sieht man fast immer, dass sich Bildinhalte im Laufe des Videos verändern.

Weiterlesen →

Best of Employer Branding: drei Insights vom Recruiting Festival #rc23 in Berlin

3. Juli 2023 · von Arne Müller · Keine Kommentare

Mein Team Corporate Communications unterstützt Kund:innen konzeptionell und kreativ beim Employer Branding. Auf dem Recruiting Festival #rc23 in Berlin habe ich Insights und Inspirationen zur erfolgreichen Gewinnung und Bindung von Mitarbeitenden getankt: wertvoller Input in Zeiten von Fachkräftemangel und Arbeiterlosigkeit!

Weiterlesen →

KI-gestützte Text-to-Voice-Tools im Vergleich

21. Juni 2023 · von Joerg Hoewner · Keine Kommentare

Inhaltliche Vorbereitung von Markus Girrulat (hier ist der Autor nur der Bote).

Im Rahmen der Vorarbeiten für einen neuen Beitrag im PR-Magazin, haben wir uns diverse KI-gestützte Text-to-voice-Werkzeuge angeschaut und ausgetestet.

Alle wurden mit einem Text in zwei Sprachen bestückt, so dass es möglich war, jeweils die deutsch- und englischsprachigen Sprachmodelle (je eher männlich und eher weiblich klingende Stimmen) zu testen.

Wir haben vier Werkzeuge ausgewählt, die in bisherigen Rezensionen mit den besseren Bewertungen wegkamen, genauer: Beepboobly, Murf, NaturalReader und PlayHT.

Hier könnt Ihr Euch die Beispiele direkt anhören und selbst ein Urteil bilden.

Beepboobly

Murf

Natural Reader

PlayHT

Unser Fazit:

Die KI-gestützte Text-to-Voice-Technologie hat eine erstaunliche Entwicklung erlebt. Die Usability punktet durch einfache Handhabung: Sprache auswählen, Text eingeben, KI arbeiten lassen. Erweiterte Einstellungen, wie bei Murf, erlauben Tonhöhen- und Tenor-Anpassungen.

Die Qualität verbessert sich kontinuierlich. Im englischen Raum gibt es bereits Modelle, die kaum von professionellem Voiceover zu unterscheiden sind. Im deutschen Raum hat MURF die Nase vorn, gefolgt von Beepboobly und PlayHT.

Trotz Fortschritten gibt es Hürden: Bei Fachwörtern und Anglizismen kommen Fehler vor, ebenso kann die Aussprache im Kontext je nach Modell seltsam oder neutral und leblos wirken. Hier zeigt sich die Bedeutung der Textanalyse durch die KI und der Qualität des Voicemodells selbst.

Interessant ist die Beobachtung, dass viele Voicemodelle denselben Ursprung haben, wahrscheinlich Open Source. Zukünftig wird dies variieren und die Qualität der Voicemodelle wird mindestens 50% des Erfolgs einer Plattform ausmachen.

Die Anwendungen der KI-Voices sind vielfältig, ideal für schnelle Social Media Posts oder kleinere Audio- und Video-Projekte. Allerdings ist die Kontrolle eingeschränkt und Texte mit vielen Fach- oder Fantasiebegriffen sollten vermieden werden. Für Unternehmen könnten AI-Voices interessant sein, vor allem bei Übersetzungen für internationale Unternehmen.

Für Profis ist derzeit noch die Speech-to-Speech-Methode die bessere Wahl, da sie eine gezielte Beeinflussung von Ton und Betonung ermöglicht. Anbieter wie MURF bieten diese Option bereits an.