
Jahrelang dominierten Likert-Skalen die Mitarbeitendenbefragung, denn Kreuzchen auf einer Skala von 1 bis 5 machen die Auswertungen handhabbar. Doch über das „Warum“ hinter dem „Was“ verraten sie wenig. Freitextantworten schon eher – nur war deren Auswertung bislang viel zu aufwendig, vor allem in großen internationalen Organisationen. Das ändert sich gerade grundlegend. Denn die KI-gestützte Textanalyse macht die Auswertung qualitativen Feedbacks endlich skalierbar.
Mitarbeitendenbefragungen gehören mittlerweile zum Standardrepertoire fast jeder Organisation. Regelmäßig geben Beschäftigte an, wie zufrieden sie mit Führung, Strategie, Kommunikation oder Arbeitsplatz sind, sei es in umfassenden Befragungen auf Unternehmensebene oder thematisch fokussierten Surveys. Das Ergebnis: Zahlen, Benchmarks, Ampelfarben. Diese Daten haben klare Stärken bei Vergleichbarkeit, statistischer Absicherung und Tracking über Zeit. Doch sie beantworten vor allem das Was – nicht das Warum. Wer verstehen will, welche konkreten Erfahrungen, Motive und Kontexte hinter einem Score stecken, braucht qualitative Einblicke.
Ungenutztes Potenzial
Der Grund, warum qualitative Fragen in Mitarbeitendenbefragungen so lange ein Schattendasein führten, war pragmatisch: Freitextantworten von hunderten oder tausenden Mitarbeitenden auszuwerten, ist schlicht sehr aufwendig – erst recht in internationalen Organisationen mit vielen Sprachen. Also begnügte man sich mit ein bis zwei offenen Fragen, oft am Ende und nach der Art: „Was möchten Sie uns sonst noch sagen?“ Die Befragung sollte kurz bleiben, weil mit zunehmender Länge die Teilnahmebereitschaft sinkt.
KI löst den Zielkonflikt
Was bisher oft an Ressourcen scheiterte, macht künstliche Intelligenz jetzt möglich: die automatisierte Analyse großer Mengen an Freitextantworten in beliebig vielen Sprachen. Das verändert nicht nur die Auswertung, sondern ermöglicht auch ein neues Befragungsdesign und eröffnet so Erkenntnismöglichkeiten, die weit über reine Effizienzgewinne hinausgehen:
- Erkennen, wie Mitarbeitende Begriffe tatsächlich definieren. „Digitalisierung“ oder „unsere sozialen Kanäle“ in einer quantitativen Frage kann vieles bedeuten. Hier brauchte es bisher viele Folgefragen. Freitexte zeigen direkt, was die Belegschaft konkret darunter versteht und wo das Verständnis gegebenenfalls auseinanderklafft.
- Perspektiven zu Schmerzpunkten und Erfolgsfaktoren verstehen. Freitextfelder liefern die Geschichten hinter den Zahlen. Sie erfassen Erfahrungen, Emotionen und Einstellungen, die sich in Skalen kaum abbilden lassen. Sie decken auch kritische, verborgene Themen auf – Mobbing, Mikromanagement, informelle Machtstrukturen –, die nur in wenigen Fragebögen explizit abgefragt werden. Und sie zeigen, was gut läuft und warum. Auch bei Führungskräften steigt die Akzeptanz von Ergebnissen deutlich, wenn harte Zahlen durch O-Töne und Fallbeispiele illustriert werden. Ein Score von 3,2 bei „Verstehen Sie die Strategie?“ sagt wenig. Zwanzig Mitarbeitende, die beschreiben, dass sie die Strategie zwar kennen, aber nicht verstehen, was sie für ihren Arbeitsalltag bedeutet – das bewegt.
- Konkrete Lösungsansätze aus der Mannschaft bekommen. Mitarbeitende, die täglich auf Schwachstellen treffen, liefern in Freitexten häufig nicht nur Problembeschreibungen, sondern auch praxisnahe Lösungsvorschläge. Dieses operative Wissen findet in einer Likert-Skala kaum Ausdruck.
Datenschutz: Vertrauen ist nicht verhandelbar
KI-Modellen sollte man bei Mitarbeitendenbefragungen nicht blind vertrauen. Es gilt, sofern möglich, im Unternehmen freigegebene und im besten Fall auch DSGVO-konforme Tools einzusetzen. Vor dem Hochladen in eine KI sollten die Daten anonymisiert werden: Unternehmensname, Namen von Personen, Produktbezeichnungen und Standorte unbedingt entfernen. So wird verhindert, dass sensible Informationen unbeabsichtigt nach außen gelangen.
Ein Beispiel aus unserer Beratungspraxis
Bei einem Kunden erzielte das Thema „Digitalisierung“ bei den Veränderungsthemen im Vergleich zu anderen Dimensionen den höchsten quantitativen Zufriedenheitswert. Abgehakt? Weit gefehlt. Die Freitextantworten zeichneten ein anderes Bild: Ja, es sei besser geworden, aber noch lange nicht gut genug, und im Vergleich zur Konkurrenz hinke man weiter hinterher. Hätte man nur auf die Skala geschaut, wären die konkreten Probleme unsichtbar geblieben – und mit ihnen die Lösungsvorschläge, die nur aus der operativen Praxis kommen können.
So funktioniert die KI-gestützte Auswertung
Der Auswertungsprozess folgt einer klaren Logik:
- Zunächst werden alle Freitextantworten anonymisiert und in eine Zielsprache übersetzt – bevorzugt Englisch, weil die Sprachmodelle hier die höchste Kompetenz haben. Wichtig dabei: die KI mit einem Glossar für Unternehmensbegriffe, Abkürzungen etc. zu füttern, wie sie auch ein gutes Übersetzungsbüro nutzen würde.
- Anschließend erfolgt die automatische Codierung: Die KI identifiziert übergeordnete Themen wie Zusammenarbeit, Servicequalität oder Führungsverhalten und codiert die Antworten als positiv, negativ oder neutral. Zudem liefert sie direkt beispielhafte Zitate, die auch zur Überprüfung der Validität dienen.
Entscheidend ist dabei die Qualität des Prompts, also der Anweisung an die KI. Er muss wissenschaftliche Standards vorgeben und Sonderfälle berücksichtigen, etwa wenn eine einzelne Antwort mehrere Themen berührt. Den richtigen Prompt zu entwickeln, kostet Zeit und Expertise. Hat man ihn aber einmal vorliegen, lassen sich Schwerpunktauswertungen nach Region, Bereich oder Hierarchieebene mit geringem Zusatzaufwand erstellen.
Ein Hinweis: Je nach Sprache können Ironie, Zynismus oder kulturelle Anspielungen in der Übersetzung verloren gehen. Bei großen Grundgesamtheiten fällt das allerdings kaum ins Gewicht, der Erkenntnisgewinn überwiegt bei Weitem.
Best Practice: Quantitativ starten, qualitativ vertiefen
Ein Best-Practice-Ansatz von einem Kunden aus der Industrie: ein schlanker quantitativer Fragebogen mit fünf bis sieben Fragen auf einer Likert-Skala zu den zentralen Themenfeldern der Organisation. Je nach Ausprägung der Antwort – positiv, neutral oder negativ – folgt eine qualitative Anschlussfrage als Freitext: „Warum finden Sie das gut?“, „Was stört Sie konkret?“ oder „Warum haben Sie dazu keine Meinung?“ So bleibt die Befragung kurz – sie könnte ohne qualitative Beantwortung sogar in unter einer Minute erledigt werden –, liefert aber eine Tiefe, die rein quantitative Ansätze nicht bieten können.
Fazit: Kürzer befragen, umfassender verstehen
Die Kombination aus möglichst schlanker quantitativer Befragung, qualitativen Folgefragen und KI-gestützter Auswertung löst einen jahrzehntealten Zielkonflikt. Organisationen erhalten tiefere Einblicke bei kürzerer Befragungsdauer – und das sprachunabhängig, skalierbar und mit vertretbarem Aufwand. Wer heute noch ausschließlich auf Kreuzchen setzt, verschenkt das Potenzial, zu verstehen, was die eigenen Mitarbeitenden wirklich bewegt. Und noch etwas kommt hinzu: Eine Befragung, die Raum für eigene Worte lässt, stärkt die Dialog- und Feedbackkultur. Mitarbeitende erleben, dass ihre Perspektiven erzählt und nicht nur angekreuzt werden. Das verändert, wie ernst sie die Befragung selbst nehmen.




