Ein Klick, und das Meeting schreibt sich selbst mit. Microsoft Teams, Zoom, Webex – nahezu jede Videokonferenzplattform bietet heute eine integrierte Transkriptionsfunktion an. Das Ergebnis ist ein vollständiges Wortprotokoll, das automatisch mit Sprecherzuordnung und Zeitstempeln erstellt wird. Was technisch praktisch ist, ist rechtlich jedoch komplexer als viele Unternehmen annehmen. Denn bei der Transkription von Videokonferenzen treffen zwei Rechtsgebiete aufeinander, die unterschiedlichen Anforderungen unterliegen. Während das Datenschutzrecht auf der Hand liegt, muss bei der Transkription auch das das Strafrecht im Auge behalten werden.
Der vorliegende Beitrag erklärt, wo die rechtlichen Risiken liegen, wie sich Aufsichtsbehörden bereits geäußert haben und unter welchen rechtlichen Bedingungen Transkriptionen eingesetzt werden können.
Was technisch bei der Transkription passiert und warum das rechtlich eine Rolle spielt
Bevor es in die rechtlichen Details geht, lohnt sich ein kurzer Blick auf die technische Funktionsweise moderner Transkriptionssysteme. Denn entgegen einer verbreiteten Vorstellung bedeutet automatisierte Spracherkennung nicht, dass eine KI einfach „zuhört“ und das Gesagte unmittelbar mitschreibt.
In der Praxis wird das akustische Signal zunächst digital erfasst, in sehr kurze Zeitsegmente zerlegt und in Datenströme überführt. Diese Segmente werden analysiert, typischerweise in charakteristische akustische Merkmale umgewandelt und anschließend durch statistische oder neuronale Modelle verarbeitet, um daraus Text zu rekonstruieren. Dabei wird nicht jeder Ton direkt in ein Wort übersetzt, vielmehr wird das Gesprochene in schlüssig klingende Sprache übertragen. Verzögerungslaute wie „Äh“ und „hmm“ werden aus dem Transkript gelöscht, unvollständige Sätze ergänzt. Um diese Verarbeitung zu ermöglichen, muss das Audiosignal zumindest vorübergehend gespeichert, gepuffert oder in strukturierter Form vorgehalten werden.
Diese Zwischenspeicherung geht regelmäßig über eine rein flüchtige RAM‑Verarbeitung im Sinne eines bloßen „Durchleitens“ hinaus. Selbst bei sogenannten Live‑ oder Echtzeit‑Transkriptionen werden Audiodaten für kurze Zeit zwischengespeichert, segmentiert oder vorverarbeitet. Dies gilt auch dann, wenn am Ende bewusst keine dauerhaft abrufbare Audiodatei gespeichert werden soll.
Genau dieser technische Umstand ist rechtlich entscheidend. Eine hypothetische Live‑Mitschrift ohne jede Form der Speicherung oder Zwischenspeicherung wäre rechtlich anders zu bewerten als der technische Standard marktüblicher Transkriptionstools. Wer diese Differenzierung nicht kennt oder unterschätzt, läuft Gefahr, fehlerhafte Annahmen darüber zu treffen, ob und in welchem Umfang eine Verarbeitung – insbesondere personenbezogener Daten – vorliegt und damit den rechtlichen Prüfungsmaßstab falsch anzusetzen.
Das Datenschutzrecht: Personenbezug, Rechtsgrundlagen und die Tücken der Einwilligung
Transkriptionen verarbeiten in der Regel personenbezogene Daten im Sinne von Art. 4 Nr. 2 DSGVO. Dazu zählen nicht nur explizite Identifikationsdaten wie Namen oder E‑Mail‑Adressen, sondern regelmäßig auch der Inhalt der Wortbeiträge. Soweit Transkriptionstools darüber hinaus eine Sprecherzuordnung oder Sprecheridentifikation vornehmen, kann auch die Stimme selbst als personenbezogenes Datum verarbeitet werden.
Sobald eine Transkriptionssoftware Stimmen einzelnen Personen zuordnet, stellt sich die Frage, ob hierbei biometrische Daten im Sinne von Art. 4 Nr. 14 DSGVO verarbeitet werden und ob damit die strengeren Anforderungen des Art. 9 DSGVO greifen. Das Bayerische Landesamt für Datenschutzaufsicht (BayLDA) vertritt hierzu eine differenzierte Auffassung:
„Die Verarbeitung der Stimme im Rahmen der Transkription stellt in der Regel keine Verarbeitung besonderer Kategorien personenbezogener Daten nach Art. 9 DSGVO dar. Zwar handelt es sich bei der Stimme um ein biometrisches Datum im Sinne von Art. 4 Nr. 14 DSGVO, jedoch wird sie bei der Transkription typischerweise nicht zur eindeutigen Identifizierung einer natürlichen Person genutzt. Die Sprechertrennung erfolgt grundsätzlich über sog. Voice embeddings, also nummerische Vektoren und über externe Kontextinformationen wie bspw. das verwendete Nutzerkonto oder den aktiven Mikrofoneingang, ohne dass eine Identifizierung der sprechenden Person hierfür notwendig ist.“ (vgl. 15. Tätigkeitsbericht 2025, S. 56).
Entscheidend ist somit, ob die Stimme tatsächlich zur Identifizierung einer Person genutzt wird. Sofern dies nicht der Fall ist, findet keine Verarbeitung besonderer Kategorien personenbezogener Daten nach Art. 9 DSGVO statt. Ist dies aber der Fall, gelten besondere datenschutzrechtliche Anforderungen.
Für die Verarbeitung „gewöhnlicher” personenbezogener Daten im Rahmen der Transkription kommen sodann folgende Rechtsgrundlagen in Betracht: die Einwilligung nach Art. 6 Abs. 1 lit. a DSGVO, die Vertragserfüllung nach lit. b sowie das berechtigte Interesse nach lit. f.
Auf den ersten Blick scheint die Einwilligung die naheliegendste Lösung zu sein. In der Praxis scheitert sie im Unternehmenskontext jedoch häufig. Eine Einwilligung muss nach Art. 7 DSGVO freiwillig, informiert, für den bestimmten Fall und unmissverständlich abgegeben werden. Im Beschäftigungsverhältnis wird zudem immer wieder die Freiwilligkeit in Frage gestellt, jedenfalls wenn der Arbeitgeber die Transkription anordnet oder faktisch erwartet. Wer in einem Meeting bleibt, nachdem ein Pop-up erschienen ist und auf „Zustimmen” geklickt hat, hat jedenfalls keine informierte Einwilligung im datenschutzrechtlichen Sinne abgegeben. Bereits die Informationspflichten nach Art. 13 DSGVO werden durch solche Anbieter-Popups in aller Regel nicht erfüllt. Hinzu kommt, dass die Einwilligung jederzeit widerruflich ist. Widerspricht ein Teilnehmer mitten im Meeting, darf die Transkription nicht mehr fortgeführt werden, was den Dokumentationszweck wesentlich beeinträchtigt.
Die entscheidende Frage: Geht es auch ohne ausdrückliche Einwilligung?
Die Vertragserfüllung nach Art. 6 Abs. 1 lit. b DSGVO scheidet in den meisten internen Besprechungen aus. Eine Transkription ist für die Erfüllung des Arbeitsvertrags in der Regel nicht zwingend erforderlich. Angesichts der strukturellen Probleme mit der Einwilligung stellt sich daher die praktisch relevante Frage: Kann das berechtigte Interesse nach Art. 6 Abs. 1 lit. f DSGVO als Rechtsgrundlage für die Transkription interner Meetings dienen?
Die Antwort lautet: Ja, aber nicht pauschal, sondern nur unter konkreten Voraussetzungen.
Art. 6 Abs. 1 lit. f DSGVO erfordert eine dreistufige Prüfung: Erstens muss ein berechtigtes Interesse des Verantwortlichen vorliegen. Zweitens muss die Verarbeitung zur Verfolgung dieses Interesses erforderlich sein. Drittens dürfen die schutzwürdigen Interessen der betroffenen Personen nicht überwiegen.
Für interne Meetings ohne sensiblen Inhalt – also etwa Projekt-Jour-fixes, Teamabstimmungen oder interne Sachstandsbesprechungen – lässt sich diese Prüfung bei entsprechender Ausgestaltung positiv abschließen. Das berechtigte Interesse an effizienter Dokumentation und nachvollziehbarer Protokollierung ist wirtschaftlich anerkannt. Mildere Mittel mit vergleichbarer Wirkung sind kaum ersichtlich. Ein manuelles Protokoll bietet weder die Vollständigkeit noch die Effizienz einer automatisierten Transkription. Auf der Gegenseite der Abwägung steht das Persönlichkeitsrecht der Teilnehmenden, insbesondere ihr Recht am gesprochenen Wort. Die Gewichtung kann hierbei erheblich reduziert werden, wenn die Verarbeitung auf klar definierte Protokollierungszwecke beschränkt ist, kein Profiling und keine Verhaltenskontrolle erfolgt und die Teilnehmenden vorab klar informiert werden und eine echte Möglichkeit haben, nicht teilzunehmen oder in einem alternativen Format beizuwohnen.
Eine Verarbeitung auf Grundlage von Art. 6 Abs. 1 lit. f DSGVO kommt bei Personalgesprächen, Disziplinaranhörungen, Bewerbungsgesprächen oder Meetings, in denen erkennbar besondere Kategorien personenbezogener Daten besprochen werden, hingegen regelmäßig nicht in Betracht. Hier überwiegen die Schutzinteressen der Betroffenen.
Das Strafrecht: § 201 StGB und die Vertraulichkeit des Wortes
Neben dem Datenschutzrecht ist § 201 des Strafgesetzbuches (StGB) zu beachten. Die Norm schützt die Vertraulichkeit des nichtöffentlich gesprochenen Wortes und stellt dessen unbefugte Aufnahme auf einen Tonträger unter Strafe.
Auf den ersten Blick könnte man meinen, dass eine Transkription keine „Aufnahme auf einen Tonträger” darstellt. Diese Annahme wäre jedoch technisch ungenau und – wie einleitend bereits dargestellt – rechtlich gefährlich kurz gedacht. Weil die meisten marktüblichen Tools eine Pufferspeicherung des Audiosignals vornehmen, wird das gesprochene Wort technisch festgehalten, womit der Anwendungsbereich des § 201 Abs. 1 Nr. 1 StGB regelmäßig eröffnet ist.
Die Anforderungen an eine rechtfertigende Einwilligung sind im Strafrecht jedoch deutlich niedriger als im Datenschutzrecht. Nach überwiegender Auffassung – und auch nach ausdrücklicher Stellungnahme des Landesbeauftragten für Datenschutz und Informationsfreiheit Baden-Württemberg (LfDI BW, 40. Tätigkeitsbericht 2024, S. 135) – genügt für die strafrechtliche Rechtfertigung bereits eine stillschweigende oder konkludente Einwilligung. Dies gilt jedoch nur, wenn die betroffenen Personen vorab transparent über die Aufzeichnung informiert wurde und dann wissentlich am Meeting teilnimmt.
Interessant ist in diesem Zusammenhang auch ein Beschluss des Bundesverfassungsgerichts vom 9. Juli 2025 (1 BvR 975/25): Das Gericht hat implizit bestätigt, dass das Merkmal „unbefugt” in § 201 StGB im Lichte der gesamten Rechtsordnung auszulegen ist. Was datenschutzrechtlich erlaubt ist, kann – so das BVerfG – nicht strafrechtlich verboten werden. Eine datenschutzrechtlich tragfähige Rechtsgrundlage kann damit zugleich einen Rechtfertigungsgrund darstellen. Wichtig ist dann aber, dass die datenschutzrechtliche Rechtsgrundlage auch wirksam besteht – ist die Einwilligung mangels transparenter Information oder fehlender Freiwilligkeit unwirksam, die Transkription für die Vertragsdurchführung doch nicht erforderlich, die Interessenabwägung fehlerhaft oder fehlt es in den Datenschutzhinweisen an der Angabe der eigenen Interessen, so fällt die datenschutzrechtliche Rechtfertigung weg und der Straftatbestand ist wieder eröffnet!
Was die Aufsichtsbehörden sagen
Auch die deutschen Datenschutzaufsichtsbehörden haben sich in jüngster Zeit aufgrund der enormen Praxisrelevanz verstärkt zur Thematik geäußert, allerdings nicht einheitlich:
- Das BayLDA hat in seinem 15. Tätigkeitsbericht 2025 (S. 56 f.) anerkannt, dass die Transkription von Videokonferenzen zur Dokumentation von Besprechungsergebnissen auf Art. 6 Abs. 1 lit. f DSGVO gestützt werden kann. Das BayLDA betont dabei die Notwendigkeit einer präzisen Zweckbindung (Protokollierung, nicht Verhaltenskontrolle) und Verhältnismäßigkeit im Einzelfall.
- Der LfDI Baden-Württemberg (40. Tätigkeitsbericht 2024, S. 135) erkennt das berechtigte Interesse ebenfalls als mögliche Rechtsgrundlage an, hebt aber stärker die strafrechtliche Dimension hervor und empfiehlt, Teilnehmende bereits in der Meeting-Einladung zu informieren.
- Die Sächsische Datenschutz- und Transparenzbeauftragte vertritt demgegenüber eine restriktivere Auffassung: In ihrem Tätigkeitsbericht 2022 (S.99) lehnt sie das Abstellen auf Art. 6 Abs. 1 lit. f DSGVO für Aufzeichnungen von Telefongesprächen grundsätzlich ab, da die Erforderlichkeit nicht gegeben sei und das Vertraulichkeitsinteresse der Betroffenen entgegenstehe.
Die Aufsichtsbehörden sind sich also nicht einig. Das BayLDA bietet mit seiner Stellungnahme aus 2025 die aktuellste und für Unternehmen günstigste Orientierung. Sie ist aber kein Freibrief, sondern setzt eine ernsthaft durchgeführte Interessenabwägung voraus.
Lösungsansätze für die Praxis
Wer Transkriptionen möglichst rechtssicher einsetzen möchte, sollte die folgenden Schritte als Mindeststandard betrachten:
- Vorabinformation der Teilnehmenden: Alle Personen, die an einem transkribierten Meeting teilnehmen, müssen vor Beginn über die Tatsache, den Zweck, die Dauer und die Empfänger der Transkription informiert werden, idealerweise bereits in der Kalendereinladung.
- Dokumentierte Interessenabwägung: Wer sich auf Art. 6 Abs. 1 lit. f DSGVO stützt, muss die Abwägung schriftlich dokumentieren. Diese Dokumentation muss im Fall einer Prüfung durch die Aufsichtsbehörde vorgelegt werden können.
- Auftragsverarbeitungsvertrag: Der Tool-Anbieter ist in aller Regel als Auftragsverarbeiter im Sinne von Art. 28 DSGVO einzustufen. Ein entsprechender Vertrag muss vorliegen und ausdrücklich ausschließen, dass der Anbieter die verarbeiteten Daten zu eigenen Zwecken verwendet.
- Eintrag ins Verarbeitungsverzeichnis: Die Transkription ist als eigenständiger Verarbeitungsvorgang in das Verzeichnis der Verarbeitungstätigkeiten nach Art. 30 DSGVO aufzunehmen.
- Angemessene Speicherdauer festlegen: Transkriptionen dürfen nur so lange gespeichert werden, wie es für den Zweck erforderlich ist (Art. 5 Abs. 1 lit. e DSGVO). Nach Wegfall des Zwecks sind die Daten unverzüglich zu löschen.
- Datenschutz-Folgenabschätzung: Beim flächendeckenden Einsatz, bei spezifischen Fallkonstellationen und/oder wenn besondere Datenkategorien berührt sind, ist ggf. eine Datenschutz-Folgenabschätzung nach Art. 35 DSGVO durchzuführen. Jedenfalls ist eine entsprechende Vorprüfung („Schwellwertanalyse“) zu dokumentieren.
- Betriebsrat einbinden: Wo ein Betriebsrat besteht, ist dessen Mitbestimmungsrecht nach § 87 Abs. 1 Nr. 6 BetrVG zu beachten.
- Meetingtyp differenzieren: Nicht jedes Meeting eignet sich für eine Transkription auf Basis berechtigter Interessen. Personalgespräche, Disziplinarverfahren und Gespräche mit besonderem Vertraulichkeitsbezug sollten grundsätzlich nicht transkribiert werden.
KI-gestützte Transkription ist rechtlich kein No-Go, aber auch kein Selbstläufer. Eine „Standard-Installation” ohne rechtliche Vorbereitung kann in einer Vielzahl der Fälle zu vermeidbaren Risiken führen. Wer den Einsatz sorgfältig vorbereitet, transparent kommuniziert und die Grenzen des Einsatzbereichs kennt, kann jedoch von den Effizienzvorteilen profitieren, ohne datenschutzrechtliche oder strafrechtliche Risiken einzugehen. Die jüngsten Stellungnahmen der Aufsichtsbehörden zeigen: Die Diskussion entwickelt sich. Das berechtigte Interesse ist als Rechtsgrundlage für interne Meetings kein theoretisches Konstrukt mehr, sondern eine behördlich (teilweise) anerkannte Option.
Gerne beraten wir Sie zu den konkreten Anforderungen in Ihrem Unternehmen und entwickeln gemeinsam eine Strategie zum Einsatz von Transkription.
Save the Date:
In unserer nächsten Digital Bites Session "KI-basierte Transkription zwischen Datenschutz- und Strafrecht" am 19. Mai 2026 gehen Nikolaus Bertermann (SKW Schwarz) und Dr. Arne Klaas (WTK Legal) mehr auf das Thema ein.
Bei Interesse melden Sie sich gerne hier kostenfrei zum Webinar an.






