SZ-Datenrecherche:Das steckt in den Bundestagsprotokollen

Plenarsaal des Deutsche Bundestags - die Süddeutsche Zeitung hat die Plenarprotokolle analysiert und ausgewertet.
(Foto: dpa; Bearbeitung SZ)

Nach jeder Sitzung werden seitenlange Mitschriften der Plenardebatten ins Internet gestellt - die Basis für die SZ-Datenrecherche.

Von Katharina Brunner und Martina Schories

Wenn die Abgeordneten im Bundestag diskutieren, wird jedes gesprochene Wort akribisch dokumentiert. Stenografen sitzen in jeder Plenardebatte und schreiben mit, was um sie herum passiert: Wer was sagt, wer klatscht, wer dazwischenruft, wer lacht, wer einer Aussage widerspricht und wie.

Die AfD im Bundestag

Dieser Text ist Teil einer großen Datenrecherche zum ersten halben Jahr der AfD im Bundestag. Lesen Sie hier die digitale Reportage mit den zentralen Ergebnissen und hier alle Texte zum Thema.

Das Rohmaterial der Recherche

Diese Aufzeichnungen landen in seitenlangen Dokumenten (hier zum Beispiel das Protokoll der ersten Sitzung nach der Bundestagswahl im Oktober), die kurz nach der Debatte im Internet veröffentlicht werden. Für die Süddeutsche Zeitung waren sie der Ausgangspunkt der Recherche, um das Auftreten der AfD im Bundestag und den Umgang mit ihr zu analysieren.

Was in den Protokollen steht

Die Stenografen schreiben nicht nur das Gesagte am Rednerpult mit, sondern versuchen alle Wortmeldungen, sonstige Äußerungen und Interaktionen im Plenarsaal zu erfassen. Dazu gehören auch Applaus, Lachen oder Zwischenrufe. Die Reaktionen auf das Gesagte, die Sprecher oder die jeweiligen Tagesordnungspunkte können als die Metadaten einer Rede verstanden werden, also Informationen, die diese Rede einordnen.

Um die automatisierte Auswertung zu vereinfachen, stellt der Bundestag die Protokolle auch im XML-Dateiformat zur Verfügung. XML steht für Extensible Markup Language und bezeichnet Texte, die eine Grundstruktur haben. Deshalb ist es leichter, aus ihnen gezielt Informationen zu ziehen. Die XML-Datei der 22. Sitzung am 21. März, in der Angela Merkel zum dritten Mal zur Kanzlerin gewählt wurde, fängt so an:

Durch Auszeichnungen wie beispielsweise <nachname>Merkel</nachname> oder <rolle_kurz>Bundeskanzlerin</rolle_kurz> können wir maschinell alle für die Auswertung relevanten Informationen extrahieren. Das Ergebnis ist eine große Tabelle, in die alle von uns abgefragten Textstellen kopiert werden.

Wie aus Textmustern eine Tabelle wird

Der aufwändigste Schritt kommt jetzt, weil in der Tabelle automatisiert Textmuster erkannt werden müssen. Zum Beispiel: Wann wird ein Beifall der SPD zugerechnet und wann der CDU/CSU? Wer ist die Zwischenruferin? Was hat sie gesagt? Und zu wem an welcher Stelle? Dazu stellen wir Regeln auf, die mit Hilfe von regulären Ausdrücken auf die Plenarprotokolle angewendet werden. Durch viele solcher Regeln, die ineinandergreifen, entsteht eine Tabelle aus 24 396 Zeilen. Sie ist die Ausgangsbasis für unsere Analysen.

In der Tabelle sind insgesamt mehr als 1500 Sprecher im Parlament aufgeführt. Das schließt nicht nur die offiziellen Redner der Fraktionen ein, sondern auch die Abgeordneten, die eine Zwischenfrage stellen. Nur so können Beifall und andere Reaktionen richtig zugeordnet werden. Ein Beispiel: Ein Politiker der Grünen stellt einer AfD-Politikern während ihrer Rede eine Zwischenfrage. Beklatscht die SPD dann diese Frage, gilt der Applaus nicht der AfD, sondern geht auf das Konto der Grünen. Solche Ausnahmen müssen erst identifiziert und dann in den Regelkatalog aufgenommen werden, um den Bezug richtig herzustellen.

Im Falle der Regierungserklärung bedeutet das: Angela Merkel bekam 117 Mal Beifall, davon 55 Mal von der Union und 49 Mal von der SPD. Die Stenografen bekamen außerdem einmal allgemeine Heiterkeit, zweimal Lachen und 22 Zurufe mit. In der Tabelle sieht der Beginn der Rede so aus:

Ausgehend von dieser Tabelle können wir Schlussfolgerungen ziehen. Denn es lassen sich Muster erkennen, in welchen Kombinationen Fraktionen füreinander klatschen - oder wie die AfD den Bundestag spaltet.

Die Daten herunterladen

Die von uns extrahierten Daten für den 19. Bundestag können Sie auf Github einsehen und als Tabelle herunterladen.

Zur SZ-Startseite

Lesen Sie mehr zum Thema

Jetzt entdecken

Gutscheine: