DEval
Textaufbereitung von Drucksachen des Bundestages
Um die Bedeutung von Evaluierung der Entwicklungsarbeit im politischen Diskurs zu
erkennen, wurde ontolux mit dem Auslesen und der Verarbeitung von Textdokumenten des deutschen Bundestages für das Deutsche Evaluierungsinstitut
der Entwicklungszusammenarbeit beauftragt.
Herausforderung
Im deutschen Bundestag wird das parlamentarische Geschehen in Form von Protokollen,
Beschlüssen, Berichte und Gesetzentwürfe und Drucksachen aus Plenar- und
Gremiensitzungen festgehalten, dokumentiert und zur Verfügung gestellt. Das Deutsche
Evaluierungsinstitut (DEval) will sich die Daten zunutze machen, um diese mit eigenen Tools
analysieren und weiterverarbeiten zu können. ontolux wurde damit beauftragt, die Daten zu
erfassen und entsprechend aufzubereiten.
Lösung
Auf Basis der API vom Dokumentations- und Informationssystem für Parlamentsmaterialien
(DIP) des Bundestages wurden zahlreiche Dokumente des Bundestags aus den Jahren
2002-2022 mit Hilfe von Web Scraping auslesen. Basierend auf einer Auswahl an Begriffen,
die DEval ontolux zur Verfügung stellte, wurden die Textdaten aufbereitet. Dazu wurden die
Texte zunächst in Absätze aufgespalten und anschließend regelbasiert klassifiziert. Python
wurde als Technologie eingesetzt.
Ergebnis
Die aufbereiteten Daten geben DEval einen schnellen Überblick, wie und in welchem
Umfang in den letzten Jahren beispielsweise die Themen Evaluation und Entwicklungszusammenarbeit im politischen Diskurs behandelt wurden. Aus der Analyse der
Trends kann das DEval ableiten, wie sich die Relevanz der Themen im parlamentarischen
Kontext verändert. Die Erkenntnisse kann das DEval verwenden, um die Nützlichkeit der
Evaluierungen für die politischen EntscheidungsträgerInnen zu erhöhen.
Unser Kunde

Kunde seit 2022
Deutsches Evaluierungsinsititut der Entwicklungsarbeit
Projekt
Logikbasierte Textklassifizierung
Leistung
- Web-Scraping
- Strukturierung
- Klassifizierung
Technologien
- Python
