Zum Inhalt springen

DEval

Textaufbereitung von Drucksachen des Bundestages

Um die Bedeutung von Evaluierung der Entwicklungsarbeit im politischen Diskurs zu
erkennen, wurde ontolux mit dem Auslesen und der Verarbeitung von Textdokumenten des deutschen Bundestages für das Deutsche Evaluierungsinstitut
der Entwicklungszusammenarbeit beauftragt.

Herausforderung

Im deutschen Bundestag wird das parlamentarische Geschehen in Form von Protokollen,
Beschlüssen, Berichte und Gesetzentwürfe und Drucksachen aus Plenar- und
Gremiensitzungen festgehalten, dokumentiert und zur Verfügung gestellt. Das Deutsche
Evaluierungsinstitut (DEval) will sich die Daten zunutze machen, um diese mit eigenen Tools
analysieren und weiterverarbeiten zu können. ontolux wurde damit beauftragt, die Daten zu
erfassen und entsprechend aufzubereiten.

Lösung

Auf Basis der API vom Dokumentations- und Informationssystem für Parlamentsmaterialien
(DIP) des Bundestages wurden zahlreiche Dokumente des Bundestags aus den Jahren
2002-2022 mit Hilfe von Web Scraping auslesen. Basierend auf einer Auswahl an Begriffen,
die DEval ontolux zur Verfügung stellte, wurden die Textdaten aufbereitet. Dazu wurden die
Texte zunächst in Absätze aufgespalten und anschließend regelbasiert klassifiziert. Python
wurde als Technologie eingesetzt.

Ergebnis

Die aufbereiteten Daten geben DEval einen schnellen Überblick, wie und in welchem
Umfang in den letzten Jahren beispielsweise die Themen Evaluation und Entwicklungszusammenarbeit im politischen Diskurs behandelt wurden. Aus der Analyse der
Trends kann das DEval ableiten, wie sich die Relevanz der Themen im parlamentarischen
Kontext verändert. Die Erkenntnisse kann das DEval verwenden, um die Nützlichkeit der
Evaluierungen für die politischen EntscheidungsträgerInnen zu erhöhen.

Unser Kunde

Das Deutsche Evaluierungsinstitut (DEval) evaluiert die deutsche Entwicklungszusammenarbeit. Es gibt den staatlichen und nicht-staatlichen Organisationen der Entwicklungszusammenarbeit unabhängige und wissenschaftsbasierte Evidenz an die Hand, um ihre Strategien, Instrumente und Programme zu optimieren. Für die Wahrnehmung dieser Aufgaben ist das Institut vom Bundesministerium für wirtschaftliche Zusammenarbeit und Entwicklung mandatiert.
DEval_Logo

Kunde seit 2022

Deutsches Evaluierungsinsititut der Entwicklungsarbeit

Projekt

Logikbasierte Textklassifizierung

Leistung

  • Web-Scraping
  • Strukturierung
  • Klassifizierung

Technologien

  • Python
Jan_ontolux
Kontakt

Jan-Tilman Seipp

Robert-Koch-Platz 4
10115 Berlin