Skip to main content

DEval

Textaufbereitung von Drucksachen des Bundestages

Um die Bedeutung von Evaluierung der Entwicklungsarbeit im politischen Diskurs zu erkennen, wurde ontolux mit dem Auslesen und der Verarbeitung von Textdokumenten des deutschen Bundestages für das Deutsche Evaluierungsinstitut der Entwicklungszusammenarbeit beauftragt.

Herausforderung

Im deutschen Bundestag wird das parlamentarische Geschehen in Form von Protokollen, Beschlüssen, Berichte und Gesetzentwürfe und Drucksachen aus Plenar- und Gremiensitzungen festgehalten, dokumentiert und zur Verfügung gestellt. Das Deutsche Evaluierungsinstitut (DEval) will sich die Daten zunutze machen, um diese mit eigenen Tools analysieren und weiterverarbeiten zu können. ontolux wurde damit beauftragt, die Daten zu erfassen und entsprechend aufzubereiten.

 

Lösung

Auf Basis der API vom Dokumentations- und Informationssystem für Parlamentsmaterialien (DIP) des Bundestages wurden zahlreiche Dokumente des Bundestags aus den Jahren 2002-2022 mit Hilfe von Web Scraping auslesen. Basierend auf einer Auswahl an Begriffen,
die DEval ontolux zur Verfügung stellte, wurden die Textdaten aufbereitet. Dazu wurden die Texte zunächst in Absätze aufgespalten und anschließend regelbasiert klassifiziert. Python wurde als Technologie eingesetzt.

 

Ergebnis

Die aufbereiteten Daten geben DEval einen schnellen Überblick, wie und in welchem Umfang in den letzten Jahren beispielsweise die Themen Evaluation und Entwicklungszusammenarbeit im politischen Diskurs behandelt wurden. Aus der Analyse der Trends kann das DEval ableiten, wie sich die Relevanz der Themen im parlamentarischen Kontext verändert. Die Erkenntnisse kann das DEval verwenden, um die Nützlichkeit der Evaluierungen für die politischen EntscheidungsträgerInnen zu erhöhen.

 

Unser Kunde

Das Deutsche Evaluierungsinstitut (DEval) evaluiert die deutsche Entwicklungszusammenarbeit. Es gibt den staatlichen und nicht-staatlichen Organisationen der Entwicklungszusammenarbeit unabhängige und wissenschaftsbasierte Evidenz an die Hand, um ihre Strategien, Instrumente und Programme zu optimieren. Für die Wahrnehmung dieser Aufgaben ist das Institut vom Bundesministerium für wirtschaftliche Zusammenarbeit und Entwicklung mandatiert.

Kunde seit 2022

Deutsches Evaluierungsinsititut der Entwicklungsarbeit

 

Projekt

Logikbasierte Textklassifizierung

 

Leistung

  • Web-Scraping
  • Strukturierung
  • Klassifizierung

 

Technologien

  • Python

Sprechen Sie uns an

Jan-Tilman Seipp

Senior Consultant Machine Learning