In diesem Programmierpraktikum lernen Studierende, wie sie Natural Language Processing (NLP) für Anwendungen einsetzen können, die einen breiten gesellschaftlichen Nutzen haben – insbesondere zum Schutz der Privatsphäre und zur Entwicklung fairer und transparenter Technologien.

Der Schwerpunkt im Sommersemester 2025 liegt auf Text-Anonymisierung und Text-Zusammenfassung. Ziel ist es, personenbezogene Inhalte zu identifizieren, zu entfernen oder zu abstrahieren – auch im Hinblick auf indirekte Identifizierbarkeit durch Kontext. Text-Zusammenfassung wird dabei eingesetzt, um komplexe Inhalte so umzuschreiben, dass sie verständlich und zugänglich bleiben. Dabei werden verschiedene Lernverfahren (z. B. Supervised Learning, Reinforcement Learning) eingesetzt und evaluiert. Zentrale Fragen betreffen die Relevanz von Informationen, die Wahrung der Verständlichkeit sowie die Balance zwischen Datenschutz und Nutzbarkeit.

Alle organisatorischen und inhaltlichen Fragen sind an Dimitri Staufer (staufer@tu-berlin.de) zu richten.