Finance meets Artificial Intelligence

Privacy-preserving natural language

Wie können Millionen von Daten automatisiert gebündelt und zum Training von Algorithmen aufbereitet werden und gleichzeitig die sensiblen Inhalte geschützt und die Privatsphäre der Betroffenen gewahrt bleiben? 
Dieser Aufgaben möchten wir uns mit dem Thema KI-basierte Textverarbeitung unter Wahrung der Privatsphäre und des Datenschutz (Privacy-preserving Natural Language Processing) stellen, denn ein großer Teil von Nutzerdaten stammen aus natürlicher Sprache, wie beispielsweise von Such- und Chatbot-Anfragen, Call Centern, Gesprächsnotizen, (automatische) Verschriftungen von Telefonaten, Sprachassistenten, sowie text-basierten Informationen wie Emails, Dokumente und Webseiten, um nur einige zu nennen. Es ist daher essentiell wichtig, NLP-Datensätze zu kuratieren, die die Privatsphäre der Nutzer bewahren und Machine Learning Modelle zu trainieren, die ausschließlich nicht-identifizierende Nutzerdaten speichern.

Die wichtigsten Methoden und Herausforderungen sind hierbei:

1. Die Erkennung persönlicher Informationen, d.h. wie können diejenigen Wörter oder Phrasen in Texten automatisch gefunden werden, die persönliche Nutzerinformationen enthalten,

2. Die datenschutzerhaltende Textanalyse, d.h. wie können Differential Privacy Methoden und homomorphe Verschlüsselungsverfahren in die automatische Textanalyse integriert werden

3.  Datenschutz-verbessernde Technologien, d.h. wie können Datenschutz und Privatsphäre in aktuelle KI-Methoden integriert und verbessert werden.

 

Leitung: Prof. Dr.-Ing. Tanja Schultz

Ansprechpartner: Lily Meister