Datendemokratisierung – Datenschutz in Streaming- Architekturen

data-democratization-privacy-streaming-architecture_2000x1300.jpg

Unternehmen erleben heute auf der einen Seite einen wachsenden Bedarf nach Daten-Streaming, müssen jedoch auf der anderen Seite neue Datenschutzbestimmungen befolgen. Dieses Dilemma stellt Unternehmen vor die Herausforderung, nach intelligenten Data-Management-Verfahren zu suchen, die ihnen die Erfüllung beider Ziele erlauben. Deswegen stehen viele Branchen unter Druck, einen hohen Nutzwert von Daten zu erhalten, während zugleich Datensicherheit und Datenschutz zu jedem Zeitpunkt gewährleistet sind. Die vielversprechenden Verfahren, nach denen sie suchen, sind sogenannte Datenschutzkonzepte. Dieser Blog-Beitrag konzentriert sich auf diese Konzepte und erklärt, wie sich Datenschutz und der Ansatz der Datendemokratisierung kombinieren lassen.

Von isolierten Daten zur Daten-Demokratisierung

Daten-Demokratisierung ist ein Prozess bzw. eine Reihe aus Initiativen, die darauf abzielen, den Zugriff auf Daten zu erleichtern, während die ordnungsgemässe Governance gewahrt bleibt. Ziel ist es, die Beschäftigten eines Unternehmens in die Lage zu versetzen, Daten von Interesse zu finden und zu nutzen. Diese Absicht stellt einen erheblichen Entwicklungsschritt dar und birgt für Unternehmen ungemeines Potenzial. Beispielsweise können sie ihren Kundenservice und Support verbessern, weil ihre Service-Teams einfacher auf Kundendaten zugreifen können. Auch lässt sich dank besserer Einblicke in die Daten, die es den Unternehmen erlauben, das Beste aus ihren betrieblichen Prozessen herauszuholen, die Leistung von Prozessen, Maschinen und Teams evaluieren und optimieren.

Sobald ein Unternehmen bereit ist, seine Daten zu demokratisieren, die Reaktionszeiten des Unternehmens zu verkürzen und den Schritt von der einfachen, sicheren Speicherung zum Streaming in Echtzeit zu gehen, werden datenschutzwahrende Daten-Pipelines obligatorisch. Wenn ein Unternehmen föderale Data-Streaming-Architekturen nutzt (z. B. in hybriden oder Multi-Cloud-Deployments) oder auch nur über eine grosse Menge an unterschiedlichen Datenquellen verfügt, bildet eine solide, skalierbare Data-Streaming-Lösung das Fundament für ein gut funktionierendes, effektives Datenmanagement.

Die Relevanz einer eigenen Data-Streaming-Strategie aus Datenschutz und Datendemokratisierung

Ob im Finanzwesen, im Gesundheitswesen, in der Fertigung oder jeder anderen Branche – Unternehmen sollten niemals gedankenlos sensible Daten teilen. Leider lässt diese Angst vor der gemeinsamen Datennutzung Unternehmen in vielen Fällen vor leistungsstarken Analysetools zurückschrecken, wie sie beispielsweise Public-Cloud-Anbieter (PC) oder die eigenen Portfolios der Unternehmen anbieten. Dies muss jedoch nicht sein – im Gegenteil! Die Herausforderung lautet, eine eigene Daten-Streaming-Strategie einzurichten. Diese Strategie muss sich für einen effizienten Datenfluss auf Data-Streaming-Architekturen konzentrieren, jedoch zugleich die richtige Umgebung und die richtigen Strukturen für einen sicheren, geschützten Datentransfer schaffen.

Datenschutzkonzepte für die sichere UND demokratische Datennutzung

Zahlreiche Verfahren können Unternehmen dabei helfen, ihre Daten sicher zu verwahren, während gleichzeitig die Nutzung der Daten gefördert wird. Schauen wir uns diese im Detail an:

  • Daten definieren, die geschützt werden müssen: Für Unternehmen ist es entscheidend, solche Daten herauszufiltern und auszuschliessen, die vor einer weiteren Verarbeitung geschützt werden sollen. Dies ist in erster Linie der Fall bei sensiblen Kundendaten sowie Unternehmenszahlen und -dateien. In diesen Fällen bleiben die sensiblen Daten isoliert und werden nicht Teil des Data-Streamings.

  • Daten anonymisieren und entkoppeln: Durch sogenannte Anonymisierungs- und Pertubationsmethoden können Unternehmen sensible Daten entkoppeln, während sich die weiteren Analysen auf nicht mehr identifizierbare Daten stützen. Beliebte Lösungen nutzen hierzu differenzielle Datenschutzalgorithmen. Dies ist der einzige Weg, die vollständige Kontrolle über den Datenschutz zu behalten, während gleichzeitig Public-Cloud-Analysen (PC) genutzt werden.

  • Bring Your Own Key (BYOK) oder Hold Your Own Key (HYOK) – je nach Strenge der Datenschutz-Anforderungen: Die Verschlüsselung von Daten vor dem Absenden in die Cloud mit nachfolgender Entschlüsselung, sobald sie sich wieder auf dem Firmengelände befinden, sind eine Möglichkeit, um einen sicheren Datenzugriff zu gewährleisten. Dieser Ansatz erleichtert den Wechsel in die Public Cloud, jedoch im Falle von HYOK nur für Speicherzwecke. HYOK-Verschlüsselung verhindert effektiv die Nutzung von PC-Analysen.

  • Implementierung von End-to-End-Verschlüsselung: Dieses Konzept bietet die feinkörnigsten Datenschutzfunktionen. Je nachdem, wie die Verschlüsselungen verwaltet werden, können Sie verhindern, dass Daten ausgelesen werden oder Datenerhebung für Ihr Unternehmen erleichtern. Gleichzeitig erlaubt dieses Verfahren die Möglichkeit, sensible Daten zu streamen und erfüllt das Recht auf Vergessenswerden der DSGVO.

  • Nutzung von Edge-Computing als Spezialfall der Vorverarbeitung und Filterung von Daten: Anstatt sämtliche Daten für PC-Analysen in die Cloud zu bewegen (z. B. mithilfe von BYOK) erlaubt dieser Ansatz, dass vereinfachte Analysen näher am Ort der Generierung der Daten stattfinden. Edge-Computing kann ebenso in der Fertigung angewendet werden wie in medizinischen Telemetriesystemen (Patienten-Sensoren), um Daten zu maskieren oder einfache Analysen zu implementieren.

Wir haben gesehen, dass zahlreiche Konzepte zur Auswahl stehen und der tatsächliche Ansatz kann sich abgesehen von den Datenschutzbestimmungen auch auf viele weitere Aspekte der Datenstrategie eines Unternehmens beziehen. Kein Standard passt zu allen Szenarien, doch gemeinsam mit einem Experten wie Mimacom können Unternehmen ihr individuelles optimales Verfahren definieren.

Das Potenzial von sicherem Data-Streaming

Gleichwohl haben Data-Stream-Systeme wesentlich mehr zu bieten als nur die Integration und Echtzeit-Bewegung von Daten und gehen weit über eine blosse Verknüpfungsfunktion hinaus. Mit ihren enthaltenen Echtzeit-Analysen per maschinellem Lernen erneuern die Stream-Verarbeitung und Stream Analytics die Art und Weise, wie Rohdaten umgewandelt und genutzt werden. Stream-Verarbeitungsfunktionen von Datenplattformen reduzieren Verzögerungen und bereiten den Weg für praxisrelevante Erkenntnisse in Echtzeit. Deswegen ist es unerlässlich, ganzes Potenzial dieser Daten auszuschöpfen und ihre Sicherheit zu gewährleisten, indem Sie datenschutzwahrende Lösungen etablieren.

So demokratisieren Sie Daten in einer sicheren Infrastruktur

Robuste, skalierbare datenschutzwahrende Stream-Systeme sind in der Entwicklung eine Herausforderung, und die richtige Balance zwischen Nutzwert und Datenschutz zu finden ist ebenfalls eine Herausforderung. Zum Glück wird dieser Bereich derzeit aktiv erforscht und wir sehen immer mehr Ideen und Tools. Dennoch ist es zu Beginn eines Demokratisierungsprogramms gut, einige grundlegenden Regeln zu befolgen:

  • Klein anfangen: Wählen Sie zunächst einen einzelnen Geschäftsbereich aus, vielleicht sogar nur einen Teil davon. Wählen Sie eine Untergruppe an Datenschutzbestimmungen aus, die die Daten erfüllen müssen. Entscheiden Sie, welche Art von End-to-End-Datenschutzstrategie die geeignetste für Sie ist. Entwickeln Sie PoC-Lösungen und sorgen Sie dafür, dass diese erweiterbar bleiben, hinterfragen Sie sie innerhalb der Community Ihres Unternehmens.

  • Begreifen Sie Datenschutz als Teil eines Data-Governance-Programms: Datenschutz ist äusserst wichtig, er ist jedoch zugleich nur Teil eines wesentlich umfangreicheren Data-Governance-Programms. Definieren Sie Ziele und eine Vision für Ihre Datenplattform, um die besten Datenschutz- und Managementmethoden zu nutzen.

  • Treten Sie mit einer breiteren Community in Kontakt: Der Umstieg von zentralen Silos auf föderale Datenplattformen kann potenziell zu unabhängigen, unverbundenen Insellösungen führen. Um dies zu vermeiden und das ganze Potenzial der Daten zu erhalten, sollte die Data Governance gemeinsam mit allen Beteiligten konzipiert werden. Daher ist es günstig, einen domänenübergreifenden Verband rund um Ihre Datenplattform aufzubauen.

  • Wählen Sie die richtigen End-to-End-Datenschutzmethoden: Sehr wahrscheinlich wird es nicht nur eine Datenschutzmethode geben. Es ist sehr wichtig dafür zu sorgen, dass bei der Anwendung von Methoden auf eine gegebene Streaming-Pipeline flexibel agiert werden kann. Zu den verfügbaren Methoden gehören kryptographische End-to-End-Verschlüsselungsmethoden auf Nachrichten- oder Feldebene. Diese Methode ist nützlich für die Datenmigration und Bridge-to-Cloud-Szenarien und erlaubt dennoch Stream-Analysen, wenn auch um den Preis einer höheren Ressourcenauslastung. Andere Methoden nutzen Verfahren zur Aufhebung der Identifizierbarkeit wie Tokenisierung, Pertubation oder Maskierung.

  • Minimieren Sie die Datenerhebung: Reduzieren Sie die Menge an potenziell sensiblen Daten, die Sie speichern und die durch Ihre Streaming- Pipelines fliessen. Im Falle der Fertigung oder im Gesundheitswesen sollten Unternehmen den Einsatz von Smart Devices in Betracht ziehen, die noch vor dem Absenden von Daten – beispielsweise an eine Public Cloud zur detaillierten Analyse – ein (Edge-)Verfahren der Vorverarbeitung anwenden.

Innerhalb eines Unternehmens ermöglichen datenschutzwahrende Datenströme die Verknüpfung von Daten aus verschiedenen Abteilungen. Eine solche intelligente Datenaggregation kann entscheidend sein, um robustere und zuverlässigere Modelle zu erzeugen oder zu trainieren, die dann für weitere Aufgaben genutzt werden können: beispielsweise für die Betrugserkennung oder Risikobewertung von Finanzinstituten oder die gemeinsame Nutzung und Aggregierung von Patientendaten in IoT-basierten Gesundheitssystemen.

Fazit: Datendemokratisierung vs. Datenschutz

Die Demokratisierung von Daten ist ein Konzept, das eine genauere Betrachtung verdient. Sie erlaubt es Unternehmen, das Potenzial ihrer Daten besser zu managen und kann sich positiv auf die Entwicklung neuer Produkte, das Tempo der Produktbereitstellung und die Rentabilität auswirken. Als Folge werden Streaming-Architekturen immer populärer, um den Nutzwert von Daten zu maximieren. Jedoch können strenge staatliche und brancheneigene Datenschutzbestimmungen, mit denen das Risiko von Datenlecks reduziert und Folgen eines möglichen Datenmissbrauchs vereitelt werden sollen, diesen Prozess erschweren. Um als datengetriebene Organisationen erfolgreich zu bleiben, müssen Unternehmen die durch solche Bestimmungen entstehenden Herausforderungen überwinden und datenschutzwahrende Methoden in ihren Data-Streaming-Architekturen einsetzen. Wir bei Mimacom freuen uns, Sie bei diesen anspruchsvollen Prozessen der Einführung und Erweiterung Ihrer Streaming-Data-Plattform, der Reduzierung von Datenschutzrisiken und der Erfüllung Ihrer Compliance-Anforderungen unterstützen zu dürfen.

Head of Data Engineering

Pawel Wasowicz

Pawel lebt in Bern und ist unser Head of Data Engineering. Er hilft unseren Kunden, durch optimale Nutzung der neuesten Trends, bewährter Technologien und seiner jahrelangen Erfahrung auf diesem Gebiet das meiste aus Ihren Daten zu machen.