Berliner Charité

CIO Martin Peuker hebt den Datenschatz

21.08.2020
Von 
Wolfgang Herrmann ist IT-Fachjournalist und Editorial Lead des Wettbewerbs "CIO des Jahres". Der langjährige Editorial Manager des CIO-Magazins war unter anderem Deputy Editorial Director der IDG-Publikationen COMPUTERWOCHE und CIO sowie Chefredakteur der Schwesterpublikation TecChannel.

Geholfen hat beispielsweise die Medizininformatik-Initiative, die vom Bundesministerium für Bildung und Forschung (BMBF) mit 150 Millionen Euro gefördert wird. Sie verfolgt das Ziel, Daten aus der Krankenversorgung und der Forschung mit Hilfe von IT-Lösungen zu vernetzen, um die medizinische Forschung und die Patientenversorgung zu verbessern. An fast allen deutschen Universitäten wurden dazu Datenintegrationszentren eingerichtet. Auch die Charité betreibt ein solches Zentrum, das Peuker als Teil der Health Data Platform sieht. Nicht die Rohdaten an sich, sondern Ergebnisse in Form von Kerndatensätzen würden zwischen den Hochschulen ausgetauscht, erläutert er.

Datenanalyse gegen Covid-19

Ein aktuelles Anwendungsbeispiel kommt aus dem Infektionsschutz. Die Forscher verwenden beispielsweise erhobene Daten, um die Ausbreitung multiresistenter Keime frühzeitig zu erkennen und schneller reagieren zu können. Das Hygiene-Institut der Charité habe dabei eine Vorreiterrolle, betont Peuker. Im Januar 2020 wurde die Medizininformatik-Initiative um virologische Daten bezüglich Covid-19 erweitert.

"Die Health Data Platform ist kein Produkt, dass man kaufen kann", beschreibt der CIO die technischen Grundlagen. Konzeptionell besteht sie aus mehreren Ebenen. Ganz oben liegt ein "prozessualer Layer", in den Schichten darunter arbeiten drei zentrale Systeme: ein Data Lake, ein Plain Data Repository zur Zusammenführung aller Daten im Behandlungskontext sowie ein Scientific Data Repository für Forschungsdaten.

Die Charité-IT nutzt dabei unter anderem Hadoop-Techniken und In-Memory-Datenbanken von SAP. Wie komplex die Handhabung der Daten ist, veranschaulicht der IT-Chef an einem Beispiel: "Während ein PKW in der Regel mit 25.000 bis 30.000 Teilen auskommt, kennt die Medizin heute um die 800.000 unterschiedliche Datentypen." Dabei seien Daten aus dem Bereich "Genomics" noch nicht berücksichtigt.

Hybride IT bringt Vorteile

Aus Sicht des Data Managements unterscheidet Peukers Team zwischen einer klinischen und einer wissenschaftlichen Domäne. Im klinischen Bereich liegen in erster Linie Patientendaten, die Ärzte und Pflegekräfte zur Behandlung benötigen. In der Wissenschaftsdomäne geht es insbesondere um forschungsrelevante Daten, die nicht Teil der routinemäßigen Krankenversorgung sind.