Medizin
Summer School: Daten verstehen, Krankheiten bekämpfen
Brandenburg an der Havel, 16. September 2024
Studierende haben bei der diesjährigen Summer School einen praxisnahen Einblick in die Analyse medizinischer Daten mit den Programmiersprachen Python und R erhalten. Die Summer School unter dem Titel "Medical Data Analysis for Young Scientists" wurde von MHB-Medizininformatiker Dennis Wagner in Zusammenarbeit mit Prof. Dr. med. Thomas Schrader, Pathologe und Professor für Medizininformatik an der Technischen Hochschule Brandenburg, organisiert. Prof. Schrader führte vom 9. bis 13. September auch als Dozent durch die Woche.
Inhaltlich war die Veranstaltung in fünf spannende Tage unterteilt, die den Teilnehmenden die verschiedenen Aspekte der medizinischen Datenanalyse näherbrachten:
Tag 1: Einführung in die medizinische Datenanalyse
Nach der Begrüßung und Vorstellung der Inhalte, starteten die Teilnehmenden mit den Grundlagen der Programmiersprachen Python und R. In Live-Coding-Sessions lernten sie, wie sie Daten für die Analyse laden und erste einfache Skripte zur Datenverarbeitung und -analyse schreiben. Dieser Tag legte den Grundstein für die weitere Woche und machte deutlich, wie wichtig ein systematischer Umgang mit Daten ist.
Tag 2: Explorative Datenanalyse
Am zweiten Tag lag der Schwerpunkt auf der explorativen Datenanalyse (EDA). Mithilfe von Visualisierungen und deskriptiven Statistiken lernten die Studierenden, Daten zu untersuchen, Muster zu erkennen und Hypothesen zu überprüfen. In praktischen Übungen erstellten sie erste statistische Plots und analysierten Trends sowie Verteilungen ihrer Daten.
Tag 3: Datenqualität und Bereinigung
Der dritte Tag widmete sich der Analyse der Datenqualität. Prof. Schrader erklärte, wie man Outlier und fehlende Werte erkennt sowie Techniken zur Datenbereinigung anwendet. In Hands-on-Sessions übten die Teilnehmenden, medizinische Datensätze zu säubern und auf eine aussagekräftige Analyse vorzubereiten.
Tag 4: Korrelationen und Regressionsanalyse
Die Analyse von Korrelationen und die Regressionsanalyse standen am vierten Tag im Mittelpunkt. Die Studierenden lernten, Zusammenhänge zwischen Variablen zu untersuchen und mittels Regressionsmodellen Prognosen zu erstellen. Prof. Schrader zeigte, wie man mit Python und R diese Techniken anwendet und interpretierbare Ergebnisse erzielt.
Tag 5: Die medizinische Datenanalyse-Pipeline
Am letzten Tag ging es darum, das Gelernte in eine zusammenhängende Verarbeitungsstrecke zu integrieren. Die Teilnehmenden arbeiteten an realen medizinischen Daten und entwickelten eine vollständige Pipeline zur Datenanalyse.
„Die Summer School 'Medical Data Analysis for Young Scientists' war ein voller Erfolg. Die Studierenden haben nicht nur theoretisches Wissen erworben, sondern auch praktische Erfahrungen in der Analyse realer medizinischer Daten gesammelt. Durch den Einsatz von Python und R sind sie nun bestens gerüstet, um eigene Forschungsfragen zu beantworten“, fasst Dennis Wagner zusammen.