Anwendung maschineller Lernverfahren zur Analyse komplexer schwingungsspektroskopischer Daten
3. November 2022, von Stephan Seifert

Foto: UHH / FB-Chemie
Bei der oberflächenverstärkten Raman-Streuung (engl. surface-enhanced Raman scattering, SERS) werden Ramansignale, welche auf der inelastischen Streuung von Licht an Molekülen basieren, von Metallnanopartikeln um mehrere Größenordnungen verstärkt. Durch SERS Experimente können somit lokale Informationen aus der Umgebung der Nanopartikel erhalten werden, was z.B. für die Untersuchung biologischer Prozesse in lebenden Zellen sehr nützlich ist. Aufgrund der variierenden Interaktionen zwischen Molekülen und Nanopartikeln entstehen dabei jedoch hochkomplexe Daten, die eine anspruchsvolle Auswertung verlangen. Dies ist besonders dann der Fall, wenn Proben untersucht werden, die aus unterschiedlichen molekularen Spezies bestehen und durch verschiedene Bedingungen, wie z.B. den pH-Wert beeinflusst werden. Um die Daten nutzbar zu machen und für die Charakterisierung der Zusammensetzung und Struktur von biologischen Proben einzusetzen, ist es deshalb notwendig, leistungsfähige Auswertungsverfahren zu entwickeln.
In einem von der DFG geförderten Projekt von Prof. Dr. Stephan Seifert (Hamburg School of Food Science) und Prof. Dr. Janina Kneipp (Humboldt-Universität zu Berlin) werden in den nächsten 3 Jahren Random Forest basierte Methoden für die Analyse von SERS Daten aus Modellversuchen konzeptuell erprobt und angepasst. Zusätzlich zu den experimentellen Daten werden im Laufe des Projekts auch Daten simuliert, um die Auswirkungen bestimmter Umgebungsbedingungen gezielt einzubeziehen und die Ergebnisse iterativ mit denen der Experimente zu vergleichen.