Fusion von spektroskopischen und spektrometrischen Daten mit maschinellen Lernverfahren
20. Juni 2025, von Prof. Stephan Seifert

Foto: Seifert
Es existieren verschiedene Methoden zur Erzeugung analytischer Fingerabdrücke, die zur Klassifizierung und Charakterisierung von biologischen Proben, z.B. hinsichtlich ihrer Herkunft oder biologischen Identität, verwendet werden können. Diese Methoden basieren häufig entweder auf Kernspinresonanz-, Fourier-Transformations-Nahinfrarotspektroskopie oder Massenspektrometrie, z.B. Flüssigchromatographie mit Massenspektrometrie-Kopplung oder Massenspektrometrie mit induktiv gekoppeltem Plasma. Die Daten, die mit jeder dieser Methoden gewonnen werden, repräsentieren jedoch nur einen Teil der komplexen Zusammensetzung der Proben, so dass auch die chemometrischen Modelle, die zur Klassifizierung der biologischen Proben aus den jeweiligen Datensätzen erstellt werden, nur auf einem sehr begrenzten Teil der vorhandenen Unterschieden beruhen.
Um robustere und leistungsfähigere Klassifikationsmodelle zu erhalten, werden in diesem von der DFG geförderten Projekt in den nächsten 3 Jahren verschiedene Datenfusionsansätze entwickeln und vergleichen, die komplementäre Informationen aus den verschiedenen Techniken kombinieren. Ein wesentlicher Bestandteil ist dabei die umfassende Charakterisierung der Klassenunterschiede durch die Anwendung von Multiblock-Methoden und neuartigen Verfahren des maschinellen Lernens. Als Modelldatensätze werden wir einerseits Datensätze mit spezifischen Eigenschaften simulieren und andererseits bereits vorliegende Datensätze verschiedener Lebensmittel wie Spargel oder Walnüsse verwenden. Dieses Projekt, das im Arbeitskreis von Prof. Seifert an der Hamburg School of Food Science durchgeführt wird, wird daher nicht nur entscheidende methodische Erkenntnisse über die Kombination molekularer und elementarer Fingerabdrücke liefern, sondern auch einen wichtigen Schritt zur Verbesserung der Lebensmittelauthentifizierung – und damit zur Aufdeckung von Lebensmittelbetrug – darstellen.