Ungeachtet aller Fortschritte bei der Entwicklung neuer Therapiemethoden zählt Krebs nach wie vor zu den gravierendsten Gesundheitsgefährdungen und häufigsten Todesursachen weltweit. Für eine optimale Behandlung der Patientinnen und Patienten ist eine möglichst frühzeitige und exakte histopathologische Diagnostik der Tumoren und ihrer jeweiligen Subtypen von höchster Relevanz. Hierfür stehen in der klinischen Routine zwar einige diagnostische Werkzeuge zur Verfügung, es bleibt in einigen Fällen jedoch ein erhebliches Maß an Unsicherheit.
Das DIAMANT Projekt konzentriert sich auf Lungenkrebs, weltweit die häufigste Krebsart bei Männern und die zweithäufigste bei Frauen. Die wichtigsten Subtypen sind das Adenokarzinom (ADC) und das Plattenepithelkarzinom (SqCC), die zusammen ~70% aller Lungenkrebsdiagnosen ausmachen. Die Unterscheidung zwischen diesen Subtypen ist sehr wichtig, da einige Therapien bei dem einen Typ erfolgversprechend, bei dem anderen hingegen kontraindiziert sind. Bei schlecht differenzierten Tumoren ist jedoch die Typisierung oft nicht allein anhand der Morphologie möglich, sondern erfordert zusätzlich immunhistochemische (IHC) Färbungen mit bis zu vier Markern. Eine weniger umfangreiche Aufarbeitung führt in diesen Fällen zu einer verminderten diagnostischen Genauigkeit, mit der Gefahr einer verzögerten oder sogar falschen Diagnose.
Zur Lösung dieses Problems im Rahmen der Tumorklassifizierung wurde die Verwendung der bildgebenden, Matrix-assistierten Laserdesorptions-/Ionisations-Massenspektrometrie (MALDI IMS) vorgeschlagen. MALDI IMS ist eine analytische Methode zur ortsaufgelösten Untersuchung von Proteinen, Metaboliten, Lipiden und anderen Molekülen in biologischen Gewebeproben. Ein großer Vorteil ist die Anwendbarkeit auf formalin-fixierte, paraffineingebettete Gewebeschnitte, wie sie in der histopathologischen Routine zum überwiegenden Teil Verwendung finden. In den letzten Jahren wurden vielversprechende Ergebnisse hinsichtlich der MALDI IMS basierten Klassifizierung verschiedener Krebsarten erzielt. In der klinischen Routine konnte die Methode jedoch bisher nicht etabliert werden. Ein Grund dafür ist die begrenzte räumliche Auflösung von MALDI IMS (ca. 50 μm), die keine molekulare Bildgebung auf Zellebene erlaubt.
In DIAMANT werden daher die molekularen Informationen aus der MALDI IMS mit den detaillierten anatomischen Informationen aus digitalen Mikroskopiebildern (Digitale Bildanalyse, DIA) kombiniert. Mithilfe einer integrierten Analyse der Daten aus beiden komplementären Modalitäten wird ein Klassifikationsmodell entwickelt, das deutlich genauer ist als bestehende, nur auf einer der beiden Modalitäten basierende Modelle. Die im Projekt verwendete Deep Learning-Methodik ist besonders gut geeignet, um aus den komplexen, hochdimensionalen Rohdaten beider Modalitäten aussagekräftige Informationen zu extrahieren. Mittels einer anwendungsspezifischen Netzwerkarchitektur und speziell angepassten Regularisierungsmethoden wird pathologisches, biochemisches und massenspektrometrisches a-priori-Wissen in das Klassifikationsmodell integriert. Die erforderliche Menge an Trainingsdaten wird auf diese Weise reduziert und die Robustheit der Methode und ihre Verallgemeinerbarkeit auf neue klinische Testdaten werden erhöht.