Fachbeitrag
Chemometrische Spektroskopie
Dr. Heinrich Prüfer*)
- Geschäftsführer der SensoLogic GmbH, Hummelsbütteler Steindamm 78A, 22851 Norderstedt, Tel: 040/5295670, Fax: /52956799, http://www.sensologic.com, [email protected]
Die aufwändige Entwicklung und Pflege der dafür benötigten Kalibrationsmodelle wur-de bereits in Umfragen zu Anfang der neunziger Jahre als mit Abstand größtes Hindernis zur weiteren Verbreitung dieser Technik genannt. An dieser Einschätzung hat sich bis heute trotz aller technischen Fortschritte nicht viel geändert. Neben der Vielzahl von Proben und ihren Referenzanalysen ist es vor allem der zur Modellierung benötigte Arbeitsaufwand interner oder externer Spezialisten, der noch im Vorfeld des eigentlichen Messbetriebes zu erheblichen Kosten führen kann. Eine nähere Betrachtung der einzelnen Arbeitsschritte für den Fall der quantitativen Kalibrierung eröffnet jedoch Möglichkeiten zu einer weitergehenden Entlastung dieses Tätigkeitsbereiches durch intelligente neue Softwarelösungen.
Einsatz bewährter Regressionstechniken – auch ohne den Experten?
Im Allgemeinen beinhaltet die Entwicklung eines quantitativen Kalibrationsmodells mit multilinearer Regression die folgenden logischen Schritte:
a. Die analytische Aufgabenstellung wird festgelegt, also das Produkt und eine oder mehrere zu kalibrierende Eigenschaften.
b. Die Proben, deren Datensätze aus Spektren und Referenz-Analysenwerten zur Kalibrierung und zur Validierung für die jeweilige Produkteigenschaft herangezogen werden sollen, werden ausgewählt und zugeordnet.
c. Zur Vorbehandlung der Spektren werden mathematische Transformationen angewandt.
d. Der zur Modellierung verwendete Spektralbereich wird – soweit unter Qualitätsgesichtspunkten erforderlich – eingeschränkt.
e. Der Regressionsansatz (z.B. PLS-Regression) wird gewählt.
f. Die optimale Anzahl von Modellvariablen wird bestimmt.
g. Etwaige Ausreißer werden aus dem Kalibrations-Datensatz entfernt.
h. Das jeweilige Kalibrationsmodell wird anhand von Kenngrößen beurteilt.
i. Durch Anwendung des Modells auf seinen Validierungs-Datensatz wird seine Messunsicherheit charakterisiert und in Abhängigkeit davon seine Eignung für den Routine-Messbetrieb abschließend bewertet.
Dabei variiert die Reihenfolge dieser Schritte in der Praxis von Fall zu Fall. Oftmals werden die einzelnen angesprochenen Entscheidungen durch versuchsweise Neuberechnung alternativer Kalibrationsmodelle herbeigeführt, systematisch oder per „trial and error“. Erfahrene Anwendungsexperten benötigen dafür naturgemäß weniger Versuche als ein Neueinsteiger.
Dass eine Automatisierung mit den bisher in marktüblichen Softwarepaketen verfügbaren Hilfsmitteln noch nicht konsequenter vorangetrieben wurde, liegt nicht zuletzt an der noch unbefriedigenden Lösung einiger anspruchsvoller Teilaufgaben.
Dazu gehören unter anderem:
- Die Vorauswahl der für die vorliegende Spektrenserie zur Ausfilterung störender Varianzbeiträge und zur Linearisierung am besten geeigneten Datenvorbehandlungen;
- die Einstellung der optimalen Redundanz im Kalibrations-Datensatz zur Vermeidung eines zu optimistischen oder zu pessimistischen Ergebnisses der internen Kreuzvalidierung bei der von den meisten Anwendern eingesetzten PLS-Regression;
- die sichere Beurteilung der optimalen Anzahl von Modellvariablen;
- die zuverlässige Ausreißer-Erkennung und -Entfernung;
- die Absicherung des Leistungsvergleichs zwischen alternativen Modellen durch Signifikanztests, insbesondere für den Unterschied zwischen ihren Standardabweichungen.
Der Mangel an ausreichend sicheren Werkzeugen zur Bewältigung dieser Teilaufgaben in Verbindung mit einer jahrzehntelangen, meist auf systematisches Probieren ausgerichteten Praxis hat dazu geführt, dass bei der Entwicklung chemometrischer Kalibrationsmodelle auch heute noch Erfahrungswissen und Intuition als unverzichtbar gelten. Andererseits befolgen erfahrene Anwender in den meisten Fällen eine annähernd standardisierte Vorgehensweise, die als „common sense“ auch in der Fachliteratur und explizit in einigen Normen wie der amerikanischen ASTM E1655 zum Ausdruck kommt und als Grundlage für eine Automatisierungs-Sequenz herangezogen werden kann.
Ein Wizard mit skalierbarem Automatisierungsgrad
Mit der SL-Softwarefamilie für die chemometrische Spektroskopie hat SensoLogic in den letzten fünf Jahren ein ausbaufähiges Konzept verwirklicht, bei dem verschiedene Softwaremodule für die Kalibrationsentwicklung (SL Calibration Workshop), die Routine-Messung am Spektrometer (SL Predictor) oder andere spezielle Aufgaben gemeinsam eine standardisierte Datenbasis benutzen können. Diese Produktfamilie erhält nun ein neues Mitglied, den SL Calibration Wizard, der erstmals auf der analytica 2008 vorgestellt wird. Er führt den Anwender durch eine Sequenz von Arbeitsschritten zur Erstellung und Validierung von quantitativen Kalibrationsmodellen. Dabei können mehrere Modelle für verschiedene Produkteigenschaften oder auch alternative Modelle für denselben Parameter parallel angelegt und bearbeitet werden (Bild 1).
Durch die im Programm verwendeten Konfigurationseinstellungen für jeden einzelnen Arbeitsschritt werden die dem Anwender gezeigten Vorgabewerte festgelegt. Zusätzlich ist einstellbar, ob ein Schritt mit diesen Vorgabewerten automatisch abgearbeitet werden soll. Werden alle Schritte automatisch durchlaufen, bei denen diese Möglichkeit vorgesehen ist, erhält der Anwender fertige Kalibrationsmodelle, die nur noch validiert werden müssen.
Die Standard-Konfigurationseinstellungen, die unmittelbar nach der Installation aktiv sind, erlauben es auch unerfahrenen Anwendern, ein brauchbares Kalibrationsmodell zu erzeugen. Jeder Benutzer kann diese Einstellungen für seine Zwecke individuell anpassen und damit den Programmablauf optimieren. Da die Automatisierung für jeden Arbeitsschritt gesondert parametriert wird, kann ein Anwender auch differenziert entscheiden, welche Arbeitsschritte automatisch und welche interaktiv bearbeitet werden sollen.
Innovative Werkzeuge
Um die Voraussetzungen für einen automatischen Durchlauf zu verbessern, müssen mit dem SL Calibration Wizard einige neue Methoden und Werkzeuge zur Beseitigung oder Umgehung der oben genannten Schwachpunkte eingeführt werden. So werden zum Beispiel zur Vorauswahl der mathematischen Transformation zur Spektrenvorbehandlung varianz- und kovarianz-analytische Hilfsmittel angeboten. Eine Subset-Selection mit Gauss-Jordan-Verfahren unterstützt die Redundanz-Optimierung im Kalibrations-Datensatz.
Zur automatischen Ausreißerentfernung stehen differenzierte Kriterien zur Verfügung. Besonders gut geeignet erscheint eine Beurteilung anhand von Cook´s D, das hohe Werte annimmt, wenn ein Datensatz besonders großen Einfluss (Leverage) auf das Regressionsmodell hat, aber dennoch ein relativ großes Residuum verbleibt.
Neben der PLS-Regression wird von dem Programm alternativ auch die Regression im Wellenlängenraum (MLR) angeboten. Diese führt bei der Kalibration von Eigenschaften, die mit gut lokalisierbaren Bandenstrukturen verbunden sind, oder bei starken Linearitätsabweichungen zwischen verschiedenen Teilbereichen des Spektrums oftmals zu einem besser angepassten Regressionsmodell. Andererseits ist die Ausreißer-Diagnostik der MLR eingeschränkt, so dass sie besonders vorteilhaft in Kombination mit Faktormodellen wie PLSR eingesetzt wird.
Zur den neuen Fähigkeiten des SL Calibration Wizard gehört auch die Beurteilung, ob der Standardfehler eines scheinbar besseren Modells sich tatsächlich signifikant von dem eines anderen Modells unterscheidet. Da die Residuen der beiden Modelle korreliert sind, wenn sie auf den gleichen Datensätzen beruhen, ist ein klassischer F-Test nicht anwendbar. Stattdessen wird ein Signifikanztest nach Snedecor und Cochran [2] herangezogen.
Validierung und Freigabe der Modelle
Zur Qualitätssicherung chemometrischer Kalibrationsmodelle gehört zwingend ihre externe Validierung mit einem unabhängigen Testdatensatz. Diesem Schritt kommt eine um so größere Bedeutung zu, je stärker die Kalibrationsentwicklung automatisiert wurde.
Der SL Calibration Wizard sieht einen separaten Validierungsschritt mit einem entsprechend aussagefähigen Protokoll zur formellen Freigabe des jeweiligen Kalibrationsmodells vor. Dies beinhaltet eine vollständige Auflistung aller Einzelergebnisse der Validierungsproben sowie eine Analyse der systematischen und stochastischen Fehlerbeiträge.
Idealerweise wird zur Validierung ein Datensatz verwendet, bei dem bereits die Gewinnung der Proben völlig unabhängig vom Zustandekommen des Kalibrations-Datensatzes war. Steht ein solcher nicht zur Verfügung, kann vor Beginn der Kalibrationsentwicklung mit Unterstützung des Programms ein Testdatensatz aus der Arbeitsserie für die abschließende Überprüfung reserviert werden. Nach erfolgreicher Validierung freigegebene Kalibrationsmodelle werden dann zu „schlüsselfertigen“ Applikationen für die Multikomponenten-Analyse der entsprechenden Produkte kombiniert.
Fazit
Mit dem heute verfügbaren Kenntnisstand über die spektroskopische Kalibrierung mit multilinearen Regressionsmodellen kann diese Aufgabe durch entsprechende Software weitgehend automatisiert werden. Wird wie im Fall des SL Calibration Wizard eine schrittweise Bedienerführung mit einer skalierbaren Automatisierung von Einzelschritten verbunden, werden scheinbar gegensätzliche Anwenderinteressen vereinbar. Dem Neueinsteiger stehen ohne spezielle Vorkenntnisse schnell erste brauchbare Kalibrationsmodelle zur Verfügung, während der Spezialist über spezifische Voreinstellungen für die einzelnen Schritte die Bearbeitung nach seinen Vorstellungen gewichten und rationalisieren kann.
Der Verfasser bedankt sich bei Herrn Prof. Tom Fearn (University College London) für die freundliche Hilfestellung zum Verständnis der Signifikanztests zum Vergleich von Standardabweichungen korrelierter Datensätze.
Herrn Prof. John S. Shenk (ehem. Pennsylvania State University) gilt unser Dank für wertvolle Hinweise zu einigen Software-Merkmalen, die besonders für landwirtschaftliche Anwender zur Modellierung einer Vielzahl von Produkteigenschaften auf umfangreichen Datensätzen wichtig sind.
SensoLogic stellt auf der analytica in München in Halle A2, Stand 330 aus.
Literatur
- U. Büttner, H. Prüfer: Chemometrische Spektroskopie – Modulare Software für die Routineanalytik. Labo, 37. Jahrg., Nr. 4, April 2006, S. 26-30
- G. W. Snedecor, W. G. Cochran: Statistical Methods, Iowa States University Press, 6. Aufl., Ames IA 1967, S. 195 ff.