ADFExport-Tool

Standard fürs Management von Chromatographie-Daten

Agilent Technologies bietet als erstes Unternehmen ein umfassendes Datenmanagement auf Grundlage der Datenstandardisierung von Allotrope an.

Das Allotrope Framwork © Agilent

Chromatographische Daten standardisiert erfassen, austauschen und speichern kann zu schnelleren Ergebnissen und tieferen Erkenntnissen führen. Die Allotrope Foundation, ein internationales Konsortium von pharmazeutischen, biopharmazeutischen und anderen forschungsintensiven Industrien, hat sich zum Ziel gesetzt, ein gemeinsames Datenformat für alle analytischen Methoden zu entwickeln – das Allotrope Datenformat (ADF). Es soll die Erfassung, den Austausch und die Speicherung von Daten im Labor vereinfachen. Agilent ist proaktiv an der Entwicklung dieses Datenformatstandards beteiligt und bietet die erste im Handel erhältliche ADF-Exportfunktion für chromatographische Daten.

In modernen Laboren werden riesige Datenmengen erzeugt, die von einer großen Bandbreite an Systemen, Software und Geräten stammen. Dabei liefern fast alle Geräte und Methoden Daten in unterschiedlichen, individuellen Dateiformaten. Auf diese Weise sind die gemeinsame und spätere Datennutzung und die Datenintegration eingeschränkt – der volle Wert der Daten kann kaum realisiert werden. Erschwerend kommt hinzu, dass die kritischen Metadaten zur Dokumentation von Experimenten (Methoden, Materialien, Bedingungen, Ergebnisse) oft unvollständig sind und die Komplexität erhöhen. Dies liegt an der manuellen Eingabe von Daten und der Verteilung von Daten über mehrere Software-Applikationen, Datenbanken oder Dokumente. Die Suche nach Daten wird so zu einer sehr schwierigen Aufgabe.

Anzeige

Kostbare Zeit für Datensuche

Darüber hinaus ist es schwer, Ergebnisse richtig zu verstehen und zu vergleichen; und Experimente sind nicht immer einfach und manchmal überhaupt nicht reproduzierbar. Tatsächlich werden viele Experimente und Messungen erneut durchgeführt, weil die alten Daten nicht gefunden werden können oder unvollständig bzw. ungenau beschrieben worden sind. Der fragmentierte Zusammenhang und die inkompatiblen Datenformate behindern nicht nur die gemeinsame Nutzung und Integration von Daten, sondern auch die analytische Auswertung, die tiefere Einsichten ermöglichen kann. Insgesamt verbringen Wissenschaftler übermäßig viel Zeit mit der Suche nach Daten und der manuellen Übertragung und Verwaltung von Daten, um zu neuen Erkenntnissen zu kommen. Allgemein wird angenommen, dass Wissenschaftler 80 % der Arbeitszeit mit der Suche nach Daten, ihrer Aufarbeitung und Organisation verbringen.

Der Geschäftszweck der Allotrope Foundation ist eine Revolution der Erfassung, gemeinsamen Nutzung und Auswertung von wissenschaftlichen Daten mithilfe eines Frameworks aus Standards und semantischer Integration. Dabei stützt sich die Allotrope Foundation auf die Breite und Vielfalt der Kompetenzen und Perspektiven der Vordenker der 60 Mitglieder, darunter forschende Unternehmen, Hersteller und Forschungsinstitutionen. Die Arbeitskultur der Mitgliedsunternehmen und Partner im Ökosystem der Allotrope Foundation ist durch enge Zusammenarbeit gekennzeichnet. Gemeinsam wird nach einer holistischen, ursachenbekämpfenden Lösung gesucht, um die Herausforderungen der wissenschaftlichen Datenlandschaft zu meistern.

Allotrope Datenformat (ADF) stärkt Datenintegrität

In einer anfänglichen, iterativen Forschungsphase wurden bestehende Datenstandards, Datenarchitekturen und deren Ontologien umfassend analysiert. Anschließend wurde ein holistischer Ansatz entwickelt. Dieser umfasst ein universelles Datenformat für Daten und eine standardisierte Metadatensprache, die zusammen als Allotrope Framework bezeichnet werden.

Das Allotrope Datenformat (ADF) eignet sich zur Speicherung von Metadaten und erfassten Datensätzen. Es handelt sich um das Datenformat, das am einfachsten erweitert werden kann, beispielsweise um Geräte-, Methoden-, Anbieter- und Plattformdaten zu standardisieren. Darüber hinaus ist dieses vielseitige Datenformat das erste, das die Integration von semantischen Standards und Funktionen bei der Datenspeicherung erlaubt: So können eigenständige Datensätze eines Experiments oder einer Messung angelegt werden. Dank integriertem Audit Trail und fälschungssicherer Prüfsummenfunktion stärkt das Datenformat außerdem die Datenintegrität.

Ein wichtiger Aspekt sind die Software-Bibliotheken des Allotrope Frameworks. Sie erlauben eine Anpassung der bestehenden Applikationen bzw. die Entwicklung von neuen Lösungen, die die Standards implementieren und mit ADF arbeiten. Allotrope Foundation Ontologies (AFO) bilden die Grundlage eines kontrollierten Vokabular- und Semantikmodells für Kontext-Metadaten, die einen Test oder eine Messung beschreiben bzw. durchführen und die Daten später beschreiben. Durch Einbettung der AFO in die Arbeitsabläufe in Laboren mithilfe von Informatik-Tools kann der Bedarf nach manuellen Eingaben gesenkt bzw. die Datenqualität im Labor verbessert werden. Dies ist ein wichtiger Schritt auf dem Weg hin zu weniger Komplexität bei der Integration und Erschließung der Daten. Zu guter Letzt stellen Allotrope Datenmodelle (ADM) einen Mechanismus für die Definition von Datenstrukturen (Schemata, Vorlagen) zur Verfügung. Diese beschreiben, wie die Ontologien für bestimmte Zwecke auf standardisierte – d. h. reproduzierbare, vorhersagbare und verifizierbare – Weise genutzt werden.

Das Allotrope Framework ist im Laufe von 2017 und 2018 phasenweise veröffentlicht worden und wird nun von Geräte-, Software- und Serviceanbietern des Allotrope Partnernetzwerks (APN) unterstützt. Wo das Allotrope Framework von Mitgliedsunternehmen (als frühzeitige Anwender) bereits implementiert wurde, zeigen sich jetzt schon transformative Verbesserungen. Diese betreffen die Datenqualität und -integrität, die Kompatibilität von Geräten und Software, die Harmonisierung von analytischen Daten in Unternehmen und zwischen Geräteklassen und Lösungen zur Ablage bzw. Archivierung von Daten, die die Suche nach und Zugriff auf Daten sowie die Analytik erheblich vereinfachen. Die Software-Applikationen, die zur Steuerung von Laborgeräten oder Fertigungsstraßen verwendet werden, und IT-Applikationen für Arbeitsabläufe sind größtenteils serienmäßige Produkte von der Stange. Die seit Kurzem von den Unternehmen des APN-Ökosystems erhältlichen Produkte und Services bedeuten, dass das Allotrope Framework und seine Standards nun allgemein erhältlich sind.

Das Engagement von Agilent

Agilent ist ein APN-Partner und konzentriert sich zunächst auf LC-UV-Datenmodelle. Diese ermöglichen Chromatographie-Datensystemen (CDS) den Export von Analysedaten aus der Flüssigchromatographie (LC) direkt in eine ADF-Datei. Wenn die Allotrope Foundation Datenmodelle für die Gaschromatographie, die Massenspektrometrie und die Raman-Spektroskopie veröffentlicht, sollen diese Daten in ähnlicher Weise kommerzialisiert werden; aktuell arbeitet Agilent an ADF-Prototypen für verschiedene dieser Methoden. Agilent hat außerdem einen weiteren Prototyp entwickelt, der die Archivierung von ADF-Dateien in einer Form erlaubt, die eine Suche in OpenLab ECM (Enterprise Content Management) zulässt: Damit wird eine vollständige Workflow-Lösung geschaffen.

Das Engagement von Agilent für Allotrope begann in 2014: Agilent Technologies wurde zum Partnermitglied von Allotrope und entwickelte eine Reihe von Prototypen. Im August 2018 veröffentlichte Agilent das erste im Handel erhältliche Produkt, das sich auf das Allotrope Framework stützt: ADFExport für OpenLab CDS ChemStation.

Speicherung von Daten im Allotrope-Datenformat 

ADFExport für OpenLab CDS ChemStation Edition stellt Funktionen für den Export von Daten aus ChemStation in ADF bereit. Es unterstützt den Export von LC-UV-Rohdaten der ChemStation in Form von Einzelläufen. Diese Basisoption für den Export ist ausschließlich für Forschungszwecke bestimmt. Der ADF-Export kann während der Datenerfassung automatisch oder später manuell und mithilfe einer Windows-Befehlszeile erfolgen. Die Ausführung des ADFExport-Tools von der Befehlszeile aus erlaubt den Transfer von bestehenden LC-UV-Daten der ChemStation in das ADF-Format.

ADF basiert auf HDF5, ein plattformunabhängiges Dateiformat. Es besteht aus den folgenden drei Teilen: Data Description (Datenbeschreibung), Data Cube (Datenwürfel) und Data Package (Datenpaket):

Die Datenbeschreibung basiert auf semantischer Webtechnologie und Datenverknüpfungskonzepten auf Grundlage des RDF-Formats vom World Wide Web Consortium (W3C) zur Speicherung von analytischen Metadaten in Form von Datengraphen in einer standardisierten und strukturierten Weise [2]. Ein Graph enthält einen Satz Aussagen, die Tripels genannt werden. Jedes Tripel besteht aus einem Subjekt, einem Prädikat und einem Objekt. Bei der aktuellen Basisoption für den Export enthält die Datenbeschreibung Metadaten zu den LC-UV-Rohdaten, die in den ADF-Datenwürfeln gespeichert werden. Seit der Erstveröffentlichung des LC-UV-Datenmodells können sehr viel mehr Kontext-Metadaten einer Analyse in die Datenbeschreibung des ADF geschrieben werden.

Der Datenwürfel enthält die analytischen Rohdaten: LC-UV-Chromatogramme und die entsprechenden UV-Spektren aus ChemStation.

Das Datenpaket ist ein universeller Datencontainer und umfasst die Originaldateien von ChemStation einschließlich aller Dateien und Unterverzeichnisse des Verzeichnisses „.D“ von ChemStation.

Die Allotrope Foundation hat den ADF-Explorer veröffentlicht, mit dem die Inhalte der erzeugten ADF-Dateien angezeigt werden können. Der Zugriff auf die Dateidaten erfolgt über die API-Schnittstelle. Die Chromatogramme und Spektren können unmittelbar in Tabellen- oder grafischer Form angezeigt werden. 

Fazit

Bei der Entwicklung von ADF hatte die Allotrope Foundation das folgende Ziel: Standardisierung der Erfassung, des Austausches und der Speicherung von analytischen Daten aus Arbeitsabläufen im Labor. Die Standardisierung und digitale Transformation von Daten durch ADF sind ein wichtiger Schritt auf dem Weg hin zu schnelleren Ergebnissen und tieferen Erkenntnissen aus den Daten, die von Mitgliedsorganisationen von Allotrope erzeugt werden. Die kommerziellen Produkte aus dem Ökosystem von Allotrope sind ein Grundstein für die allgemeine Annahme in der Branche. Das ADFExport-Tool ist der erste Schritt auf dem Weg zur globalen Akzeptanz des Standards.

Literatur

  1. http://www.allotrope.org
  2. www.w3.org/RDF

AUTOREN

Dana Vanderwall, PhD
Allotrope Foundation

Dr. Henrike Gehring & Dr. Ralph Mueller
Software & Informatics Division
Agilent Technologies 

Haftungsausschluss: Dieser Text entstand in gemeinschaftlicher Zusammenarbeit zwischen Agilent Technologies und der Allotrope Foundation. Er stellt keine Empfehlung der Allotrope Foundation oder eines ihrer Mitglieder dar.

Anzeige

Das könnte Sie auch interessieren

Anzeige

Interview

Von Software-Silos und Cloud-Phobien

Der Wechsel von Papierlaborbüchern und verstreuten Daten hin zu einer dezidierten Datenmanagementsoftware ist auch eine Herausforderung. Dr. Simon Bungers, Mitbegründer und CEO des Berliner Softwareunternehmens Labfolder, beschreibt diese im...

mehr...
Anzeige

Integriertes Datenmanagement

Ihre im Labor erzeugten Daten können Sie sicher und strukturiert in einem System sammeln. NEC und labfolder bieten ein Mittel für die effiziente Verwaltung großer wissenschaftlicher Datensätze an.

mehr...
Anzeige
Anzeige
Anzeige

Highlight der Woche

Integriertes Datenmanagement
Die Herausforderung bei der Digitalisierung des Laboralltags besteht im Wechsel von Papierlaborbüchern und Computerdateien zu einer Datenmanagementsoftware, die große Datensätze strukturiert innerhalb eines einzigen Systems sammelt.

Zum Highlight der Woche...