Über Datennutzung und Dateninfrastruktur in der Wirkstoffentwicklung
Daten, Daten, Daten
Erfolgreiche und effiziente Wirkstoffforschung hängt davon ab, ob die Forscher und Forscherinnen an wichtigen Entscheidungspunkten eines Projekts über die notwendigen Daten verfügen, um sich für den richtigen Weg entscheiden zu können. Dazu benötigen sie fundierte Antworten auf relevante Leitfragen wie z. B.: "Lohnt es sich, diese Wirkstoffklasse weiter zu verfolgen?", "Verfügt eine andere Wirkstoffklasse über biochemische Eigenschaften, die leichter optimierbar sind?" oder "Welche Auswirkungen hatten unsere letzten Änderungen an diesem Molekül und welche Änderungen wären sinnvoll, um eine bestimmte Eigenschaft zu erreichen oder zu eliminieren?". Spezialisierte Softwareplattformen ermöglichen den Mitarbeitern und Mitarbeiterinnen in F&E-Abteilungen von Pharmaunternehmen, die großen Mengen von Daten aus verschiedenen internen und externen Quellen bestmöglich zu nutzen, um diese Antworten schneller zu finden.
Durch die Implementierung von Deep Learning und Künstlicher Intelligenz (KI) ist die Leistungsfähigkeit dieser Plattformen schon jetzt erheblich gestiegen: Sie finden die gesuchten Informationen zu chemischen Molekülen oder Biologika auch in unstrukturierten Daten und können sie zusammenfassen. Bereits jetzt bilden solche Systeme die Grundlage für neue Modelle, mit denen Moleküleigenschaften vorhergesagt werden können. In nicht allzu ferner Zukunft sollen sie sogar gänzlich neue Moleküle vorschlagen können, deren Eigenschaften für die vorgesehene Verwendung besser geeignet sind als bisher bekannte Substanzen.
Daten als Entscheidungsgrundlage
In der Arzneimittelentwicklung soll die größtmögliche Wirkung einhergehen mit möglichst geringen Nebenwirkungen. Um dies zu erreichen, stützt sich die Forschung auf eine ganze Reihe von Daten, die umfangreiche Informationen über chemische, strukturelle und biologische Eigenschaften eines Wirkstoffs liefern. Dazu zählen Auswertungen biologischer Tests, zum Beispiel die Interaktion der Wirkstoffmoleküle mit bestimmten Enzymen, sowie Ergebnisse aus computergestützten Modellierungen zu den Eigenschaften und Wirkungen der Moleküle.
Neben diesen Daten, die in den eigenen Laboren der Pharmaunternehmen aufwendig erhoben werden, beziehen die Teams oft auch Daten von externen Forschungspartnern ein. Um zusätzlich auf Ergebnisse in wissenschaftlichen Veröffentlichungen und öffentlich zugänglichen Datenbanken zugreifen zu können, müssen die Forschenden sie zunächst einmal finden und dann intelligent und kompatibel mit den eigenen Daten verknüpfen. Damit steht ihnen dann eine umfassende Auswahl relevanter Daten zur weiteren Auswertung zur Verfügung.
Daten-Infrastruktur sollte zu F&E passen
Wie viel Aufwand es bedeutet, die Datenquellen für ein präzises Zusammenspiel von zahlreichen Parametern und Faktoren zu nutzen, hängt von der Daten-Infrastruktur im Unternehmen ab. Es ist anzunehmen, dass Teamleiter und -leiterinnen in Forschung und Entwicklung einen großen Teil ihrer Arbeitszeit damit verbringen, Daten zu sammeln und zwischen Anwendungen zu verschieben. Das bedeutet für die Wissenschaftler und Wissenschaftlerinnen weniger Zeit für ihre eigentlichen Aufgaben wie Beziehungen von molekularen Strukturen und ihren biochemischen Eigenschaften zu erkennen, Projektberichte zu erstellen und die nächsten Forschungsschritte festzulegen.
Das Arbeiten mit verschiedenen Datenquellen und Anwendungen birgt zudem das Risiko, dass beim Verschieben von Daten von einer Anwendung zur anderen der Datenkontext nicht vollständig mitgeliefert und dadurch die Qualität und Integrität der Informationen vermindert werden. Um solche Fehler und Verluste bei der Übernahme von Daten zu vermeiden, ist eine effiziente Lösung zur Konsolidierung aller Datenquellen in einer gut organisierten, homogenen Ansicht erforderlich.
Idealerweise ist eine solche Infrastruktur nicht nur auf die Verarbeitung von Daten zu chemischen Molekülen festgelegt, sondern arbeitet datenagnostisch und kann auch mit biologischen Wirkstoffen wie Oligonukleotiden, Peptiden und Antikörpern "umgehen".
Datenkonsolidierung auf einer Plattform
Das auf pharmazeutische Forschung und Entwicklung spezialisierte Datenverarbeitungssystem D360 ist in diesem Umfeld eine häufig genutzte Software. Sie bereitet die verfügbaren Daten aus den unterschiedlichen Quellen so auf, dass sie für jede Fragestellung in einer einzelnen Ansicht zur Verfügung stehen. Darüber hinaus gibt das System auch logistische Hilfestellungen, indem es beispielsweise die im Haus verfügbare Menge einer Substanz angibt und gegebenenfalls Möglichkeiten zur Nachbestellung anbietet. So unterstützt die Plattform dabei, sicher zu stellen, dass genug Material vorhanden ist, um weitere Tests durchführen zu können.
Die Anwendung kann alle bereits erhobenen Daten zu den Wirkstoffkandidaten eines Forschungsprojekts in verschiedenen Datenquellen finden und dem Nutzer in einem Datensatz zur weiteren Analyse zur Verfügung stellen. Durch den Einsatz von KI und Deep Learning ist das System dabei nicht auf vorstrukturierte Datenquellen festgelegt. Es kann in verschiedensten Dokumenten Molekül- und Wirkstoffnamen finden und diese Dokumente dann mit den jeweiligen Substanzen verknüpfen.
Die Suchabfrage funktioniert über Begriffe aus dem Forschungsalltag und kommt ohne Programmiersprachen oder Fachkenntnisse zu Datenbanken aus. Abfragen können geteilt werden und stehen dann anderen Mitarbeitenden in den Projektteams zur Verfügung.
Das System bereitet die Daten so auf, dass die Forscher und Forscherinnen sie mit integrierten Funktionen der Software weiterbearbeiten können. Dazu zählen medizinalchemische Analysen, grafische Auswertungen mittels verschiedener Diagramme, Multi-Parameter-Scoring, Annotation der Moleküle mit Kommentaren, Berechnung von Formeln sowie der Austausch von Daten mit externen Partnern.
KI und Deep Learning
Neue Möglichkeiten für weitere Analysen und Entwicklungen entstehen durch die Implementierung von KI und Deep Learning in die Funktionalitäten des Systems D360. Mithilfe Künstlicher Intelligenz findet die Plattform die gesuchten Informationen nicht nur in zuvor aufwendig aufbereiteten Datenbanken, sondern auch in vielen Arten von Dokumenten.
Ausblick
Bei Certara arbeiten Spezialisten zurzeit an Lösungen, die auch Datenformate, die bisher für eine Datenanalyse völlig ungeeignet waren, interpretieren, zusammenfassen und die bisher unzugänglichen Informationen für die Forschung nutzbar machen können.
Voraussichtlich wird die Plattform durch KI und Deep Learning in Zukunft in der Lage sein, gänzlich neue Moleküle oder Molekülvarianten mit Eigenschaften vorzuschlagen, die Vorteile gegenüber etablierten Substanzen bieten. Traditionelle chemische Ansätze sind oft auf bekannte Molekülstrukturen beschränkt. KI kann jedoch völlig neue, unkonventionelle Moleküle und Verbindungen vorschlagen, die von den forschenden Personen möglicherweise nicht in Betracht gezogen würden. Das könnte in nicht allzu ferner Zukunft eine Revolution in der Wirkstoffentwicklung bedeuten.
AUTOR
Dr. Fabian Rauscher
Scientific Informatics Manager für Europa
Certara Germany GmbH, Berlin
Tel.: 030/767594254
[email protected]
www.certara.com











