KI-Vorhersagetool
Künstliche Intelligenz findet passende Enzym-Substrat-Paare
Welche Substrate kann ein Enzym verarbeiten?Ein internationales Team mit Bioinformatikern der Heinrich-Heine-Universität Düsseldorf (HHU) stellt ein KI (Künstlicher Intelligenz)-Verfahren vor, das mit recht hoher Wahrscheinlichkeit vorhersagen kann, ob ein beliebiges Enzym ein bestimmtes Substrat weiterverarbeiten kann.
Gene, die Enzyme kodieren, können recht leicht als solche erkannt werden, doch die genaue Funktion des resultierenden Enzyms in den allermeisten Fällen – bei mehr als 99 Prozent – unbekannt. Denn ihre Arbeit experimentell zu charakterisieren und damit zu erkennen, welche Ausgangsmoleküle ein bestimmtes Enzym konkret in welches Endmolekül umwandelt, ist äußerst aufwändig.
Das Forschungsteam um Prof. Dr. Martin Lercher von der Arbeitsgruppe Computergestützte Zellbiologie an der HHU entwickelte zusammen mit Forschenden aus Schweden und Indien eine Methode, die KI-basiert vorhersagt, ob ein beliebiges Enzym ein bestimmtes Molekül als Ausgangsstoff für die von ihm katalysierte Reaktion verarbeiten kann.
Themen im Artikel
Prof. Dr. Lercher: „Die Besonderheit unseres ESP-Modells – dies steht für „Enzyme-Substrate-Prediction“ – ist, dass wir nicht auf einzelne, spezielle Enzyme und ihre nahen Verwandten beschränkt sind, wie dies in bisherigen Ansätzen der Fall war. Unser allgemeines Modell kann mit jeder Kombination aus einem beliebigen Enzym und über 1.000 verschiedenen Substraten arbeiten.“
Doktorand Alexander Kroll, Erstautor der Publikation in der Fachzeitschrift Nature Communications, hat ein Deep Learning-Modell entwickelt, in dem die Informationen über die Enzyme und die Substrate in mathematischen Strukturen - numerischen Vektoren - kodiert wurden. Die Vektoren von rund 18.000 experimentell bekannten, also funktionierenden Enzym-Substrat-Kombinationen, wurden als Trainingsmaterial für das Deep Learning-Modell verwendet. „Das so von uns trainierte Modell haben wir dann auf einen unabhängigen Testdatensatz angewandt, für den wir die korrekten Antworten schon kannten. In 91 Prozent der Fälle sagte das Modell korrekt voraus, welche Substrate zu welchen Enzymen passen“, so Alexander Kroll.
Diese Methode hat erhebliches Anwendungspotenzial. Sowohl in der Arzneimittelforschung als auch in der Biotechnologie ist es von großer Bedeutung zu wissen, welche Stoffe von Enzymen umgesetzt werden können. Professor Lercher: „So können Forschung und Industrie aus einer großen Menge an möglichen Kombinationen diejenigen eingrenzen, die am vielversprechendsten sind, um damit neue Medikamente, Chemikalien oder auch Biokraftstoffe enzymatisch herzustellen.“ Kroll ergänzt: „Hiermit werden auch bessere Modelle möglich, um den Stoffwechsel in Zellen zu simulieren. Darüber kann die Physiologie verschiedener Organismen – von Bakterien bis zum Menschen – verstanden werden.“
An der Studie waren neben Kroll und Lercher auch Prof. Dr. Martin Engqvist von der Chalmers University of Technology im schwedischen Gothenburg und Sahasra Ranjan vom Indian Institute of Technology in Mumbai beteiligt. Engqvist hat das Studiendesign mit erarbeitet, Ranjan hat das Modell implementiert, das die Enzyminformationen kodiert, die in das von Kroll entworfene Gesamtmodell eingespeist werden.
Originalpublikation:
Kroll, A., Ranjan, S., Engqvist, M.K.M., Lercher, M., A general model to predict small molecule substrates of enzymes based on machine and deep learning. Nat Commun 14, 2787 (2023), https://doi.org/10.1038/s41467-023-38347-2
Quelle: Heinrich-Heine-Universität Düsseldorf