Proteinforschung

Künstliche Intelligenz für das Design neuartiger Proteine

Ein Forschungsteam der Universität Bayreuth unter der Leitung von Prof. Dr. Birte Höcker hat ein computerbasiertes Modell zur Verarbeitung natürlicher Sprachen erfolgreich auf die Proteinforschung angewendet.

© UBT / Arbeitsgruppe Proteindesign

Natürliche Sprachen und Proteine ähneln sich in ihrem Aufbau: Aminosäuren ordnen sich in einer Vielzahl von Kombinationen zu Strukturen an, die im lebenden Organismus spezifische Funktionen haben – ähnlich wie Wörter in unterschiedlichen Kombinationen Sätze bilden, die bestimmte Sachverhalte ausdrücken. In den letzten Jahren wurden daher zahlreiche Ansätze entwickelt, um Prinzipien und Prozesse, welche die computergestützte Verarbeitung natürlicher Sprache steuern, in der Proteinforschung zu nutzen. „Die Verarbeitung natürlicher Sprache – das Natural Language Processing – hat aufgrund neuer KI-Technologien außerordentliche Fortschritte gemacht. Modelle der Sprachverarbeitung versetzen Maschinen heute in die Lage, sinnvolle Sätze nicht nur zu verstehen, sondern auch selbst zu erzeugen. Ein solches Modell war der Ausgangspunkt unserer Forschungsarbeiten. Mit detaillierten Informationen, die etwa 50 Millionen Sequenzen natürlicher Proteine betreffen, hat meine Mitarbeiterin Noelia Ferruz das Modell trainiert und in die Lage versetzt, selbstständig Proteinsequenzen zu erzeugen. Es versteht jetzt die Sprache der Proteine und kann sie kreativ anwenden. Diese kreativen Anwendungen folgen, wie wir festgestellt haben, den grundlegenden Bauprinzipien natürlicher Proteine“, sagt Prof. Dr. Birte Höcker, Leiterin der Arbeitsgruppe für Proteindesign an der Universität Bayreuth.

Anzeige

Das auf die Proteinentwicklung übertragene Sprachverarbeitungsmodell trägt den Namen „ProtGPT2“. Es kann nun genutzt werden, um Proteine zu entwerfen, die durch Faltung stabile Strukturen annehmen und in diesem Zustand dauerhaft funktionstüchtig sind. Zudem haben die Bayreuther Biochemiker und Biochemikerinnen durch komplexe Untersuchungen herausgefunden, dass das Modell auch Proteine kreieren kann, die in der Natur nicht vorkommen und in der Geschichte der Evolution womöglich noch nie existiert haben. Das ProtGPT2 habe einen weiteren Vorteil: Die meisten Proteine, die bisher de novo entworfen wurden, haben idealisierte Strukturen. Bevor sie angewendet werden können, sind in der Regel aufwändige Funktionalisierungsprozesse erforderlich, beispielsweise das Einfügen von Erweiterungen und Hohlräumen. ProtGPT2 erzeugt dagegen Proteine, die von Haus aus derart ausdifferenzierte Strukturen besitzen und so in ihrer jeweiligen Umgebung bereits einsatzfähig sind. Prof. Dr. Birte Höcker: „Unser neues Modell ist ein weiterer eindrucksvoller Beleg für die systemische Affinität von Proteindesign und der Verarbeitung natürlicher Sprache. Künstliche Intelligenz eröffnet hochinteressante und vielversprechende Möglichkeiten, Methoden der Sprachverarbeitung für die Herstellung maßgeschneiderter Proteine zu nutzen.“

Publikation:
Noelia Ferruz, Steffen Schmidt, Birte Höcker: ProtGPT2 is a deep unsupervised language model for protein design. Nature Communications (2022), DOI: https://doi.org/10.1038/s41467-022-32007-7

Quelle: Universität Bayreuth

Anzeige

Das könnte Sie auch interessieren

Anzeige

Assistenzsystem

Cobot mit 3D-Kamera und KI

Beim Unternehmen „bAhead“ wurde eine Lösung konzipiert, die Labormitarbeitende unterstützen kann. Das Kernelement ist ein kleiner kollaborierender Roboterarm namens Buddy, der Geräte bedienen oder auch Pipettieren und logistische Prozesse übernehmen...

mehr...
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige