Potenzial von künstlicher Intelligenz

Algorithmus lernt aus Chemiedaten

Ein interdisziplinäres Team von Wissenschaftlern der Technischen Universität Berlin, des Fritz-Haber-Instituts der Max-Planck-Gesellschaft und der Universität Luxemburg hat einen Algorithmus entwickelt, der aus Chemiedaten lernt und ein neues Verständnis komplexer Moleküle erzeugt. Diese Arbeit zeigt das Potenzial von künstlicher Intelligenz oder maschinellem Lernen, den Erkenntnisgewinn in den Naturwissenschaften voranzutreiben.

In den letzten Jahren haben datengetriebene Lern-Algorithmen diverse Disziplinen revolutioniert, darunter die Suche im Internet, Textanalyse und maschinelle Übersetzung sowie Sprach- und Bilderkennung. Aus diesem Grund investieren Technologieunternehmen wie Google, Amazon, Facebook und Microsoft massiv in maschinelles Lernen und künstliche Intelligenz – ein sehr rechenintensives Feld, das unter anderem durch den Einsatz von Grafikkarten zur parallelen Berechnung der Algorithmen große Fortschritte machen konnte. Im Gegensatz dazu sind Lern-Algorithmen, die in den Naturwissenschaften eingesetzt werden, oft noch eher simpel und waren bisher nicht in der Lage, neue physikalische oder chemische Gesetze zu finden, die ihnen nicht explizit vorgegeben waren.

Jetzt haben die Gruppen von Prof. Dr. Klaus-Robert Müller (TU Berlin) und Prof. Dr. Alexandre Tkatchenko (Universität Luxembourg und FHI Berlin) einen Lernalgorithmus entwickelt, der das Verhalten von komplexen Molekülen aus einer großen Datenbank von quantenchemischen Berechnungen analysieren und dadurch Neues entdecken kann.

Anzeige

Insbesondere haben die Wissenschaftler ein sogenanntes „deep tensor neural network“ (DTNN) entwickelt, welches automatisch eine Repräsentation für Atominteraktionen in Molekülen findet. Dies ermöglicht chemisch und örtlich aufgelöste Einsichten in quantenmechanische Messgrößen. So konnte das DTNN zum Beispiel eine Gruppe von chemischen Molekülen (sogenannte aromatische Ringe) bezüglich ihrer Stabilität neu klassifizieren sowie Moleküle mit außergewöhnlicher elektronischer Struktur identifizieren. Insgesamt demonstriert diese Arbeit das hohe Potenzial von künstlicher Intelligenz in der Chemie und anderen Naturwissenschaften.

„Die Interpretierbarkeit von statistischen Modellen ist entscheidend, da sie deren Grenzen und Schwächen aufzeigen kann. Bislang wurde das maschinelle Lernen vor allem angewendet, um möglichst genaue Vorhersagen zum Beispiel über die Energien bestimmter chemischer Moleküle zu machen. Allerdings hatte man keine Erkenntnisse über den zugrundeliegenden Mechanismus. Jetzt ist es uns erstmals gelungen, in einer Art „Rückwärtsschritt“ anhand der Vorhersagen, die das maschinelle Lernen über bestimmte Moleküle macht, Erkenntnisse über die zugrundeliegenden naturwissenschaftlichen Phänomene zu gewinnen. Wir können die Ergebnisse interpretieren. Dadurch können wir effektivere und genauere Modelle konstruieren. Interpretierbarkeit war das fehlende Puzzlestück, um maschinelles Lernen zu einem weit verbreiteten Werkzeug in der wissenschaftlichen Forschung zu machen“, sagt Prof. Dr. Klaus-Robert Müller, Leiter des Fachgebiets Maschinelles Lernen an der Technische Universität Berlin.

„Aufgrund der unkonventionellen Kombination aus künstlicher Intelligenz und Quantenmechanik, kann unsere Methode neuartige chemische Erkenntnisse gewinnen, wie statistische Maße für Molekülstabilität und Aromatizität, und somit den Weg für eine breitere Anwendung in der chemischen Forschung bereiten“, sagt Prof. Dr. Alexandre Tkatchenko, Leiter der Gruppe für Theoretische Chemische Physik an der Universität Luxembourg.

Katharina Jung

Diese Arbeit wurde gefördert von der Einstein Stiftung Berlin sowie der DFG, dem BMBF (Berlin Big Data Center) und dem European Research Council.

[1] Kristof T Schütt, Farhad Arbabzadah, Stefan Chmiela, Klaus-Robert Müller, Alexandre Tkatchenko, Quantum-chemical insights from deep tensor neural networks, Nature Communications, 9th January 2017, DOI: 10.1038/NCOMMS13890

Weitere Informationen:

Prof. Dr. Klaus-Robert Müller
TU Berlin, Machine Learning Group und Berlin Big Data Center
E-Mail: klaus-robert.mueller@tu-berlin.de

Prof. Dr. Alexandre Tkatchenko
University of Luxembourg, Theoretical Chemical Physics group
E-Mail: alexandre.tkatchenko@uni.lu

Anzeige

Das könnte Sie auch interessieren

Anzeige
Anzeige

Integriertes Datenmanagement

Ihre im Labor erzeugten Daten können Sie sicher und strukturiert in einem System sammeln. NEC und labfolder bieten ein Mittel für die effiziente Verwaltung großer wissenschaftlicher Datensätze an.

mehr...
Anzeige
Anzeige
Anzeige

Highlight der Woche

Integriertes Datenmanagement
Die Herausforderung bei der Digitalisierung des Laboralltags besteht im Wechsel von Papierlaborbüchern und Computerdateien zu einer Datenmanagementsoftware, die große Datensätze strukturiert innerhalb eines einzigen Systems sammelt.

Zum Highlight der Woche...