banner
Heim / Blog / KI wirft neues Licht auf den „Code des Lebens“
Blog

KI wirft neues Licht auf den „Code des Lebens“

Oct 14, 2023Oct 14, 2023

Während ChatGPT, Bard und andere Tools der künstlichen Intelligenz Autoren, Lehrern und Fans der Terminatorfilmreihe nächtliche Sorgen über verschiedene apokalyptische Szenarien bereiten, bietet ein anderer Einsatz von KI hoffnungsvollere Ergebnisse.

Forscher am USC Dornsife College of Letters, Arts and Sciences nutzen KI und andere Computermethoden, um die Art und Weise, wie Wissenschaftler DNA betrachten, neu zu definieren und eine klarere, umfassendere Perspektive auf den „Code des Lebens“ zu geben.

Die gewonnenen Erkenntnisse versprechen, wissenschaftliche Bereiche von der Krebsforschung über das Arzneimitteldesign bis hin zur Nachhaltigkeit zu verändern.

Vereinfacht ausgedrückt besteht der genetische Code aus vier Buchstaben – A, C, G und T. Die Buchstaben stellen die Nukleotide Adenin, Cytosin, Guanin und Thymin dar, die Teil der DNA-Doppelhelix sind. Diese vier Nukleotidbuchstaben geben den genetischen Code für alle Lebewesen an.

Obwohl diese einfache Version des Codes jahrzehntelang gute Dienste geleistet hat, offenbart sie nicht annähernd die Komplexität der DNA.

„Wir wollten eine neue Art der DNA-Kodierung finden, die über den linearen Buchstabencode hinausgeht“, sagte Remo Rohs, Vorsitzender der Abteilung für Quantitative und Computational Biology am USC Dornsife. Er und seine Kollegen veröffentlichten Anfang des Jahres in den Proceedings of the National Academy of Sciences bedeutende Forschungsergebnisse, die umfangreiche experimentelle Daten nutzten. Sie veröffentlichten letzte Woche auch ähnliche experimentelle Daten für eine Familie krebsrelevanter Proteine, sogenannte Forkhead-Box-Transkriptionsfaktoren, in Nucleic Acids Research.

Durch diese und andere Forschungsfortschritte gehört die Abteilung zu den Vorreitern der neuen USC Frontiers of Computing-Initiative, die darauf abzielt, Forschung und Innovation in fortschrittlichen Computertechnologien wie KI und maschinelles Lernen, Datenwissenschaft, Blockchain und Quanteninformation voranzutreiben.

Rohs, Professor für quantitative und computergestützte Biologie, Chemie, Physik, Astronomie und Informatik, und sein Team wollen eine realistischere und ganzheitlichere Definition des genetischen Codes entwickeln, die „alle strukturellen Variationen und chemischen Modifikationen umfasst, die wir jetzt kennen oder.“ das könnte in Zukunft entdeckt werden“, sagte er.

Diese chemischen Modifikationen und strukturellen Variationen, die Rohs erwähnt, reichen von kleinen Veränderungen an den vier Nukleotiden bis hin zu großen Veränderungen, die sich darauf auswirken, wie sich die DNA um sich selbst und andere Moleküle wie Proteine ​​windet.

Diese Veränderungen können Einfluss darauf haben, welche Gene aktiv und welche inaktiv sind, indem sie Proteinen erlauben oder blockieren, mit der DNA zu interagieren oder den Code zu lesen.

Rohs‘ Ansatz ersetzt die einfache Vier-Buchstaben-Sequenz durch eine, die physikochemische Gruppen in den großen und kleinen Furchen der DNA-Doppelhelix umfasst.

Was bedeutet das?

Die DNA-Doppelhelix bildet eine verdrehte Leiterform. Aufgrund der Drehung der Leiter hat sie eine breitere Hauptrille und eine schmalere Nebenrille. Je nach Größe und Form können Zellmoleküle durch eine Furche leichter mit der DNA interagieren als durch die andere.

„Physikochemisch“ bezieht sich sowohl auf physikalische als auch auf chemische Eigenschaften. Die Methode von Rohs berücksichtigt die verschiedenen Erhebungen und Vorsprünge der Nukleotide und anderer DNA-Komponenten sowie deren physische Zugänglichkeit innerhalb der beiden Rillen. Es berücksichtigt auch, wie die DNA-Komponenten möglicherweise chemisch mit Proteinen reagieren. Zusammengenommen ergibt dies ein klareres Bild davon, wie die Zellmaschinerie mit dem genetischen Code interagiert und ihn interpretiert.

Beispielsweise könnte ein Protein normalerweise an einen als AGTCATGGA kodierten DNA-Abschnitt binden, aber wenn dieser Abschnitt in der kleinen Furche versteckt ist, kann das Protein möglicherweise nicht nah genug an ihn herankommen, um zu binden. Oder wenn das Protein und der kodierte Abschnitt eine starke chemische Anziehungskraft haben, kann das Protein selbst dann noch interagieren, wenn der kodierte Abschnitt fest sitzt, wenn auch in geringerem Maße.

Hier führt das Team von Rohs die KI ein, die die Präferenz eines DNA-bindenden Proteins für bestimmte chemische Gruppen an bestimmten physikalischen Stellen in jeder Furche der DNA lernt.

Durch die Berücksichtigung dieser Nuancen enthüllen Rohs und sein Team ein umfassenderes Bild dessen, was mit der DNA in lebenden Zellen passiert, eines, das weit über den einfachen, linearen Vier-Buchstaben-Code hinausgeht. Laut Soheil Shams, emeritierter Chief Information Officer des Biotechnologieunternehmens Bionano Genomics Inc., ist dies der Schlüssel zur Weiterentwicklung der Computerforschung am Genom.

„Einer der wichtigsten, aber auch herausforderndsten Schritte in vielen Anwendungen der Computerbiologie, wie zum Beispiel maschinellem Lernen, besteht darin, biochemische Informationen so darzustellen, dass sie rechnerisch verarbeitet werden können“, sagte Shams, der einen Master an der USC Viterbi School of Engineering absolvierte Abschluss im Jahr 1986 und Promotion im Jahr 1992. „Der von Dr. Rohs und Kollegen vorgeschlagene Ansatz bietet eine viel vollständigere Darstellung der DNA-Sequenz, die gleichermaßen umfassendere Entdeckungen bei der Interpretation genetischer Varianten sowie der Krebsforschung ermöglichen sollte.“

Die Methode von Rohs würde Wissenschaftlern helfen zu verstehen, warum manche Gene unter bestimmten Bedingungen nur teilweise aktiv sind oder warum die Aktivität einiger Gene mit dem Alter zunimmt oder abnimmt.

Und dies, sagt Rohs, öffnet Türen für eine Reihe nützlicher Forschungsmöglichkeiten.

„Der Einsatz von KI-Methoden an einem Genom mit chemischen Modifikationen und strukturellen Modifikationen wird seine Anwendungen in der Krebs- und Alterungsforschung, der Agrarforschung, der synthetischen Biologie, der Chemietechnik und dem Arzneimitteldesign ermöglichen“, sagte er. „Bei bestimmten Krebsarten kommt es beispielsweise zu chemischen Veränderungen der DNA, das Altern korreliert mit dem Grad der DNA-Methylierung und Pflanzengenome unterliegen im Vergleich zu den Genomen anderer Organismen weitreichenden chemischen Veränderungen.“

Für ihre nächsten Schritte, sagt Rohs, wollen die Forscher ihre Arbeit auf DNA-bindende Proteine ​​anwenden, die die Genaktivität steuern und vorhersagen, wie sich eine Veränderung von Nukleotiden – oder der Ersatz neuer, synthetischer Nukleotide – auf die Funktion dieser Proteine ​​auswirkt.

„Wir wollen Bindungspräferenzen von Genregulationsproteinen, sogenannten Transkriptionsfaktoren, an DNA mit chemisch modifizierten Nukleotiden und synthetischen Basenpaaren vorhersagen, um die Bindungseigenschaften zu verbessern und Medikamente zu entwickeln, die die Gesundheit und Krankheit des Menschen verbessern“, sagte er.

Rohs‘ Arbeit an der Spitze der Computerbiologie unter Einsatz von KI könnte Vorteile für die Menschheit mit sich bringen, von denen Bots wie ChatGPT nur träumen können.

Der in Proceedings of the National Academy of Sciences veröffentlichte Artikel wurde von Postdoktorand Tsu-Pei Chiu geleitet und vom ehemaligen Doktoranden Satyanarayan Rao mitverfasst.

Der in Nucleic Acids Research veröffentlichte Artikel wurde von Postdoktorand Brendon Cooper geleitet und von der ehemaligen Postdoktorandin Ana Carolina Dantas Machado, dem Labortechniker Yan Gan und dem Professor für Biowissenschaften Oscar Aparicio gemeinsam verfasst.

Das experimentelle Projekt war Teil des Michelson Center for Convergent Bioscience. Beide Studien wurden von den National Institutes of Health und dem Human Frontier Science Program unterstützt.

Weitere Informationen zur Forschung im Labor von Rohs finden Sie unter www.rohslab.org.

Darrin S. Joy