Pangenomweite Vorhersage der Genfunktion
Über dieses Projekt
Mit dem Aufkommen der Hochdurchsatz-Sequenzierung ist es möglich geworden, die Genomsequenz von Hunderten von Bakterienisolaten mit begrenzten Kosten zu erhalten. Wir wissen heute, dass sich bei Arten wie E. coli einzelne Stämme in ihrem Gengehalt um bis zu 60 % unterscheiden. Es ist bekannt, dass die Gene mit geringem Erhaltungsgrad, auch akzessorische Gene genannt, zum Überleben in spezialisierten Nischen beitragen; für viele von ihnen ist jedoch nicht einmal eine umfassende funktionelle Charakterisierung verfügbar, wobei die Aussichten für Mitglieder des menschlichen Mikrobioms noch schlechter sind. Chemische Genomikansätze können verwendet werden, um die Funktionen dieser Gene zu rekonstruieren, sind aber aus Kosten- und Arbeitsgründen auf einige Dutzend Arten beschränkt. Wir verwenden computergestützte Ansätze wie maschinelles Lernen, das auf der Fülle der für Modellorganismen verfügbaren Daten trainiert wurde, und nutzen aus Nukleotidsequenzen extrahierte Merkmale, um die derzeitigen Methoden zur Funktionsvorhersage zu verbessern.
