Frage:
Was sind die limitierenden Faktoren für die Genlänge und die Anzahl der Exons?
Daniel Standage
2011-12-15 04:11:58 UTC
view on stackexchange narkive permalink

Ich habe kürzlich Genanmerkungen für Homo sapiens von Ensembl für eine bioinformatische Analyse heruntergeladen. Die überwiegende Mehrheit der Genanmerkungen hat 20 Exons oder weniger, obwohl es einige gibt, die bis zu 250 haben. Ich weiß genug über Genanmerkungen, um diese Vorhersagen mit einem Körnchen Salz zu treffen, aber ich habe darüber nachgedacht ... was sind die biologisch relevanten Faktoren, die die Länge, Exonzahl usw. eines Gens einschränken könnten? Gibt es eine echte Möglichkeit für ein Gen, 50 Exons zu haben? 100 Exons? 250 Exons? Wo wird aus biologischer Sicht die Linie gezogen und warum?

Wie haben Sie die Annotationen zu Genen / Exons abgerufen? BioMart oder EnsEMBL API?
Ich habe die komprimierten (gzip) GTF-Dateien direkt von der FTP-Site mit wget erhalten.
Die EnsEMBL Perl-API ist eine coole Möglichkeit, die genauen Daten abzurufen, die Sie benötigen - http://www.ensembl.org/info/docs/api/index.html
Drei antworten:
#1
+10
user49
2011-12-15 04:43:37 UTC
view on stackexchange narkive permalink

Diese Frage fällt fest in den Schoß der molekularen Evolution und in die Einschränkungen, die den Genen durch die Kräfte der Mutation, Selektion, Drift und Rekombination auferlegt werden.

Es gibt zahlreiche Situationen, insbesondere die Duplikation von Genen kann zu einem Gen führen, das frei von den selektiven Einschränkungen seines Elternteils ist, von denen viele infolge stochastischer Prozesse so viele schädliche Mutationen ansammeln, dass sie nicht mehr funktionieren, z Pseudogene. Einige können verändert und neu angeordnet werden, wobei Exons und Introns akkumulieren, und wenn sie auf einen Fitnessvorteil für den Organismus schließen, können sie zur Fixierung innerhalb einer Population verschoben werden.

Evolution ist ein populationsgenetischer Prozess, und es gibt viele Variablen, die das Ergebnis beeinflussen können, nicht zuletzt den Unterschied in der Populationsgröße. Die Genome größerer Populationen (wie die von Bakterien) scheinen viel kleinere Genome und natürlich keine (zumindest nicht spliceosomalen) Introns zu haben, möglicherweise als Folge einer erhöhten Fitness aufgrund der verkürzten Generationszeit eines Organismus mit mehr schlankes Genom. Es wäre eine gute Idee, The Origins of Genome Architecture von Michael Lynch zu lesen, da ich denke, er beantwortet Ihre Fragen besser als ich.

Viele der Gene, die Sie von EnsEMBL abrufen, verfügen natürlich über experimentelle Beweise, um sie zu unterstützen. Die Gene, die in der Pipeline vorhergesagt werden, können mit weniger Sicherheit betrachtet werden, aber Sie können natürlich die Ausrichtung mit eng verwandten Arten betrachten, um festzustellen, ob Sie der Meinung sind, dass die Introns / Exons tatsächlich lebensfähig sind. Ein Beispiel für ein Gen mit 79 Exons ist das Dystrophin (DMD) -Gen, das mit 2.217.347 bp am längsten annotierte Gen (siehe Roberts et al., 1993 und Nishio et al., 1994 ).

#2
+3
user59
2011-12-15 04:49:47 UTC
view on stackexchange narkive permalink

Ich bezweifle, dass es wirklich eine direkte Einschränkung gibt. Der beste Test wäre zu überprüfen, ob die Größe übereinstimmt, d. h. dass ein 1 kbp-Gen mit 100 Exons lieber viel zu kurze Introns haben müsste.

Schnelle Suche über NCBI-Gene zeigt sogar ein 317-Exon-Gen, obwohl all diese Randfälle einige unklare Geschwister von Titin zu sein scheinen, die für sich genommen nur riesig sind.

Wenn man über die Qualitätskontrolle von Annotationen spricht, muss man über die molekularen Einschränkungen der Größe eines Exons oder Introns nachdenken. Die (theoretische) Mindestlänge eines Exons müsste 1 bp betragen, obwohl man auch über die Bindung molekularer Maschinen nachdenken müsste, die an der Erkennung von Exon-Intron-Grenzen und dem Spleißen benachbarter Exons beteiligt sind. Ich sollte denken, dass Exons von weniger als 6 bp wahrscheinlich nicht als funktionell angesehen werden würden. Siehe http://www.jbc.org/content/270/6/2411.full und http://mbe.oxfordjournals.org/content/23/12/2392.full
#3
+3
shigeta
2011-12-15 05:11:02 UTC
view on stackexchange narkive permalink

Ich stimme zu, dass mbq - titan das längste Gen ist, das ich kenne, und es hat weit über 100 Exons. Titin und Dystrophin sind genetisch gut charakterisiert und keine Vorhersagen. Titin ist der Champion Exoner mit 363 Exons.

Es sind nur solche Beispiele, die es den Genprädiktoren ermöglichen, so lange zu laufen, wie sie meiner Meinung nach heuristisch gekürzt werden, um den bekannten Genstrukturen / Längen / Übergängen usw. zu ähneln.

Dystrophin ist das längste Gen, codiert aber nicht das längste Produkt, das natürlich Titin ist. 363 Exons sind eine Hölle der Zahl! Lol :)


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...