Frage:
Wie viele menschliche Proteine ​​haben eine gelöste 3D-Struktur?
Gergana Vandova
2011-12-23 10:27:46 UTC
view on stackexchange narkive permalink

Ich habe mich gefragt, wie viele menschliche Proteine ​​eine gelöste 3D-Struktur haben. Gibt es eine Datenbank mit nur menschlichen Proteinen? Ich habe mir pdb angesehen, aber keinen Filter gefunden.

Ich denke, Sie werden viele Probleme mit Redundanz haben, besonders wenn Sie die Anzahl der einzigartigen Proteine ​​wissen wollen.
@GWW Ich denke, dass das Schreiben eines kleinen Skripts die Redundanz beseitigen kann.
Möglicherweise haben Sie besseres Glück, wenn Sie diese Frage auf [biostar] (http://biostar.stackexchange.com) stellen.
Beachten Sie, dass "gelöst" sehr subjektiv ist. Nicht alle Strukturen sind von hoher Qualität, und einige von ihnen sind aufgrund experimenteller Fehler einfach falsch.
Dies ist aus zwei Gründen eine sehr thematische Frage: Die Proteindatenbank akzeptiert NMR- und Kristallstrukturen von Proteinen, die unterschiedliche Auflösungs- und Genauigkeitsgrade bieten. Diese Strukturen sind auch etwas subjektiv, da das Protein abhängig von seinem relevanten biologischen Kontext unterschiedliche Konformationen annehmen kann. Drittens können die Lösungsmittelextraktionen eine fehlerhafte Struktur auferlegen.
Viele dieser Proteine ​​haben nur eine oder zwei Domänen, die als Strukturen gelöst sind. tierische Proteine ​​sind so schwer. dort wird diese frage imho etwas schwierig.
Vier antworten:
#1
+19
Michael Kuhn
2011-12-23 17:17:45 UTC
view on stackexchange narkive permalink
6405 Proteine, die nach Ensembl auf 5220 Gene kartiert sind.

In Ensembls BioMart können Sie die PDB-ID als externe Referenz auswählen. Exportieren Sie die Ergebnisse und zählen Sie die eindeutigen Proteine ​​/ Gene mit einer PDB-ID.

#2
+12
Aleksandra Zalcman
2012-01-15 06:06:53 UTC
view on stackexchange narkive permalink

PDB ist eine gute Quelle für die Beantwortung solcher Fragen, da Sie damit die Ergebnisse nach vielen zusätzlichen Parametern filtern können. So zählen und extrahieren Sie 3D-Strukturen menschlicher Proteine:

  1. Öffnen Sie die Registerkarte Erweitert auf der PDB-Website.
  2. Wählen Sie Biologie -> Quellorganismus aus dem Menü.
  3. Geben Sie Homo sapiens (human) ein.
  4. Sie können die Redundanz durch reduzieren Aktivieren von Entfernen ähnlicher Sequenzen bei n% Identität unten.
  5. Abfrage senden.
  6. ol>

    Um weitere Filter hinzuzufügen, klicken Sie auf Abfrage verfeinern mit Erweiterte Suche . Dort können Sie Strukturen nach Ablagerungsdatum, Qualität (z. B. Auflösung oder R-Faktoren für durch Röntgenbeugung gelöste Strukturen), Liganden, Enzymklassifizierung usw. extrahieren (indem Sie Suchkriterien hinzufügen aktivieren) / p>

    Suche nach menschlichen Proteinen mit Entfernung von Homologen mit 90% Identitäts-Cutoff ruft 7117-Strukturen ab. Die Anzahl der Röntgenproteinstrukturen guter Qualität (Auflösung < 2.5A) beträgt derzeit 3964 (mit demselben Identitätsgrenzwert).

    Sie können dann die abgerufene Liste herunterladen oder benutzerdefinierte Berichte erstellen (Menüs unten).

    Ein gutes Tool (auch von PDB verwendet) zum Generieren nicht redundanter Proteindatensätze ist cd-hit.

#3
+3
GWW
2011-12-23 10:45:18 UTC
view on stackexchange narkive permalink

Aus Ihren Kommentaren geht hervor, dass Sie das Schreiben einiger benutzerdefinierter Skripte nicht ablehnen. Eine Option wäre daher, die NCBI-Strukturdatenbank zu nutzen. Sie können es nach Organismus filtern und dann die Ergebnisse als Textdatei / XML herunterladen. Wenn Sie Zugriff auf die PDB-Rohdaten benötigen, können Sie das PDB-Archiv herunterladen und die Daten in Ihrer gefilterten Liste untersuchen.

#4
  0
PDB annotator
2015-04-19 10:53:55 UTC
view on stackexchange narkive permalink

Das neue Suchsystem von PDBe wurde entwickelt, um genau solche Fragen zu beantworten. http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules

zeigt, dass es 6964 einzigartige menschliche Makromoleküle mit Strukturdaten im PDB gibt.

Natürlich werden viele Fragmente von Proteinen sein und nicht das gesamte Molekül.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...