Protein data bank (PDB) : 46818 structures (oct 2007) SCOP (Structural Classification Of Proteins): • 971 folds (major structural similarity) • 1586 super-families (probable common evolutionary origin) • 3004 families (clear evolutionary relationship, ~ 30% identity) Nearly all folds are known (?) But 5 millions known protein sequences (trEMBL) -> needs for structure prediction Protein structure prediction
24
Embed
Protein data bank (PDB) : 46818 structures (oct 2007) SCOP (Structural Classification Of Proteins): 971 folds (major structural similarity) 1586 super-families.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Protein data bank (PDB) : 46818 structures (oct 2007)
QuickTime™ et undécompresseur TIFF (non compressé)sont requis pour visionner cette image.
A) La quantification des similarités des paires de structures (comparaison «~tout contre tout~») donne la position d'une structure dans un espace abstrait de hautes dimensions. La hauteur des pics reflète la densité de population de repliements, les axes horizontaux sont les axes des deux premiers vecteurs propres (i.e. associés aux deux plus grandes valeurs propres), l'axe vertical donne le nombre de repliements. La distribution des architectures est donnée par la projection sur le plan (la proximité sur ce plan donne une indication sur la similarité structurale entre 2 protéines)
B) 40% de tous les domaines connus sont couverts par 16 classes de repliements. Ces 16 repliements sont montrés ici sous forme de diagrammes topologiques de structures secondaires dans la classe de leur attracteur (le numéro d'attracteur est le même que dans la figure A).
Figures tirées de Holm et Sander (1996) "Mapping the protein universe"