Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Un petit résumé des différentes méthodes et techniques utilisées montrent bien
l'avancée réalisée en une dizaine d'années. Elle est présentée dans le tableau
2.9. Commençant avec un nombre très limité de protéines,
les approches sont devenues plus complexes et plus sûres,
utilisant un nombre conséquent de résidus.
Toutefois, elles montrent aussi l'hétérogénéité des techniques
et par la suite nous verrons les difficultés que cela engendre quand on désire comparer entre eux ces
différents alphabets.
Equipe
Année
Nombre de protéines
Nombre d'acides aminés
Méthodes d'apprentissage
distance
Nombre de Blocs
Longueur des blocs
Unger et al.
1989
4 / 82
426 / 12973
k-means
RMSd C alpha
103
6
Rooman et al. 1990 75 12 978
regroupement hiérarchique RMSd C alpha 4 4,5, 6 et 7
Prestrelski et al. 1992 14 2 437 fonction distance linéaire et angle alpha 113 8
Zhang et al. 1993 74 13 114 autoANN distance C alpha 6 7
angles dièdres et de valence
Schuchhardt et al. 1996 136 24 239 carte
de Kohonen angles dièdres phi et psi 100 9
Fetrow et al. 1997 116 23 355 autoANN distance C alpha 6 7
angles dièdres et de valence
Bystroff et Baker 1998 471 NP k-means profil de séquence et RMSd / dma 13 structure : 3-15, séquence : 8
Camproux et al. 1999 100 19 317 CMC distance C alpha 12 4
Page 18