Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Les structures secondaires permettent une description structurale
précise des deux structures périodiques que sont les hélices et
les feuillets
(cf. paragraphe 2.1.2.1).
Toutefois, la classification à l'aide des structures secondaires laisse un peu plus de 50%
des structures protéiques non attribuées (les boucles).
La description structurale est finalement assez limitée.
La construction de bibliothèques de boucles
définies par rapport aux structures répétitives
apporte une aide dans l'approximation de la structure et permet
d'établir des classifications utilisables dans des méthodes de prédiction [44,204].
Les boucles de taille supérieure à 8 ne sont cependant jamais prises
en compte dans ces approches. La reconstruction à partir
de la seule information des structures secondaires ne permet pas
une reconstruction du repliement 3D.
Aussi, de nombreuses études ont été menées pour tenter de catégoriser et de classifier des fragments protéiques de petites tailles (inférieures à 20 acides aminés) représentatifs des protéines présentes dans les bases de données de structures cristallographiées, la PDB. Les différentes méthodes présentées ici cherchent à examiner des successions de quelques acides aminés, les structures statistiquement répétées les plus courantes, pour décrire au mieux l'ensemble des repliements des structures protéiques.
Le travail précurseur de Jones et Thirup doit-être noté ici. Ils ont reconstruit une protéine de liaison au rétinol avec des fragments structuraux tirés de 3 protéines ayant peu d'homologie de séquence. Ce travail se basait sur l'étude d'une carte de densité électronique [99]. Depuis, deux approches assez distinctes se trouvent dans la littérature. La première cherche un nombre important de prototypes, une centaine pour représenter au mieux les protéines [198,146,200,175]. La seconde recherche un nombre plus limité de prototypes, normalement inférieur à une vingtaine, afin de permettre leur utilisation dans des méthodes de prédiction plus fiables [162,163,53,19,23,24]. Je parlerai de blocs structuraux ou parfois de blocs protéiques dans cette partie, les notions étant équivalentes et correspondant toujours aux petits prototypes, nommés Buildings blocs (BB) par Unger et collaborateurs [198], Short Structural Motifs (SSM) par Unger et Sussman [200], Substructure par Prestrelski et collaborateurs [146], Local Structural Motifs (LSM) par Schuchhardt et collaborateurs [175], Recurrent Local Structural Motifs (RLSM) par Rooman et collaborateurs [162,163], Structural Buildings blocs (SBB) par Fetrow et collaborateurs [53], Local Structure (LS) par Bystroff et Baker [19], et les Short Structural Building blocs (SSB ou SSBB) de Camproux et collaborateurs [23,24].
Dans les pages qui vont suivre, je vais présenter les différentes études qui ont été menées à l'heure actuelle en développant la méthodologie et les résultats propres à chaque équipe. Avec dans un premier temps, les études sur des nombres de blocs importants (plus de 100), ensuite ceux sur les nombres faibles de blocs (entre 4 et 13), puis enfin le travail du groupe de Baker, qui est plus complexe.
(c) 2001- Alexandre de Brevern