Blocs Protéiques

Alexandre de Brevern - Thèse de Bioinformatique Moléculaire

Prochain: Un nombre important de Au-dessus: Les alphabets structuraux Précédent: Les alphabets structuraux

But

Les structures secondaires permettent une description structurale précise des deux structures périodiques que sont les hélices $\alpha$ et les feuillets $\beta$ (cf. paragraphe 2.1.2.1). Toutefois, la classification à l'aide des structures secondaires laisse un peu plus de 50% des structures protéiques non attribuées (les boucles). La description structurale est finalement assez limitée. La construction de bibliothèques de boucles définies par rapport aux structures répétitives apporte une aide dans l'approximation de la structure et permet d'établir des classifications utilisables dans des méthodes de prédiction [44,204]. Les boucles de taille supérieure à 8 ne sont cependant jamais prises en compte dans ces approches. La reconstruction à partir de la seule information des structures secondaires ne permet pas une reconstruction du repliement 3D.

Aussi, de nombreuses études ont été menées pour tenter de catégoriser et de classifier des fragments protéiques de petites tailles (inférieures à 20 acides aminés) représentatifs des protéines présentes dans les bases de données de structures cristallographiées, la PDB. Les différentes méthodes présentées ici cherchent à examiner des successions de quelques acides aminés, les structures statistiquement répétées les plus courantes, pour décrire au mieux l'ensemble des repliements des structures protéiques.

Le travail précurseur de Jones et Thirup doit-être noté ici. Ils ont reconstruit une protéine de liaison au rétinol avec des fragments structuraux tirés de 3 protéines ayant peu d'homologie de séquence. Ce travail se basait sur l'étude d'une carte de densité électronique [99]. Depuis, deux approches assez distinctes se trouvent dans la littérature. La première cherche un nombre important de prototypes, une centaine pour représenter au mieux les protéines [198,146,200,175]. La seconde recherche un nombre plus limité de prototypes, normalement inférieur à une vingtaine, afin de permettre leur utilisation dans des méthodes de prédiction plus fiables [162,163,53,19,23,24]. Je parlerai de blocs structuraux ou parfois de blocs protéiques dans cette partie, les notions étant équivalentes et correspondant toujours aux petits prototypes, nommés Buildings blocs (BB) par Unger et collaborateurs [198], Short Structural Motifs (SSM) par Unger et Sussman [200], Substructure par Prestrelski et collaborateurs [146], Local Structural Motifs (LSM) par Schuchhardt et collaborateurs [175], Recurrent Local Structural Motifs (RLSM) par Rooman et collaborateurs [162,163], Structural Buildings blocs (SBB) par Fetrow et collaborateurs [53], Local Structure (LS) par Bystroff et Baker [19], et les Short Structural Building blocs (SSB ou SSBB) de Camproux et collaborateurs [23,24].

Dans les pages qui vont suivre, je vais présenter les différentes études qui ont été menées à l'heure actuelle en développant la méthodologie et les résultats propres à chaque équipe. Avec dans un premier temps, les études sur des nombres de blocs importants (plus de 100), ensuite ceux sur les nombres faibles de blocs (entre 4 et 13), puis enfin le travail du groupe de Baker, qui est plus complexe.

Prochain: Un nombre important de Au-dessus: Les alphabets structuraux Précédent: Les alphabets structuraux

Page 26