Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Dans ce chapitre, nous présentons une nouvelle approche de compactage des structures 3D des protéines, labellée méthode de la protéine hybride (MPH). L'objectif de MPH répond à un problème lié aux principes même des méthodes de classification. Dans une méthode de classification par partition type nuées dynamiques ou carte de Kohonen, le nombre de classes est fixé, et ces classes sont disjointes. La proximité entre les classes obtenues ne peut être vu qu'a posteriori. Les chaînes de Markov Cachées [149] sont une alternative à ce type de problème, toutefois, elles se basent sur la donnée des lois a priori des observations, ce qui est génant quand les lois appropriées ne sont pas connues. Appliqué à notre recherche, cela revient à considérer indépendant chacun des blocs, alors qu'une continuité existe entre un bloc y et un bloc y'. Le principal intérêt de MPH sera de mettre directement en relation les groupes pour tenir compte de la continuité. Le réseau discontinu (cf. chapitre 5) nous a démontré que des séries de blocs protéiques existent, avec MPH, nous allons observer des séries "floues" de blocs protéiques et ainsi analyser si des séries telles que, par exemple, uvwxyz et uv'wxy'z sont réelleement distinctes. Avoir un alphabet structural plus long (des séries de blocs protéiques) et plus "flou" (uvwxyz==uv'wxy'z), nous permetterait en effet d'avoir des séries équivalentes plus nombreuses, donc de réduire par la suite le nombre de fragments à utiliser pour des méthodes de recherche d'homologie structurale ou d'enfilage.
(c) 2001- Alexandre de Brevern