Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
L'objectif principal de cette thèse est l'élaboration et l'utilisation d'un alphabet structural dans une méthode de prédiction à partir de la séquence. Dans cette première partie de ma thèse, je développerai donc la méthode d'apprentissage des Blocs Protéiques (BPs). Ils permettent une description statistiquement représentative des conformations d'un ensemble de résidus consécutifs. Différent aspects de leur validation sur un plan structural seront détaillés. Dans le chapitre suivant, je développerai l'approche mise en place pour la prédiction locale de ces blocs à partir de la séquence.
Pour résumer ce chapitre, une nouvelle méthodologie a été mise au point pour obtenir un alphabet structural protéique. Elle se base sur les angles dièdres du squelette polypeptidique et procède par un apprentissage en deux étapes; une première non supervisée et une seconde qui tient compte des transitions qui existent entre blocs protéiques, d'une manière similaire à la technique des Chaînes de Markov Cachées (CMC) [149]. Ces blocs ont été conçus pour assurer une bonne approximation de la structure protéique. J'ai donc testé différentes séries ayant des nombres variables de blocs protéiques. La série qui a été conservée est celle dont le nombre de blocs protéiques répond au mieux à l'approximation de la structure protéique et à un taux de prédiction à partir de la séquence correct.
(c) 2001- Alexandre de Brevern