Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Prédiction bayésienne simple Au-dessus: Prédiction de la structure Précédent: Prédiction de la structure

   
Objectif

L' alphabet structural défini permet d'analyser de manière fine la structure tridimensionnelle des protéines (cf. paragraphe 3, "Apprentissage de la structure locale du squelette protéique"). La répartition en acides aminés dans chaque bloc montre une forte spécificité (cf. paragraphe 3.3.4); cette information paraissant pertinente, nous allons l'utiliser directement dans une méthode de prédiction de la structure locale à partir de la séquence.

La prédiction a été effectuée avec une méthode bayésienne proche de celle utilisée pour la prédiction des structures secondaires [193], de l'accessibilité au solvant [192] et de modèles plus théoriques d'analyse des modes biologiques [117].

Dans un second temps pour améliorer le taux de prédiction nous avons pris en compte le fait que différentes séquences peuvent être liées à un même type de repliement (1 bloc protéique $\rightarrow$ n séquences). Enfin deux stratégies ont été développées pour proposer en fonction d'un taux de prédiction moyen un certain nombre de blocs potentiels. En effet, un type de séquence n'est pas toujours associé au même type de repliement (1 séquence $\rightarrow$ n blocs protéiques). Ces derniers travaux se basent principalement sur un indice entropique tenant compte de la qualité de la prédiction locale.

Il convient de noter que pour définir la méthode de prédiction, nous avons décidé d'utiliser une méthode statistique simple qui permet de comprendre quels acides aminés sont importants pour chaque type de structures. Il est certain que les réseau neuronaux donnent des résultats meilleurs, mais en contrepartie, il est peu aisé de comprendre comment ils ont "appris". Aussi, une approche de type bayésienne est particulièrement apropriée.




Page 76

(c) 2001- Alexandre de Brevern