Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Initialisation Au-dessus: L'apprentissage Précédent: Principe de l'apprentisage

Mesure de similitude

La première mesure à effectuer est de savoir si deux fragments, ou un fragment et un bloc, sont proches structuralement. Pour calculer cette similitude, j'ai utilisé la différence moyenne entre les valeurs angulaires (ou RMSda pour root mean square deviations on angular values [175]). Il s'agit d'une distance euclidienne entre deux vecteurs V1and V2 :


\begin{displaymath}RMSda(\textbf{V}_1,\textbf{V}_2) =\sqrt\frac{\sum_{i=1}^{i=M-...
...phi_{i+1}(\textbf{V}_1) - \phi_{i+1}(\textbf{V}_2)]^2}{2(M-1)} \end{displaymath}

avec $\{\phi_i(\textbf{V}_1),\psi_{i+1}(\textbf{V}_1)\}
(resp.\hspace{0.1cm}\phi_i(\textbf{V}_2),\psi_{i+1}(\textbf{V}_2))$les séries de (2M-1) angles dièdres pour $\textbf{V}_1
(resp.\hspace{0.1cm}\textbf{V}_2)$. Les différences entre les angles sont calculées modulo 360o.

Ainsi, durant la phase d'apprentissage, cette mesure est utilisée pour calculer la similitude entre un fragment et les différents blocs protéiques. La distance minimale permet d'associer un fragment à un bloc protéique.


  
Figure 3.2: Schéma global sur la méthode d'apprentissage des blocs protéiques. En partant de la protéine, à gauche, sont représentés, la traduction de la structure protéique en angles dièdres, le tirage aléatoire d'un fragment protéique, puis le choix du bloc le plus proche structuralement, et enfin la deuxième phase où l'on recherche parmis les blocs ayant un RMSda faible, celui qui a le meilleur taux de transition par rapport au précédent fragment.
\begin{figure}
\centerline{\epsfxsize=15cm {\epsfbox{Images/Chapitre_3_PBs/app.PS}}}
\end{figure}




Page 46

(c) 2001- Alexandre de Brevern