Alexandre de Brevern - Thèse de Bioinformatique Moléculaire
Partant d'un nombre particulièrement important de B (= 34) blocs protéiques, nous avons décidé de réduire leur nombre pour posséder différentes séries ayant des nombres de blocs protéiques variables. Ces BPs seront utilisés pour la prédiction. Pour définir les blocs à éliminer, nous avons décidé d'éliminer les blocs ayant de trop proches voisins. Pour définir le fait que 2 BPs sont proches, deux critères ont été utilisés. Tout d'abord, le fait qu'ils soient proches structuralement, ensuite que leurs transitions soient à peu près identiques. Pour cela, il suffit de calculer le RMSda des B PBs pris deux à deux, et de sélectionner les couples dont le RMSda est inférieur à une valeur définie. Ensuite, il suffit de faire une différence entre les fréquences de transition des deux PBs et si celle-ci est faible, cela veut dire qu'en effet les deux blocs sont pratiquement équivalents. Le bloc protéique le moins peuplé est alors éliminé. Ayant réduit le nombre de blocs, il suffit de recommencer l'apprentissage avec le nouvel ensemble de blocs. Le processus s'arrête quand plus aucun bloc ne peut être éliminé avec les critères définis.
(c) 2001- Alexandre de Brevern