Alexandre de Brevern - Thèse de Bioinformatique Moléculaire


Prochain: Conclusion de l'apprentissage Au-dessus: Application au compactage des Précédent: Similitude des sites de

Etude de l'influence des paramètres de l'apprentissage

L'influence des différents paramètres utilisés lors de l'apprentissage a été analysée :

(i)
la longueur de la protéine hybride N = 100 a été choisie pour obtenir une caractérisation correcte des structures locales. Avec N > 100, certains sites auraient été fort peu peuplés, et pour N < 100, le nombre de structures locales mal approximées aurait augmenté fortement.

(ii)
le coefficient d'apprentissage $\alpha_{0}$ contrôle à la fois la qualité et la vitesse de l'apprentissage. $\alpha_{0}$ pris égal à 0,10 permet de diminuer l'importance de l'initialisation, le système étant bousculé fortement pendant les premiers cycles d'apprentissage. L'utilisation d'une valeur plus faible et plus classique permet un apprentissage plus rapide mais moins sûr.

(iii)
Le résultat de la protéine hybride n'est pas fortement modifié par le tirage des fluctuations aléatoires $\epsilon_i$ et du coefficient $\tau$. Un léger décalage de la protéine hybride est souvent observé.

(iv)
La valeur du nombre de cycles C est définie par l'utilisateur. En pratique, ce nombre est déterminé en se basant sur le fait que plus aucun changement notable n'est observé pendant l'apprentissage au delà d'un certain nombre de cycles. Dans la pratique, les 5 premiers cycles déterminent l'apprentissage dans les grandes lignes.

En conclusion, l'influence des paramètres est relativement mineur. La séquentialité qu'implique les blocs protéiques et la présence de structures comme les structures répétives et leurs entrées et sorties permettent d'obtenir des résultats stables.




Page 128

(c) 2001- Alexandre de Brevern