Le pari du DECRYPTHON

Avec la participation de près de 75 000 PC, la première étape de l'opération Décrypthon s'est achevée avec succès en 2002.

Grâce à nous, les internautes, des milliards de calculs complexes qui étaient prévus sur 3 mois (et même en 1170 ans sur un seul ordinateur !) ont pu être menés à bien en moins de 2 mois, avec la solution de calcul distribué mise en oeuvre par IBM et Génomining.

Cette base de données réalisée par l'AFM, et ses partenaires est désormais mise gracieusement à la disposition de la communauté scientifique internationale sur le site Internet du centre de ressources Infobiogen (centre national pour la recherche, le développement et l'exploitation de l'informatique appliquée à la génomique) :www.infobiogen.fr/services/decrypthon/indexl

Elle a été la plus exhaustive jamais réalisée sur les protéines du monde du vivant : 550 000 comparaisons de protéines issues de plus de 76 génomes différents, 2 189 278 fichiers de résultats bruts répartis en 17 000 répertoires, soit l'équivalent d'une bibliothèque de plus de 25 000 volumes !

Son exploitation a commencé à permettre aux chercheurs de progresser plus rapidement dans la compréhension des maladies génétiques et des maladies rares et dans le développement de nouvelles thérapeutiques.

Si vous souhaitez être personnellement tenu au courant des développements scientifiques de l'opération rendez-vous sur le site : (http://www.telethon.fr


Dernières news du projet décrypthon
En 2004, l'AFM, IBM et le CNRS ont décidé de lancer un nouveau projet ambitieux : la mise au point d'une plate-forme de grid-computing disponible pour 3 ans de plusieurs programmes scientifiques. Le démarrage effectif des phases de calcul est prévu début 2005.

Cette plateforme de calculs partagés entre ordinateurs doit permettre d'accélérer le développement des connaissances dans le cadre de la biologie et plus particulièrement celles des maladies neuromusculaires.

Les internautes individuels ne seront pas sollicités pour les deux premiers projets scientifiques retenus...

Réaction représentative d'un internaute
J'ai aussi participé avec passion au Décrypthon 2003...
... Contrairement aux engagements pris de poursuivre l'expérience en 2004, je n'ai reçu aucune nouvelle au cours de cette année !
Je crains de plus en plus les chèques en blanc fournis aux chercheurs, pour obtenir des moyens supplémentaires, quand ceux mis gratuitement à disposition ne sont pas utilisés.
Cela procède pour moi du gaspillage !
Les gens qui m'ont élevé l'ont fait dans le souci d'éviter le gaspillage, qui disaient-ils : "est l'apanage des nantis".
C'est pour cela que cette année, je n'ai pas donné à l'occasion de la grand messe médiatique.
Je tiens à donner pour aider les victimes de cette effroyable maladie, pas pour subventionner la recherche française, et donner du travail ou de nouveaux ordinateurs à ses chercheurs. Il y a un ministère pour cela !


Novembre 2006 - Le projet Carbone arrive sur la grille
Le projet de Docking/Modeling moléculaire (ou étude de l'assemblage/modélisation des molécules) de A Carbone et coll. (INSERM U511 et 582, LIP6 - UMR CNRS 7606 et CNRS UPR 9080, Université Pierre et Marie Curie, Paris VI) va rejoindre le « World Community Grid », pour utiliser la formidable puissance de calcul développée dans ce programme.
L'objectif est d'effectuer la modélisation des interactions protéine/protéine, protéine/ADN des milliers de protéines dont la structure en 3 dimensions (3D) est connue, et disponible dans la base de données GDB . Dans un premier temps, les recherches concerneront l'étude de 168 protéines dont les interactions sont connues. Cette première phase, qui a été estimée à 13 siècles sur un PC de 2 Giga Hertz devrait durer 4 ou 5 mois sur la grille WCG. Elle doit permettre la validation d'un algorithme visant à diminuer la zone de recherche des interactions protéiniques, et ainsi restreindre le nombre de calculs nécessaires à leur détermination. Si l'algorithme fonctionne, et cela fera l'objet d'une analyse une fois les premiers résultats obtenus, l'équipe Carbone devrait pouvoir traiter dans un deuxième temps environ de 4000 protéines. L'activité d'une molécule dépend de sa structure en 3 D et de ses interactions avec les autres molécules. Pour comprendre l'activité biologique des molécules qui interagissent entre elles, et si possible la modifier, il faut d'abord identifier leur structure en 3D, mais aussi le nombre d'atomes qui la composent et la nature de chaque molécule, les régions où s'effectuent les interactions et leur mécanisme à l'échelon atomique.
Les méthodes de « Docking ou Modeling moléculaire » sont des méthodes théoriques de calcul de modélisation du comportement des molécules et de leurs interactions. Ces méthodes permettent d'explorer la structure de systèmes biologiques, tel que le repliement des molécules sur elles-mêmes ou leur structure en 3D, et leurs interactions à l'échelon des atomes (qui sont les plus petites unités de la matière). Des modèles mathématiques sont utilisés pour définir, en fonction de caractéristiques physico-chimiques, les forces ou interactions (par exemple des liaisons chimiques) qui s'établissent entre les atomes. A partir de molécules dont la structure est connue, des séries successives d'études des interactions sont produites, et des scores attribués aux liaisons prédites. Les liaisons étudiées pourraient se comparer à la correspondance entre une serrure et une série de clefs ou une main et une série de gants. Une seule molécule étant constituée de centaines d'atomes, l'étude des liaisons entre deux ou plusieurs molécules suppose des dizaines ou des centaines de milliers de calculs.
Pour la plupart des molécules et en particulier pour les protéines dont sont faits les êtres vivants, les propriétés physico-chimiques et biologiques sont inconnues.
Le séquençage de différents génomes, dont celui de l'homme, a permis l'identification d'un grand nombre de protéines jusque-là inconnues. Même pour les molécules dont on connaissait certaines propriétés, les éventuelles interactions avec d'autres molécules que celles impliquées dans les processus connus, sont inconnues.