Site : http://www.sysfera.com
Accueil
Vous êtes ici : Accueil > Applications > Bio-informatique > BLAST

BLAST

Partenaire

Logo LPC

Site Web :

Contexte

BLAST est une application de bio-informatique répandue utilisée pour trouver les similarités entre les séquences de nucléotides et celles des acides aminés. L'objectif d'une telle recherche est de trouver des indices sur une fonction d'un gène ou d'une protéïne inconnue. Les nouvelles séquences sont comparées aux séquences stockées dans de grandes bases de données biologiques qui peuvent contenir des annotations au sujet de leurs fonctions ainsi que les références bibliographiques correspondantes.

Cas d'utilsation

L'application BLAST de SysFera-DS a été conçu pour gérer des milliers de requêtes BLAST sur de grandes bases de données. Nous avons validé cela en soumettant 40.000 requêtes sur 5 bases de données de différentes tailles (de 1 à 5GB). Chaque requête est soumise de façon asynchrone à la plate-forme. SysFera-DS sélectionne les nœuds de calcul en utilisant un algorithme d'ordonnancement. Nous avons testé quatre politiques d'ordonnancement différentes : un simple algorithme glouton, un MCT, un SRA et un SRA dynamique.

Contribution

  • Expériences sur la plate-forme Grid'5000 mettant en oeuvre 1.000 nœuds de calcul obtenant les résultats pour 40.000 requêtes en quelques minutes.
  • Un gain de 30% en temps a été obtenu avec l' lgorithme dynamique SRA.

Fiche technique

Type Valeur
Code Parallèle sur des systèmes SMP
Consommation CPU Moyen
Consommation E/S Fort
Consommation mémoire Fort
Ordonnanceur optimisé Oui
Client/Server SysFera-DS Disponible
Déploiement
Grid'5000

 

References

  • V. Breton, E. Caron, F. Desprez, G. Le Mahec. High Performance Data Management and Scheduling for BLAST Applications over the Grid - From Parallel Algorithms to Middleware Issues. Handbook of Research on Computational Grid Technologies for Life Sciences, Biomedicine and Healthcare. Mario Cannataro, University Magna Graecia of Catanzaro, Italy (editor) - Publisher : Information Science Reference. 2009.
  • E. Caron, F. Desprez et G. Le Mahec. Parallelization and Distribution Strategies of Large Bioinformatics Requests over the Grid. Proceedings of ICA3PP’2008, LNCS. International Conference on Algorithms and Architectures for Parallel Processing 2008 : Cyprus - June 9-11 2008.


 

Produits

En savoir plus sur nos produits

Cliquez ici

Tweets récents de @SysFera

Derniers tweets à propos de #HPC