article sur le Bio-informatique, Explication sur le Bio-informatique

Bio-informatique Article, Signification, Explication

      

On regroupe sous le terme de bio-informatique toutes les applications informatiques appliquées à la biologie. Cela va de l'analyse du génome à la modélisation de l'évolution d'une population animale dans un environnement donné, en passant par la modélisation moléculaire, l'analyse d'image, le séquençage du génome, la reconstruction d'arbres phylogénétiques...

(NOTE: L'orthographe bioinformatique, sans trait d'union, est erronée et est calquée de l'anglais bioinformatics.)

Table of contents
1 L'analyse de séquence
2 La modélisation moléculaire
3 Construction d'arbres phylogénétiques
4 La modélisation de population
5 Liens externes

L'analyse de séquence

Alors que de plus en plus de séquences de génome, de transcriptome ou de protéome sont disponibles, la signification de la plupart de ces séquences reste à comprendre. La première difficulté a été d'organiser cette énorme masse d'information et de la rendre disponible à l'ensemble de la communauté des chercheurs. Cela a été rendu possible grâce à différentes bases de données, accessibles en lignes, comme SwissProt, PDB, genBank... (cf. liens en fin d'article).

Il faut ensuite développer des outils d'analyse de séquences afin de pouvoir déterminer leurs propriétés.

  • Recherche de protĂ©ines Ă  partir de la traduction de sĂ©quences nuclĂ©iques connues. Celle-ci passe par la dĂ©termination des phases ouvertes de lecture d'une sĂ©quence nuclĂ©ique et de sa ou ses traduction(s) probables.
  • Recherche de sĂ©quences dans une banque de donnĂ©es Ă  partir d'une autre sĂ©quence ou d'un fragment de sĂ©quence. La technique la plus commune est le BLAST.
  • '\'Alignement de sĂ©quences'' : pour trouver les ressemblances entre deux sĂ©quences et dĂ©terminer leurs Ă©ventuelles homologies. Les alignements sont Ă  la base de la construction de parentĂ©s suivant des critères molĂ©culaires, ou encore de la reconnaissance de motifs particuliers dans une protĂ©ine Ă  partir de la sĂ©quence de celle-ci.

La bio-informatique intervient aussi dans le séquençage, avec par exemple l'utilisation de puces à ADN ou biopuce.

La modélisation moléculaire

Les molécules de par leurs dimensions sont invisibles à tout moyen d'investigation direct tel que la microscopie. C'est par l'analyse de données indirectes que les chercheurs peuvent reconstituer un modèle moléculaire, c'est-à-dire une construction intellectuelle présentant la meilleure adéquation avec les résulats expérimentaux. Ces données sont issues principalement d'analyses cristallographiques (étude des figures de diffraction des rayons X par un cristal), ou de Résonance Magnétique Nucléaire. Elles représentent les contraintes expérimentales exercées sur le modèle. Le modèle moléculaire obtenu ensuite est un ensemble de coordonnées atomiques dans l'espace. L'informatique intervient dans toutes les étapes conduisant de l'expérimentation au modèle, puis ensuite dans l'analyse du modèle par la visualisation moléculaire (voir les protéines en 3D).

Elle est utilisée par exemple pour étudier par exemple les sites actifs d'une enzyme, mettre au point informatiquement une série d'inhibiteurs possibles pour cette enzyme, et ne synthétiser et ne tester que ceux qui semblent convenir. Cela permet de réduire les coûts de recherche et d'accélérer ces recherches.

La visualisation de la structure tridimensionnelle d'acides nucléiques (ARN et ADN) fait également partie de la palette des outils bio-informatiques très utilisés.

Il y a aussi la dynamique moléculaire, on essaye de voir le comportement d'une molécule dans son milieu en modélisant les différents champs de force entrant en jeu (force de van der Waals, etc.).

Encore un autre aspect est la prédiction de la structure 3D d'une protéine à partir de sa séquence primaire (la liste des acides aminés qui la composent), en modélisant les différentes caractéristiques des acides aminés. Cela a un grand intérêt car la fonction, l'activité d'une protéine dépendent grandement de sa forme. De même, la modélisation des structures 3D d'acides nucléiques (à partir de leur séquence nucléotidiques) revêt la même importance que pour les protéines.

Construction d'arbres phylogénétiques

En supposant que les séquences de gènes homologues trouvées chez deux espèces proviennent d'un même gène ancestral présent chez la dernière espèce ancêtre commune à ces deux espèces, on peut quantifier la distance génétique entre ces deux espèces. Cette distance génétique est représentée par le nombre de mutations qui séparent les gènes de ces deux espèces, du gène ancestral.

Appliquée à un nombre plus important d'êtres vivants, cette méthode permet d'établir une matrice des distances génétiques entre plusieurs espèces. Les arbres phylogénétiques rapprochent les espèces qui ont la plus grande proximité. Plusieurs algorithmes différents sont utilisés pour tracer des arbres à partir des matrices de distance. Ils reposent chacun sur des modèles de mécanismes évolutifs différents. Les deux méthodes les plus connues sont la méthode UGPMA et la méthode du Neighbour Joining.

La construction d'arbres phylogénétiques est utilisée par les programmes d'alignements multiples de séquences afin d'éliminer une grande partie des alignements possibles et de limiter ainsi les temps de calcul.

La modélisation de population

Liens externes

Bases de données

Logiciels et programmation

Institut et ressources en bio-informatique


C'est un article concernant le Bio-informatique. La page contient la signification du Bio-informatique , Description et explication au sujet de Bio-informatique

recherche quelque chose