Les débuts du séquençage de l’ADN remontent aux années 70. L’accès à cette information était d’importance primordiale en biologie et le développement de projets de séquençage de génomes devint l’objet de débats intenses et de convoitises d’intérêts privés. Grâce à des progrès ininterrompus, l’efficacité et le renouvellement des méthodes de production et d’analyse des séquences, la diminution des coûts ont été à l’origine d’une explosion du volume de données produites. Paradoxalement l’interprétation de ces données a elle aussi nécessité l’obtention de quantités massives de données additionnelles de séquence. Il y a peu de domaines de la biologie qui soient restés à l’écart de cette révolution.
Après s’être appliqué aux génomes d’espèces modèles comme la drosophile et l’arabette en parallèle à l’emblématique génome humain, le champ d’action s’est progressivement étendu aux espèces d’intérêt appliqué en médecine et en agronomie, puis s’est généralisé à l’ensemble du vivant, espèce par espèce, mais aussi en séquençant des communautés entières, milieu par milieu, à l’aide de métagénomique. L’exploitation et l’interprétation de cette avalanche de données a reposé sur le développement d’outils informatiques de plus en plus puissants et sophistiqués.
Les données produites ont en premier lieu permis l’établissement d’inventaires de gènes, d’espèces, de variations de séquence et ont fourni l’infrastructure de la génomique fonctionnelle. Mais on assiste aussi depuis plusieurs années à d’autres développements dans le domaine de la paléontologie, de la cancérologie et plus généralement du diagnostic médical et des études environnementales.