Title : Inferring the history of human populations from genetic and linguistic diversity.
Download : these_thouzeau.pdf (Several parts are in French)
Defense date : November 28, 2017
Jury :
Mme Porcher Emmanuelle, Professeure, MNHN, Présidente
M. Austerlitz Frédéric, Directeur de Recherche, CNRS, Directeur de Thèse
M. Verdu Paul, Chargé de Recherche, CNRS, Directeur de Thèse
M. Estoup Arnaud, Directeur de Recherche, INRA, Rapporteur
Mme Kandler Anne, Senior Scientist, Max Planck Institute, Rapportrice
Mme Barberousse Anouk, Professeure, Université Lille 1, Examinatrice
Mme Barkat-Defradas Mélissa, Chargée de Recherche, CNRS, Examinatrice
Abstract
Historical inferences are statistical methods allowing to reconstruct past events from current data. Inferences in parallel of genetic and linguistic histories have recently benefited from methodological advances allowing to better understand the coevolution between genes and languages. Nevertheless, the complex historical events affecting linguistic diversity are still understudied. This thesis was centered on the articulation between genetic and linguistic inferences, based on an interdisciplinary practice and the application of statistical methods of approximate Bayesian computation. This framework allowed taking into account complex events of migration, admixture, or change in population size, both for genetic and linguistic history. Genetic and linguistic data sampled from several populations in Central Asia were analyzed, showing that the history of genetic populations can differ from the history of the linguistic varieties spoken by these populations. A framework allowing to take into account within-population linguistic diversity was then developed and applied to a group of Tajik speakers from Central Asia. An interface between genetics and linguistics centered on individuals was then formalized on the basis of a theoretical work whose methodological possibilities were confirmed a priori by approximate Bayesian computation, opening a new field of investigation in the study of the coevolution between genetic and linguistic. Finally, a linguistic sampling protocol applied to a group of speakers of the Cape Verde Islands was built in order to allow an integration between theoretical work and fieldwork. This whole work formalizes a population linguistics coupled with the human population genetics, and provides the methodological tools to reconstruct the history of the genetic and linguistic coevolution.
Titre : Inférer l’histoire des populations humaines à partir des diversités génétiques et linguistiques.
Résumé
Les inférences historiques sont des méthodes statistiques permettant de reconstruire les événements passés à partir de données actuelles. Les inférences en parallèle des histoires génétiques et linguistiques ont récemment profité d’avancées méthodologiques permettant de mieux comprendre la co-évolution entre gènes et langues. Néanmoins, les événements historiques complexes affectant la diversité linguistique sont encore très peu étudiés. Cette thèse a été centrée sur l’articulation entre inférences génétiques et linguistiques, à partir d’une pratique interdisciplinaire et de l’application de méthodes statistiques de calcul Bayésien approché. Ce cadre a permis de prendre en compte des événements complexes de migration, d’hybridation, ou de changement de taille des populations, aussi bien pour l’histoire génétique que pour l’histoire linguistique. Des données génétiques et linguistiques issues de plusieurs populations d’Asie Centrale ont ainsi été analysées, montrant que l’histoire des populations génétiques peut parfois différer de l’histoire des variétés linguistiques parlées par ces populations. Un cadre permettant de prendre en compte la diversité linguistique interindividuelle a ensuite été développé et appliqué à un ensemble de locuteurs tadjiks d’Asie Centrale. Une interface entre génétique et linguistique centrée sur les individus a ensuite été formalisée à partir d’un travail théorique, dont les possibilités méthodologiques ont été confirmées a priori par le calcul Bayésien approché, ouvrant un nouveau champ d’investigation dans l’étude de la co-évolution entre génétique et linguistique. Enfin, un protocole d’échantillonnage linguistique appliqué à un ensemble de locuteurs des Îles du Cap Vert a été construit afin de permettre une intégration entre le travail théorique et le travail de terrain. L’ensemble de ce travail formalise une linguistique des populations couplée à la génétique des populations humaines, et fournit les outils méthodologiques permettant de reconstruire l’histoire de la co-évolution entre génétique et linguistique.