17 nov. 2013

Victorieux, par chance ou par destinée?

C'est bien joli les dés des gazelles, mais jouons nous tous avec les même dés?


Vous contemplez le carré de gazon qui jouxte l'arrêt de bus où vous gâchez 10 minutes de votre vie chaque matin. Les molécules de caféine n'ont pas encore atteint leur cible, la rue est calme, la brise fraîche, il vous vient des questionnements bizarres. Quoi de plus semblable entre eux que deux brins d'herbe ? Peut-être deux mésanges nonnettes, qui s'agitent dans des prunus, semblables à tous les autres prunus bordant la route ? Ou encore deux tâches de lichen sur son écorce ?
À n'en pas douter, en regardant de très près, on pourrait trouver des différences mineures. Certains individus sont légèrement plus grands, plus colorés, plus souillés par la boue... rien de bien spectaculaire. De plus, beaucoup de ces variations disparaîtraient si l'on prenait en compte l'âge, le sexe. Est-ce que ces différences mineures à nos yeux importent d'une quelconque manière pour le fonctionnement des populations ? Les individus d'une même espèce sont-ils donc tous équivalents et interchangeables ? Quels moyens avons-nous à notre disposition pour trancher ces questions ?




Une constatation qui semble dénoter avec l'apparente uniformité physique au sein d'une espèce est que, rétrospectivement, les individus n'ont pas eu la même histoire de vie. Pour parler comme dans le monde froid et amoral de la science, on observe une grande variabilité de succès reproducteur dans les populations naturelles. Ce qui suit devrait clarifier le sens de cette formule pédante.

Graines, œufs, spores... meurent massivement avant même d'être observables. Puis comme plantule, poussin, hyphe.. dans le temps qui les sépare de la reproduction malgré ces débuts prometteurs. Et le comble dans tout ça, c'est qu'après tout ce vécu passé à ne pas mourir, la majorité des survivants va être très médiocre. Ils ne se reproduiront pas suffisant pour maintenir la population. En fait, seuls quelques fieffés coquins vont produire un nombre disproportionnellement grand de descendants.
Prenons une illustration au hasard : chez le campagnol des neiges, à peu près 70% des jeunes qui sortent de leur terrier ne survivent pas à l'hiver, sans compter tous ceux qui meurent avant, dans le nid natal ou le ventre de leur mère.
Un campagnolinou des neiges
(Chionomys nivalis)
L'été suivant, devenus adultes, les survivants sont en moyenne les heureux parents de trois petites boules de poils et de tendresse. Cependant, derrière cette moyenne se cache une très forte disparité : un quart des adultes ne se reproduisent pas du tout, tandis que quelques érotomanes notables donnent le jour à 15 campagnolinous. Pire, les pervers ont plus de chances que les abstinents de survivre à un second hiver, sans montrer signe de fatigue libidineuse au printemps suivant ! Alors, de petits futés ont-ils appris à se tricoter des moufles ? Quelqu'un distribue-t-il des préservatifs empoisonnés ? Les champions sont-ils des barbares venus de steppes lointaines, nourris au sang d'hermine depuis leur plus tendre enfance ?

La qualité, fixée ou dynamique?


Face à ce constat, deux explications principales se rencontrent. D'abord, certains individus peuvent tout simplement être plus chanceux que d'autres. En supposant que la probabilité de survie soit de 50%, c'est comme si chaque individu lançait la même pièce de monnaie. Les faces vivent, les piles meurent. De façon similaire, la reproduction pourrait être déterminée par un jet de dé, dé éventuellement à plus de 6 faces, avec des 0 et des nombres répétés... peu importe, l'idée est que le simple fait que tout le monde tire le même dé engendre déjà de la variation.

Encadré (ça y'est je sais faire) non indispensable sur l'origine de la variation aléatoire
Pour raffiner un peu cette idée, il faut ajouter qu'il serait raisonnable de prendre en compte l'âge, le sexe, ou tout autre groupement d'individus qui crée évidemment une variation supplémentaire au « tirage des dés de la reproduction ». Une fois cette stratification des probabilités prise en compte, les individus au sein des strates sont considérés comme strictement équivalents, tels deux brins d'herbe aux yeux d'un rêveur matinal. Cela ne les empêchent pas d'être plus ou moins chanceux et d'avoir des succès différents.

Pour être complet, in faut ajouter que de la variabilité est aussi créée par la probabilité pour un individu de passer d'un état (par exemple reproducteur avec 2 poussins) à un autre (par exemple adulte non reproducteur, ou reproducteur avec 1 poussin). Si toutes les transitions n'ont pas les mêmes probabilités, les individus vont accumuler des différences supplémentaires au cours de leur vie, du fait de leur « trajectoire » aléatoire dans l'ensemble des états possibles. Ils auront des succès totaux plus différents que si chaque tentative de reproduction était indépendante de la précédente. À un moment donné les individus n'ont pas la même probabilité de succès futur, mais cette probabilité change en fonction de leurs résultats successifs. Ce processus est appelé hétérogénéité dynamique, par opposition à l'hétérogénéité fixe qui est une propriété intrinsèque et invariable des individus. (Ce point est assez complexe, les braves peuvent aller voir ça)


Une population sauvage vue par un modèle démographique standard
Ce point de vue est souvent adopté en démographie, humaine comme non-humaine. Cela vient en partie du succès des modèles utilisés pour décrire correctement les phénomènes démographiques, mais aussi sans doute de l'histoire de la discipline, peu habitué à penser en termes d'individus. Ainsi, les modèles qui prennent en compte l'hétérogénéité des populations le font sur la base de groupes avec un petit nombre de valeurs possibles (par exemple jeune/adulte non reproducteur/adulte reproducteur,  dominant/soumis, migrant/résidant), et qui représentent souvent des états temporaires.


et si tout le monde n'avait pas les mêmes dés?

Cependant, on peut aussi supposer l'existence de différences intrinsèques et fixes, dans la qualité des individus à se reproduire. Peut-être ne jouent-ils pas tous avec les mêmes dés ? Dans le cas extrême où la qualité individuelle détermine parfaitement le succès, certains auraient par exemple des dés marqués de 0 sur toutes les faces, d'autres, des dés remplis de 42. Dans un cas moins déterministe, les dés auraient plusieurs valeurs possibles, mais certains seraient plus avantageux que d'autres.



Pour le dire de façon moins abstraite, dans une situation de la vie de tous les jours : imaginez que vous vous trouvez avec 99 autres personnes dans une pièce et que l'on vous annonce que 10% des gens présents vont mourir de crise cardiaque dans la minute (sic). Cette information aurait toutes les raisons de vous faire suer si un esprit perturbé disposait d'un moyen mystique de tuer n'importe qui, vous avez personnellement 10% de chance de mourir ! Néanmoins, si vous n'êtes plus un adolescent gavé au manga et que vous vous pensez en bonne santé, vous notez que les 10% en question concernent plus probablement ces 10 nonagénaires qui s'apprêtent à courir un sprint dans le fond de la salle. C'est triste, mais vous vous sentez égoïstement soulagé.
Dans le premier cas, la population est homogène, tout le monde partage la même probabilité, dans le second cas la population est hétérogène, 10% des individus sont condamnés à mourir, 90% ne courent aucun risque. D'un point de vue extérieur, si l'on n'a pas accès aux mécanismes du phénomène, on observe exactement la même chose.

La recherche de la qualité cachée

Une approche possible pour tester l'existence de différences de qualité est de regarder à nouveau de plus près ces individus apparemment tous semblables, et de choisir des caractères mesurables (âge, propension à courir des 100m, taille de l'index gauche, poids, nombre de tatouages...) qui présentent de la variation entre individus. On mesure alors ces caractères chez tous les individus et on cherche à savoir s'ils expliquent les différences de qualité observées. Ceci est possible et courant, mais se heurte à des difficultés fondamentales. Va-t-on trouver des caractères pertinents ? Comment être sûr d'avoir pris en compte suffisamment de caractères liés au succès ? Imaginons que l'on parvienne à expliquer 20% de la variabilité observée. Est-ce que cela signifie que 80% sont dus à d'autres caractères non mesurés, à des facteurs environnementaux, ou bien qu'un hasard plus fondamental a un rôle là dedans ? (Une gazelle de rappel sur le rôle et la nature du hasard en biologie)

Les deux approches suivantes ignorent sciemment les mécanismes sous-jacents aux différences de qualité, pour tester seulement leur présence et leur ampleur. Il s'agit alors de distinguer ces deux situations :
Les courbes vertes et épaisses représentent une distribution au niveau de la population, tandis que les courbes bleues/magenta/rouges et plus fines, représentent des distributions individuelles. Ces distributions individuelles doivent être comprises comme des probabilités de succès potentiel.
Sur le graphique de gauche,  tous les individus représentés ont des succès potentiels différents 
(ceux en rouge sont meilleurs que ceux en bleu). 
Au contraire, à droite, tous les individus ont les mêmes probabilités de succès.
Cependant, la somme des probabilités individuelles donne exactement la même distribution au niveau de la population dans les deux cas. 
NB: j'ai un peu triché sur les échelles pour rendre ça lisible. Aussi, à gauche, seuls quelques individus sont représentés

On voit ici comment deux phénomènes totalement différents peuvent produire exactement la même distribution au niveau de la population. Les distributions individuelles ne peuvent généralement pas être connues parce que ce sont des distributions potentielles. Il faudrait disposer de nombreuses observations par individu pour connaitre exactement la forme de sa distribution de probabilité individuelle . Seule la distribution de la population est observable.

D'abord, comme nous l'avons déjà évoqué, les modèles démographiques sont souvent suffisants pour décrire la plupart des phénomènes à l'échelle d'une population. Cependant, ces modèles ont aussi été utilisés pour tenter d'inférer les propriétés individuelles, notamment la présence de qualité intrinsèque. Sur cette base, des publications récentes (par exemple [1] et [2]) proposent que la majorité des variations individuelles observées dans les populations sauvages, en ce qui concerne la reproduction (par exemple le nombre total de rejetons au cours de la vie, la probabilité de tenter de se reproduire, le nombre d'embryons produits chaque année...), peuvent s'expliquer simplement par des phénomènes aléatoires. C'est en quelque sort une théorie neutre des histoires de vie et une hypothèse nulle. On devrait alors considérer a priori que les individus ne sont pas significativement différents les uns des autres. Les tailles des populations sauvages et les échantillons des biologistes seraient trop petits pour que les effets des différences individuelles ne soient pas noyés dans un bruit aléatoire. Ce résultat semble peu compatible avec les théories et les méthodes communément utilisées en biologie évolutive.



Opinion personnelle sur ces publications
rappelez-vous, le point de vue démographique
Les modèles démographiques ne représentent que les distributions à l'échelle de la population et sont naïfs sur les propriétés des individus. C'est sans doute pourquoi l'utilisation de ces modèles peut conduire à la proposition que les individus diffèrent avant tout dans leur chance et non dans leur qualité intrinsèque. Ce résultat est selon moi circulaire, car due aux hypothèses des modèles utilisés. Ils ne peuvent détecter les différences de qualité individuelles que si celles-ci déforment de façon inattendue la distribution à l'échelle de la population. La distribution d'une population peut-être crédible sous un modèle uniforme alors qu'elle est en fait significativement affectée par différentes distributions individuelles qui la sous-tendent. 
Ainsi, sur les mêmes données, l'approche démographique n'a vu que la marque de la chance [3] alors que la troisième approche, expliquée juste en dessous, détecte bien le rôle des différences de qualité intrinsèque [4].


La dernière approche, classique en écologie et évolution, consiste à observer les résultats répétés de chaque individu. Ce n'est pas facile dans notre exemple précédent, qui traitait de mortalité. Il est assez peu fréquent que des gens reviennent d'entre les morts. On dispose éventuellement de plusieurs survies par individus, mais généralement d'une seule mort par personne, soit un petit échantillon statistique. Ceci rend difficile l'estimation des différences dans la probabilité individuelle de mourir... La situation est plus favorable en ce qui concerne les chats et la reproduction, pour laquelle on peut disposer de plusieurs observations par individus. (ça peut marcher quand même pour la mortalité, mais c'est plus délicat)
Même si on ne peut pas observer ces distributions individuelles, on peut détecter la présence de différences individuelles par l'utilisation de modèles statistiques. Très grossièrement, ceux-ci utilisent les observations répétées d'un même individu pour estimer sa performance moyenne, qui serait égale à sa « qualité cachée » si l'on disposait d'un grand nombre d'observations par individu. Ce n'est généralement pas le cas, les estimations sont imprécises. Heureusement, ce qui nous intéresse ici ce ne sont pas les valeurs des qualités individuelles, mais l'existence et l'importance de différences dans les valeurs individuelles. Les modèles dits mixtes répondent à ces attentes assez facilement et délivrent une estimation de la variabilité en qualités individuelles (sous forme d'une variance).

Revenons à nos dés pour donner une impression plus concrète de ce que font ces modèles. Quelqu'un lance 6 fois un dé à 6 faces (dé caché, dont vous ne pouvez pas voir les faces) et obtient { 1, 2, 2, 1, 3, 2 } tandis qu'une autre personne, armée d'un autre dé obtient { 6, 5, 6, 6, 4, 3 }. Il serait risqué d'essayer de deviner exactement les valeurs de chaque face de chacun des dés. Il est tout à fait possible qu'une face soit "6" sur le premier dé mais ne soit pas apparue en seulement 6 tentatives. Il faudrait beaucoup plus de tentatives pour être confiant dans la composition de chaque dé et donc connaître sa qualité, son résultat moyen. En revanche, il semble probable que la seconde personne ait un dé qui donne en moyenne un nombre plus élevé. Cette différence dans les moyennes des dés (moyennes qui sont inconnues) est la variance que le modèle va estimer, ici elle serait élevée.
Si les résultats avaient été { 1, 3, 6, 2, 5, 3} et { 4, 3, 1, 6, 2, 4} on aurait une variance faible, probablement nulle ou non significativement différente de zéro.

Quand on lui soustrait la variabilité en qualités individuelles, la variabilité totale indique la part du « hasard » dans la reproduction. Ce hasard est ici un fourre-tout, et pourrait contenir une vaste variété de phénomènes, des microclimats, aux oscillations quantiques, en passant par les chutes de météorites et l'intervention d'un prédateur. En supposant que le modèle fonctionne parfaitement, on a donc une meilleure estimation de la variabilité individuelle qu'en utilisant des caractères ou en regardant au niveau de la population, comme les approches précédentes. En contrepartie, on perd de l'information sur les possibles mécanismes expliquant cette variabilité.

Et après?

Pour résumer, même si de loin tous se ressemblent au sein d'une espèce, les individus diffèrent énormément dans leurs histoires de reproduction et de survie. Ces différences peuvent être provoquées par la chance seule, des qualités individuelles cachées, ou beaucoup plus fréquemment un mélange des deux. Étudier l'importance relative des différences individuelles en ne regardant que le niveau de la population semble rejeter systématiquement l'existence de telles différences. Ceci est sans doute un artéfact méthodologique. Les modèles mixtes offrent une méthode alternative bien plus adaptée, sans être une panacée.

La question est maintenant celle de la nature des qualités individuelles. Vous l'avez tous sur le bout des lèvres... les gènes ! Oui, sans doute, mais ce n'est pas tout. Un bon début dans la vie peut faire que certains individus sont durablement plus performants: par exemple si leurs parents les nourrissent très bien, s'ils gagnent un territoire de grande qualité, s'ils évitent par chance une maladie infantile débilitante... Les différences cachées dans la qualité des individus, que nous avons détectées au prix de douloureux efforts statistiques, pourraient donc ne pas être une propriété essentielle des individus, mais encore une fois un simple résultat de la "chance".
Finalement, la question de la présence de qualité individuelle est réglée presque sans équivoque lorsque l'on peut montrer l'existence d'un effet significatif des gènes sur le succès des individus. Il faudra que nous revenions sur ce que cela signifie et ne signifie pas prochainement.



PS: Le point de vue adopté dans cet article semblerait peut-être exotique, pavé d'évidences et de détours inutiles à nos amis de formation évolutionniste. C'est aussi mon avis, mais j'ai récemment dû discuter de ces sujets avec des biodémographes... et ce chemin tortueux semble nécessaire à une compréhension réciproque. 

PPS: quand je parle de différences fixes dans la qualité des individus, je ne veux pas dire que leur succès potentiel intrinsèque ne change pas au cours de leur vie. Il peut par exemple y avoir une corrélation génétique négative entre les performances à différents âges.

Quelques papiers pas faciles





[1] Steiner et al. 2012. Neutral theory for life histories and individual variability in fitness components. PNAS 109.

[2] Tuljapurkar et al. 2009. Dynamic heterogeneity in life histories. Ecol. Lett. 12.

[3] Steiner et al. 2010. Dynamic heterogeneity and life history variability in the kittiwake. J. Anim. Ecol. 79.

[4] Cam et al. 2013. Looking for a needle in a haystack: inference about individual fitness components in a heterogeneous population. Oikos 122.

5 commentaires:

  1. Super Tim! C'est finalement pas aussi compliqué que ça n'en a l'air (oui oui, j'ai eu peur vers la fin, mais une relecture a aidé)
    Peut-être que ça serait encore plus clair si tu revenais à ton analogie des dés dans ton dernier paragraphe... au lieu de comparer entre eux les joueurs pour un lancer de dés, on compare plusieurs lancers de dé consécutifs pour chaque joueur (c'était bien ça l'idée? non? j'ai rien compris? je retourne à mes sapins?)

    RépondreSupprimer
    Réponses
    1. Merci Jo!
      J'ai tenté d'incorporer ton idée, j'espère que ça aide un peu.

      Supprimer
  2. Hey!
    Yep très bon article Tim!
    C'est drôle parce que ce que tu décris est exactement l'objectif des approches de génétique quantitatives: Séparer la variance environnementale de la variance génétique.

    RépondreSupprimer
    Réponses
    1. Merci Pascal!
      Tout à fait! La différence tiens au fait qu'ici on a pas d'information génétique (pédigrée ou marqueurs). Une fois que l'on a nos variances individuelles on ne peut pas dire qu'elle est l'importance relative des gènes et de l'environnement dans ces "qualités individuelles", mais seulement l'importance relative de ces "qualités individuelles" et de "l'environnement non individuel". Il me semble que dès que l'on a de l'information génétique on peut régler les deux questions à la fois... Le débat entre démographes et évolutionnistes, que j'ai tenté d'esquisser, tourne essentiellement autour de jeux de données où on n'a pas d'information génétique. (bien que fondamentalement des trucs que tu lis dans les papiers des "démographes" que j'ai cités, s'en prennent à des pans entier de la biol évol et de la génét quanti. Tu peux te douter de ce que j'en pense)

      Supprimer