30 juin 2013

Crache dans mon tube, je te dirai d’où tu viens (et comment tu mourras)


23andme, tu connais ? Non ? 


Bon. Remontons un peu le temps. The Human Genome Project ? Oui ça tu connais. Terminé en 2003, ce projet américain (mais auquel beaucoup de pays ont participé) avait pour ambition de séquencer le génome humain. Le but ultime, comprendre le génome humain. Les objectifs étaient de déterminer l’entière séquence A-T-C-G de tous les bouts (chromosomes) de molécule d’ADN contenus dans une cellule humaine, et d’en identifier tous les gènes (20000-25000 au total). Mission accomplie (mis à part quelques zones d’ombre d’ADN non codant).

On est cependant loin du but ultime. En effet, beaucoup reste à découvrir et à comprendre sur les interactions entre gènes ou encore sur le lien entre le génotype (gènes) et et phénotype (traits observables). Et pour cela, il faut avoir de la variation. En effet, pour connaître l’origine (et la part) génétique impliquée dans une maladie, il faut des malades et des non-malades. La variation, voilà ce qu’il faut creuser maintenant.


La méthode est simple comme bonsoir. On fait deux groupes : les malades, et les non-malades. On regarde qu’est ce qui est systématiquement différent entre les  deux groupe au niveau génétique. Un gène qui est présent chez tous les membres d’un groupe et absent chez tous les membre de l’autre groupe est un des suspect number one, car c’est un cas ou le génotype (allèle A ou allèle B au locus x) et le phénotype (malade/pas malade) sont très corrélés. Cette méthode d’identification de gènes et de leurs fonctions s’appelle étude d’association (« association study » in English). Ainsi on peut pointer les endroits variables du génome qui sont potentiellement à l’origine du phénotype malade/non malade. Et dans ce genre de méthodes, plus on a d’individus, mieux c’est. Il faut donc plein d’humains donneurs d’ADN.

Science… besoin de données… plein d’humains… Mais oui, toi le lecteur assidu qui te souviens de chaque mot et chaque faute d’orthographe de ce blog, ça te rappelle un truc :  un des premiers posts de ce blog, écrit par le ô combien brillant Léo, sur la science participative ! Et voilà un cas exemplaire ou chacun peut contribuer à partager des données analysables par les scientifiques. Et c’est précisément ce que se sont dit Linda Avey (businesswoman dans l’industrie génétique) et  Anne Wojcick (généticienne), fondatrices de 23andme, entreprise née en 2007.
Oui j'ai choisi la photo la plus scandaleuse qui soit. (Merci cae2k).


Voilà en gros ce qui s’est passé :
« Salut Anne, ça serait cool de pouvoir construire une gigantesque base de donnée compilant les informations génomiques de volontaires pour pouvoir faire de la science de bourrin,  et les volontaires pourraient du coup avoir accès à leurs propres données génétiques.
-Oui Linda, j’y pensais justement, surtout que la pharmaceutique commence à s’intéresser à des traitements adaptés aux gènes des clients. Et nous les chercheurs on pourrait enfin savoir quel gène est responsable de la capacité à sentir l’odeur étrange de notre urine après avoir mangé des asperges, ou de la propension à éternuer au soleil (question cruciale que se posait déjà Aristote dans la section « Problèmes du nez » de son Livre Des Problèmes).
-Hmm il y a un business à développer là-dedans. Il nous manque juste quelques millions, et  des ordis superpuissants…
-Ah ouais fastoche… SERGEEEEEY ? RAMENE-TOI !  Linda je te présente mon petit copain, co-fondateur de Google. »

Bon voilà, comme quoi des fois c’est facile de commencer un business.



23andme, comment ça marche ?

Tu craches 100 dollars (hé te plains pas, il y a 4 ans c’était 1000). Tu craches dans un tube. Tu Fedex tout ça à Silicon Valley. Tu réponds à un questionnaire en ligne très détaillé. Et quelques jours plus tard, tu connais toutes les ethnies de tes ancêtres, ton pourcentage de Néanderthal, la justification de ton aversion pour la coriandre fraîche, les maladies que tu es plus enclin à chopper que la moyenne des gens, le genre de saloperies que la vie te réserve pour ta mort… 
Finalement, 100 dollars, ce n’est pas tant… en fait ton test coûte plus cher que ça, mais il ne faut pas oublier que tes informations personnelles seront utilisées et ajoutées à la grosse base de données donc c’est donnant-donnant. Enfin, c’est (donnant)-(donnant+100$), et Google crache le reste. Eh oui, Google détenais tes coordonnées, tes cybercommunications, ton adresse, tes photos, tes informations bancaires, ben maintenant Google peut aussi avoir tes gènes. 
23andme a aussi des petits côtés Facebook : tu peux retrouver tes proches, si eux aussi ont fait le test (Oooh te voilà ma grande arrière-petite-cousine-du 4ème degré, comme tu m’as manqué !). Tu peux aussi trouver tous les gens qui ont les mêmes potentielles futures maladies que toi, et créer des forums pour en discuter. Taré.


Quels marqueurs génétiques ?

23andme ne détermine pas toute la séquence de ton ADN. Ca prend bien trop d’espace, et on n’a pas besoin des régions d’ADN qui sont identiques chez tout le monde , ou de toutes les séquences répétées (des séries de ATATATAT par exemple). L’analyse se concentre sur  des SNPs (à prononcer « snip »), pour Single Nucleotide Polymorphism. En gros c’est la plus petite unité possible de variation génétique. Tu es AAATTCGCGT, je suis AACTTCGCGT, il y a un SNP en 3ème position. Les SNPs sont super pratiques car c’est un type de mutation facile à détecter, très fréquent et qui laisse peu de mystères. Et on peut en analyser plein, mais alors plein d’un coup. 23andme sous-traite : elle envoie l’ADN à Illumina, la plus grosse entreprise de séquençage sur le marché, qui va identifier plus de 550 000 SNPs. Et c’est en comparant tes SNPs à ceux de tous les autres clients (plus d’autres bases de données plus anciennes) que 23andme te sors toutes les informations listées ci-dessus (et bien d'autres).

Les machines d'Illumina ( photo piquée à wired)

De leur côté les chercheurs rentrent tes données génétiques et celles du formulaire rempli en ligne, et la puissance statistique des études d’association augmente encore un peu. Si tu as des traits rares, il y a même moyen de te faire faire le test gratos, tellement les chercheurs veulent tes données génétiques. Et oui rappelle-toi, plus ils accumulent de variations entre individus, plus ils sont capables de dévoiler des liens entre gènes, et entre génotype et phénotype. 

...Et maintenant on en est où?
Après avoir découvert l’origine génétique de l’odeur de l'urine post-asperges et de l’éternuement au soleil (Eriksson et al. 2010), les chercheurs ont pu s’attaquer à des problèmes plus mineurs, genre la maladie de Parkinson (Do et al. 2011).
Ca marche plutôt bien pour Anne et Linda. Depuis sa création, et surtout depuis la baisse du prix du service à 100$, 23andme gagne en puissance (financière et statistique). Leur objectif : atteindre le million d’individus, pour rendre réalisables encore plus de tests d’association, notamment sur des traits ou maladies moins fréquents.

…Alors, tenté de participer?



Sources et Références

- Do CB, Tung JY, Dorfman E, Kiefer AK, Drabant EM, et al. (2011) Web-Based Genome-Wide Association Study Identifies Two Novel Loci and a Substantial Genetic Component for Parkinson’s Disease. PLoS Genet 7(6)

- Eriksson N, Macpherson JM, Tung JY, Hon LS, Naughton B, et al. (2010) Web-Based, Participant-Driven Studies Yield Novel Genetic Associations for Common Traits. PLoS Genet 6(6)

8 commentaires:

  1. super article !
    en tout cas google reste fidèle à son nom : http://fr.wikipedia.org/wiki/Gogol_%28nombre%29

    sinon je me demandais :
    j'imagine qu'ils doivent avoir des pédigrées génétiques et phénotypiques maintenant, du coup ils doivent pouvoir commencer à estimer la part non-génétique de certaines maladies non ?

    RépondreSupprimer
  2. Hey!
    Très bon article Jo! Et surtout très drôle (et horrible) ...
    J'avais vu un reportage sur arte ou une fille qui recevait ses résultats de 23andme était filmée. Elle recevait par e-mail une liste de maladies avec le pourcentage de chance d'attraper chacune d'elle à tel ou tel âge. Elle était dans la moyenne pour tout, sauf Alzheimer! Pas de chance!

    Léo, ta question fait référence à l'article de Benoit et Étienne dans Plos One sur le double pedigree non?
    Ah mon avis leur pedigree doit être plein de trous, donc inutilisable pour la genet quanti. Et pis, je ne pense pas que les gens seraient intéressés par les chances "non génétique" qu'ils aient une maladie ... Ça serait comme "vous fumez, vous conduisez vite, vous allez en Afghanistan tout les mois, le nombre de chances que vous mourriez de vieillesse avoisine 0!"

    RépondreSupprimer
    Réponses
    1. non je pensais plutôt aux effets épigénétiques ou aux effets maternels; genre la transmission d'anticorps par la môman à l'enfant; et inversement la transmission de trucs pourris non génétiques qui pourraient augmenter les chances d'avoir parkinson ou autre.
      comme ils suivent pas exactement une transmission classique, je me disais que ça pourrait se voir en tant qu'anomalie... (non ?)

      pour la fille du reportage il y a un espoir : elle va probablement assez vite oublier son malheur. arh arh arh arh, humour noirrrrr

      Supprimer
  3. Yep, bonne remarque!

    Les effets épigénétiques je ne pense qu'ils puissent les détecter (ils ne regardent que la séquence après tout). Et les effets maternels encore moins!
    Par contre je ne pense que dans leurs analyses ils regardent exactement la transmission et le mode d'hérédité. (ils s'en fichent de savoir si l'allèle est dominant ou pas, etc ...).
    Je pense juste qu'ils séquencent des milliards de trucs et statistiquement si des gens qui ont des maladies ont telles ou telles séquence ben il en déduisent que si tu as la séquence tu auras aussi la maladie (enfin, en pourcentage de chance car évidemment ce n'est que des proba). Mais Jo nous en dira peut être plus!

    Au fait, blague pas drôle: Tu crois que pour les trisomiques la firme s'appelle "23.5andMe"?? Ah ah!

    RépondreSupprimer
    Réponses
    1. Je ne crois pas que 23andme ait assez de données pour établir des pedigrees assez puissants pour être ensuite utilisés pour déterminer les parts non génétiques de la transmission. Je ne suis pas sûre d'ailleurs que les web-based databases, qui ne restreignent pas à la base l'origine des données, soient la meilleure manière d'échantillonner pour faire des études d'épigénétique.
      Comme dit Pascal, pour le moment ils font juste de l'association statistique (de bourrin).

      Supprimer
  4. haha j'ai rigolé tout seul devant mon écran ! je suis sûr que je vais aller en enfer pour ça :(

    RépondreSupprimer
  5. c'est très .... noir comme humour...
    P***** j'adore!!

    Merci Jo, je ne savais même pas que ça existait.; un film de science fiction!
    Existe-t-il des loi pour réglementer l'usage de tel type de données ?

    RépondreSupprimer
    Réponses
    1. Oui, j'ai pensé au film Bienvenue à Gattaca, qui date de 1997 mais qui montre un aspect du génotypage individuel humain!

      Côté loi (ou polémiques) je n'ai curueusement pas trouvé grand-chose!! Juste des débats sur "Veut-on savoir ou pas", ou ce genre-là... Mais j'ai peu creusé. Si vous tombez sur des infos là-dessus, faites-moi signe.

      Du côté de la protection des données par 23andme, la firme peut donner tes infos à d'autres chercheurs (à des fins commerciales ou pas) mais te demanderont toujours ton autorisation avant.

      Du côté des lois elles-mêmes, il y a le "Genetic Information Nondiscrimination Act" qui a été signé en 2008 et qui est censé réguler l'utilisation des données génétiques. Cependant "its [this Act's] protection against discrimination by employers and health insurance companies for employment and coverage issues has not been clearly established." GLOUPS! C'est écrit sur le site de 23andme.

      En gros c'est comme ton carnet de santé, tu vas pas l'agiter sous le nez de ton potentiel futur employeur s'il y est écrit que tu fais des crises d'épilepsie tous les 4 matins...
      23andme conseillent donc à leurs clients de garder leurs résultats confidentiels.

      Supprimer