Mettre en lumière la matière noire du génome

Les avancées récentes dans les technologies de séquençage ont dévoilé l’existence de milliers d’ARN qui ne sont pas traduits en protéines. L’équipe du chercheur Martin Smith, basée au CHU Sainte-Justine, tente de mieux comprendre les mécanismes d’actions de ces ARN. Ses travaux pourraient avoir un impact sur des personnes atteintes de maladies complexes en permettant d’identifier de nouvelles cibles thérapeutiques.

Avec l’achèvement du projet du génome humain en 2003, un effort de recherche international qui a permis d’établir pour la première fois le séquençage complet de l’ADN du génome humain, l’espoir brillait dans la communauté scientifique. D’après le président américain de l’époque Bill Clinton, ce projet allait « révolutionner le diagnostic, la prévention et le traitement de la plupart, sinon de la totalité, des maladies humaines ». Qu’en est-il réellement vingt ans plus tard ? Encore aujourd’hui, plusieurs maladies comme le diabète, l’hypertension artérielle et les troubles psychiatriques sont encore mal comprises, difficiles à prévoir et à traiter, et une panoplie d’autres restent sans remède.

L’ADN est souvent présenté comme le modèle pour la transcription des ARN messagers, qui sont ensuite traduits en protéines. De la même façon, on peut voir l’ADN comme un livre de recettes, l’ARN messager comme une copie de ces recettes, et la protéine synthétisée comme le produit de cette recette. Bien que les protéines aient longtemps été considérées comme les principaux effecteurs de la fonction moléculaire dans les cellules et les tissus, ce principe est aujourd’hui remis en question. En effet, une grande part de l’ADN est transcrite en ARN, mais la majorité des ARN ne contiennent pas l’information pour synthétiser des protéines. Ces séquences « non codantes » sont souvent appelées « matière noire ».

Depuis le début des années 2000, une véritable mine d’or de molécules a été découverte dans la partie non codante (ou matière noire) du génome. Cet ADN qu’on jugeait négligeable produit en fait des milliers de molécules appelées « longs ARN non codants » (ARNlnc). Des recherches ont révélé que certaines de ces molécules effectuent des tâches essentielles pour le maintien en santé de nos cellules. Telle une construction de Lego, les ARNlnc sont composés de plus de 200 blocs, « les nucléotides », qui ne sont pas traduits en protéines. Ces blocs peuvent former des structures et interagir avec des protéines pour réguler ce qui se passe dans nos cellules.

Mon projet de recherche consiste à comparer le génome humain à ceux d’autres mammifères. Je cherche des fragments de la matière noire du génome qui existent à la fois chez les humains et chez les animaux, et qui pourraient être traduits en ARNlnc. L’idée est que si un ARNlnc a été préservé pendant des millions d’années dans des espèces très différentes, comme l’humain et le cheval, son rôle est probablement important et mérite d’être étudié.

Les ARNlnc adoptent souvent une structure non linéaire en se repliant sur eux-mêmes comme une épingle à cheveux. Cette structure m’intéresse particulièrement, car c’est à travers celle-ci que nous croyons que les ARNlnc interagissent avec d’autres molécules et ainsi déterminent la fonction qu’ils occupent au sein de la cellule. Grâce à des outils bio-informatiques et des algorithmes utilisant de l’intelligence artificielle, je peux voir leurs diverses structures et regrouper ces molécules en famille selon leur structure prédite.

Certains ARNlnc peuvent se lier à des protéines pour les recruter et les guider à des endroits précis du génome. Afin de trouver des cibles thérapeutiques possibles, j’utiliserai des méthodes biochimiques combinées au séquençage à haut débit pour identifier ces protéines ainsi que leurs sites de liaison. Des molécules qui imitent la région fonctionnelle de certains ARNlnc spécifiques sont en cours de développement, d’où l’importance d’identifier ces protéines. Des thérapies qui augmenteraient le nombre de certains ARNlnc ou des parties de ceux-ci pourraient être particulièrement utiles dans le traitement de maladies causées par la mutation d’ARNlnc telles que les cancers et les maladies cardiovasculaires.

Je m’attarderai sur les familles de structures qui semblent jouer un rôle déterminant dans des cellules neuronales, car le cerveau humain exprime plusieurs milliers d’ARNlnc. J’utiliserai la nouvelle technologie CRISPR-Cas9, qui permet de modifier le génome, pour perturber certaines structures d’ARNlnc qui joueraient potentiellement un rôle dans le fonctionnement des neurones afin d’étudier l’effet de la perturbation de ces structures.

L’objectif de mon projet est donc d’améliorer notre compréhension de l’architecture du génome humain ainsi que de fournir un vaste répertoire de nouvelles cibles exploitables pour la conception de médicaments, de diagnostics moléculaires et pour la modification du génome. De plus, mon projet permettra de faire la lumière sur les parties génomiques non codantes qui ont des significations encore inconnues. Alors que de nouvelles stratégies thérapeutiques ciblant l’ARN continuent d’émerger, démêler le rôle fonctionnel des ARNlnc pourrait ouvrir la voie à un changement de notre perception des ARNlnc. Ceux-ci ne sont pas de l’ADN « poubelle », comme on le croyait initialement, mais bien une potentielle source de traitements pour les personnes atteintes de maladies.

Cet article a été réalisé par Vanda Gaonac’h-Lovejoy (Université de Montréal), avec l’accompagnement de Marie-Paule Primeau, conseillère en vulgarisation scientifique, dans le cadre de notre initiative « Mon projet de recherche en 800 mots ».

Retour aux projets de recherche

L'intelligence artificielle pour...

Mettre en lumière la matière noire du génome