Un nouveau apprentissage automatique aidera les scientifiques à identifier de petites molécules, avec des applications en médecine, en découverte de médicaments et en chimie environnementale. Développé par des chercheurs de l’Université Aalto et de l’Université du Luxembourg, le modèle a été entraîné avec les données de dizaines de laboratoires pour devenir l’un des outils les plus précis d’identification des petites molécules.
Des milliers de petites molécules différentes, appelées métabolites, transportent de l’énergie et transmettent des informations cellulaires dans tout le corps humain. Parce qu’ils sont si petits, les métabolites sont difficiles à distinguer les uns des autres dans une analyse d’échantillon de sang – mais l’identification de ces molécules est importante pour comprendre comment l’exercice, la nutrition, la consommation d’alcool et les troubles métaboliques affectent le bien-être.
Les métabolites sont normalement identifiés en analysant leur masse et leur temps de rétention avec une technique de séparation appelée chromatographie liquide suivie d’une spectrométrie de masse. Cette technique sépare d’abord les métabolites en faisant passer l’échantillon dans une colonne, ce qui se traduit par différents débits – ou temps de rétention – à travers le dispositif de mesure.
La spectrométrie de masse est ensuite utilisée pour affiner le processus d’identification en triant les métabolites selon leur masse. Les chercheurs peuvent également briser les métabolites en plus petits morceaux pour analyser leur composition à l’aide de la spectrométrie de masse en tandem.
«Même les meilleures méthodes ne peuvent pas identifier plus de 40 % des molécules dans les échantillons sans faire quelques hypothèses supplémentaires sur les molécules candidates», déclare le professeur Juho Rousu de l’Université d’Aalto.
Le groupe de Rousu a maintenant développé un nouveau modèle d’apprentissage automatique pour identifier les petites molécules. C’était récemment publié dans Intelligence des machines naturelles.
«Ce nouveau modèle open-source offre à l’ensemble de la communauté de recherche une vision enrichie des petites molécules. Cela aidera la recherche sur les méthodes d’identification des troubles métaboliques, tels que le diabète ou même le cancer», déclare Rousu.
La nouvelle approche contourne avec élégance l’un des défis auxquels sont confrontées les méthodes conventionnelles. Étant donné que les temps de rétention des molécules varient d’un laboratoire à l’autre, les données ne peuvent pas être comparées entre les laboratoires. Éric Bachdoctorant à Aalto, a imaginé une alternative au cours de sa recherche doctorale qui a résolu le problème.
«Notre recherche montre que même si les temps de rétention absolus peuvent varier, l’ordre de rétention est stable d’une mesure à l’autre par différents laboratoires», explique Bach. « Cela nous a permis de fusionner pour la première fois toutes les données sur les métabolites accessibles au public et de les intégrer à notre modèle d’apprentissage automatique. »
Avec l’incorporation de données provenant de dizaines de laboratoires à travers le monde, le modèle d’apprentissage automatique est suffisamment précis pour distinguer les molécules à image miroir, appelées variantes stéréochimiques. Jusqu’à présent, les outils d’identification n’ont pas été en mesure de distinguer les variantes stéréochimiques, et la nouvelle capacité devrait ouvrir de nouvelles voies dans la conception de médicaments et dans d’autres domaines.
« Le fait que l’utilisation de la stéréochimie ait amélioré les performances d’identification est une révélation pour tous les développeurs de méthodes d’identification de métabolites », déclare Emma Schymanski, professeur associé au Luxembourg Centre for Systems Biomedicine (LCSB) de l’Université du Luxembourg. « Cette méthode pourrait également permettre d’identifier et de tracer des micropolluants dans l’environnement ou de caractériser de nouveaux métabolites dans les cellules végétales. »
Source: Université Aalto
Lien de Etoile d'Europe