Une nouvelle ère de la découverte de médicaments portée par l’IA et la collaboration mondiale

Benjamin Haibe-Kains — directeur scientifique exécutif des programmes d’IA au UHN

L’intelligence artificielle, le calcul informatique à grande échelle et les données de haute qualité convergent pour accélérer la recherche biomédicale, transformant des découvertes qui prenaient autrefois des décennies en avancées pouvant désormais être réalisées en une fraction du temps.

Benjamin Haibe-Kains — directeur scientifique exécutif des programmes d’intelligence artificielle au University Health Network (UHN), Toronto (Canada)

Une conversation avec Benjamin Haibe-Kains

Dans cette entrevue, Benjamin Haibe-Kains — directeur scientifique exécutif des programmes d’intelligence artificielle au University Health Network (UHN), directeur scientifique du programme AI Hub and Cancer Digital Intelligence, et directeur de la science des données au Structural Genomics Consortium (SGC) — explique comment des initiatives comme le projet AirCheck bénéficieront de My Research Cloud (MRCA), un service développé par Computing for Humanity (CFH), afin de bâtir un écosystème de recherche plus ouvert, collaboratif et accessible à l’échelle mondiale, où l’innovation n’est plus limitée par la géographie ou les ressources institutionnelles. Benjamin Haibe-Kains est également chercheur principal au Princess Margaret Cancer Centre et professeur à l’Université de Toronto.

Poser les bases de l’IA pour la découverte de médicaments

Au cœur de la découverte moderne de médicaments se trouve une idée simple mais puissante : si nous comprenons comment les molécules interagissent avec les protéines, nous pouvons concevoir de meilleurs traitements contre les maladies humaines. Pour y parvenir, les chercheurs s’appuient sur d’immenses quantités de données expérimentales combinées à des modèles d’intelligence artificielle capables d’identifier des schémas bien au-delà des capacités humaines. Mais, comme l’explique Benjamin, le véritable défi ne réside pas uniquement dans les algorithmes : il concerne surtout la qualité et l’accessibilité des données.

C’est précisément là qu’interviennent le Structural Genomics Consortium (SGC) et ses initiatives. Grâce à des programmes comme AirCheck, les chercheurs produisent et organisent des ensembles de données chimiques et biologiques de haute qualité, spécialement conçus pour être compatibles avec l’IA (« AI-ready »). Cela implique des formats normalisés, des métadonnées harmonisées et des processus reproductibles permettant aux modèles d’apprentissage automatique d’apprendre de manière fiable et à grande échelle.

AirCheck : transformer les expériences en connaissances exploitables par l’IA

AirCheck a été conçu pour faire le lien entre la recherche expérimentale et l’intelligence artificielle.

Le projet intègre notamment :

  • Des bibliothèques chimiques codées par ADN capables de tester des milliards de composés.

  • Des méthodes de spectrométrie de masse pour réaliser des analyses plus ciblées et plus robustes.

  • Des plateformes systématiques de caractérisation des composés utilisées dans la recherche pharmaceutique.

Ces technologies produisent d’énormes volumes de données. Plus important encore, AirCheck veille à ce que ces données soient structurées, annotées et partagées de manière à pouvoir être exploitées efficacement par les systèmes d’intelligence artificielle. Comme le souligne Benjamin, l’objectif n’est pas simplement de collecter des données, mais de les rendre réutilisables, transparentes et accessibles à l’échelle mondiale afin que des chercheurs partout dans le monde puissent développer et valider des modèles d’IA.

Le laboratoire de Benjamin Haibe-Kains au University Health Network (UHN), où environ 25 à 30 chercheurs travaillent à l’intersection de l’intelligence artificielle, de la biologie computationnelle et de la découverte de médicaments.

My Research Cloud et Computing for Humanity : démocratiser l’accès au calcul scientifique

L’un des principaux défis de la recherche alimentée par l’intelligence artificielle est la puissance de calcul. L’entraînement et la validation de modèles à grande échelle nécessitent une infrastructure importante, souvent inaccessible aux laboratoires ou aux établissements disposant de ressources limitées.

Pour relever ce défi, Computing for Humanity offrira aux membres du projet AirCheck un accès à My Research Cloud, une plateforme conçue pour rendre les ressources informatiques plus accessibles et plus faciles à utiliser. Cette initiative repose sur un principe simple: l’innovation scientifique ne devrait pas dépendre du lieu où l’on travaille ni du niveau de financement de son institution.

Afin d’atteindre cet objectif, My Research Cloud vient compléter l’écosystème canadien du calcul informatique pour la recherche en réduisant les barrières à l’entrée et en favorisant une participation plus inclusive. Plus précisément, la plateforme permet aux chercheurs issus de pays à revenu élevé, intermédiaire ou faible de collaborer sur un pied d’égalité, offre aux étudiants et aux jeunes chercheurs la possibilité de travailler avec des ensembles de données réels et permet aux scientifiques citoyens de contribuer par de nouvelles idées et approches.

Le rôle essentiel des donateurs et des partenaires

Aucune de ces initiatives ne serait possible sans le soutien des donateurs, partenaires et collaborateurs qui contribuent à bâtir et à maintenir cette infrastructure.

Comme le souligne Benjamin, les partenaires de Computing for Humanity apportent une contribution essentielle en:

  • faisant don d’équipements informatiques haute performance qui alimentent la recherche en IA à grande échelle;

  • fournissant un soutien financier pour maintenir les infrastructures de données et les plateformes d’accès mondial;

  • offrant des services et une expertise permettant aux infrastructures de recherche de se développer.

Ces contributions ne sont pas accessoires : elles constituent le fondement même des progrès scientifiques.

Chaque serveur donné, chaque infrastructure financée et chaque ressource partagée renforcent un écosystème qui permet aux chercheurs de traiter des données biologiques complexes et de développer des modèles d’IA capables d’accélérer la découverte de nouveaux médicaments.

Grâce à des plateformes comme My Research Cloud, ces ressources ne profitent pas à une seule institution. Elles sont mises gratuitement à la disposition de la communauté canadienne de la recherche, ce qui multiplie leur impact auprès de milliers de chercheurs et de projets.

En rendant les ressources informatiques avancées accessibles aux chercheurs du monde entier, les donateurs et les partenaires contribuent à bâtir les fondations des prochaines grandes découvertes scientifiques. Cette infrastructure commune soutient notamment des initiatives ambitieuses comme Target 2035, dont l’objectif est d’accélérer la découverte de nouveaux médicaments grâce à l’intelligence artificielle et aux données biologiques à grande échelle.

Target 2035 : accélérer la découverte pour la prochaine génération de médicaments

Target 2035 est une importante initiative internationale du Structural Genomics Consortium visant à développer, d’ici 2035, des modulateurs pharmacologiques pour l’ensemble des protéines humaines. L’initiative cherche à approfondir notre compréhension de la biologie humaine et des maladies afin d’accélérer la découverte de nouveaux traitements. Un élément clé du projet consiste à produire des données de haute qualité sur jusqu’à 2 000 protéines, créant ainsi une base de connaissances permettant aux modèles d’intelligence artificielle d’apprendre les principes généraux des interactions entre molécules et cibles biologiques. Cependant, cet objectif ne pourra être atteint que si les méthodes computationnelles ainsi que les approches d’intelligence artificielle et d’apprentissage automatique progressent considérablement. Comme l’explique Benjamin Haibe-Kains, l’objectif à long terme est de développer des systèmes prédictifs capables d’identifier des composés prometteurs sans avoir à réaliser continuellement des expériences de laboratoire longues et coûteuses. Soutenue par des partenaires industriels internationaux ainsi que par des organismes publics de financement, cette initiative dépend également d’un accès ouvert et équitable aux infrastructures de calcul et aux données afin que les chercheurs du monde entier puissent y contribuer et en bénéficier.

Pourquoi la science ouverte est essentielle

Au cœur de toutes ces initiatives se trouve un principe fondamental : la science ouverte.

En partageant librement les données, les outils et les résultats, la communauté scientifique peut accélérer collectivement les progrès dans des domaines tels que :

  • la recherche sur le cancer;

  • les maladies neurologiques;

  • les maladies infectieuses;

  • la médecine de précision.

Benjamin rappelle que les progrès scientifiques reposent avant tout sur des fondations solides, notamment une gestion rigoureuse des données, leur annotation et leur partage, des aspects souvent sous-estimés mais pourtant indispensables.

Sans ces fondations, même les systèmes d’intelligence artificielle les plus avancés ne pourront exploiter pleinement leur potentiel.

Un écosystème scientifique mondial

Des infrastructures de calcul à la biologie expérimentale, l’avenir de la recherche repose sur une collaboration toujours plus étroite entre disciplines, institutions et pays.

Des initiatives comme AirCheck, My Research Cloud et Target 2035 incarnent une vision commune :

un monde où la découverte scientifique est plus rapide, plus ouverte et accessible aux chercheurs partout sur la planète.

Grâce à la collaboration entre des institutions comme University Health Network, le Structural Genomics Consortium, Computing for Humanity et leurs partenaires internationaux, cette vision devient progressivement une réalité.

Remarque :Cette entrevue a été révisée pour des raisons de longueur et de clarté.

Next
Next

Élargir l’accès à l’IA et au HPC: comment l’AI Sandbox de Cal Poly Pomona autonomise les étudiants