Postée il y a 7 jours
Le stockage de données sur ADN émerge comme une technologie prometteuse pour archiver de très grandes quantités d’information dans un format extrêmement compact, stable et économique. Toutefois, il n’existe encore aucun mécanisme permettant de traiter ces données directement, sans les reconvertir en format numérique, ce qui constitue un frein majeur à son adoption à grande échelle. Ce projet doctoral vise à poser les bases d’un ordinateur moléculaire fondé sur l’ADN, capable de traiter des volumes massifs de données. Contrairement aux approches figées inspirées des circuits booléens ou neuronaux, où toutes les sorties possibles sont prédéfinies (logique fondée sur des tables de correspondance), ce projet explore un changement de paradigme vers un modèle algorithmique, notamment à travers l’utilisation des Compact Labelling Schemes. Cette approche permet une mise à l’échelle efficace, les molécules exécutant l’algorithme restant identiques quelle que soit la taille des données en entrée, tout en offrant des gains exponentiels en termes de temps de traitement.
Cependant, la programmation moléculaire algorithmique soulève de nouveaux défis. Le volume de données implique la présence d’un très grand nombre de brins d’ADN, chacun à très faible concentration, en raison des contraintes liées à la synthèse massive. Cette dilution, combinée aux limites de détection enzymatique, nuit à l’efficacité des programmes. L’objectif de ce doctorat est donc de développer des méthodes d’amplification sélective et contrôlée afin de renforcer la présence de brins d’intérêt au sein d’une bibliothèque d’ADN. L’amplification sera d’abord réalisée par PCR, nécessitant l’ajout de séquences amorces. Pour éviter que ces amorces ne perturbent le fonctionnement du programme moléculaire, une stratégie enzymatique sera mise en place afin de les retirer proprement à l’aide d’enzymes de restriction, permettant ainsi de restaurer des brins pleinement fonctionnels, sans compromettre l’intégrité ni l’efficacité du système.
En combinant innovations technologiques et fondements algorithmiques, cette thèse vise à établir les bases d’une nouvelle génération de calcul moléculaire : évolutif, programmable et directement intégré au support de stockage ADN — ouvrant ainsi de nouvelles perspectives en bioinformatique, médecine personnalisée et archivage de données à très long terme.