La méthode permet aux chercheurs d’analyser des millions de cellules avec la quantité de mémoire trouvée sur un ordinateur standard – Technoguide

Le fait que le corps humain soit composé de cellules est un concept de base bien compris. Pourtant, étonnamment, les scientifiques tentent toujours de déterminer les différents types de cellules qui composent nos organes et contribuent à notre santé.

Une technique relativement récente appelée séquençage monocellulaire permet aux chercheurs de reconnaître et de catégoriser les types de cellules en fonction de caractéristiques telles que les gènes qu’elles expriment. Mais ce type de recherche génère d’énormes quantités de données, avec des ensembles de données de centaines de milliers à des millions de cellules.

Un nouvel algorithme développé par Joshua Welch, Ph.D., du Département de médecine computationnelle et de bioinformatique, Ph.D. Le candidat Chao Gao et son équipe utilisent l’apprentissage en ligne, accélérant considérablement ce processus et permettant aux chercheurs du monde entier d’analyser de grands ensembles de données en utilisant la quantité de mémoire trouvée sur un ordinateur portable standard. Les résultats sont décrits dans la revue Nature Biotechnology.

«Notre technique permet à toute personne disposant d’un ordinateur d’effectuer des analyses à l’échelle d’un organisme entier», explique Welch. “C’est vraiment vers cela que le domaine se dirige.”

L’équipe a démontré sa preuve de principe en utilisant des ensembles de données de l’Initiative sur le cerveau de l’Institut national de la santé, un projet visant à comprendre le cerveau humain en cartographiant chaque cellule, avec des équipes d’enquête dans tout le pays, y compris le laboratoire de Welch.

En règle générale, explique Welch, pour des projets comme celui-ci, chaque ensemble de données à cellule unique soumis doit être réanalysé avec les ensembles de données précédents dans l’ordre où ils arrivent. Leur nouvelle approche permet d’ajouter de nouveaux ensembles de données à ceux existants, sans retraiter les anciens ensembles de données. Il permet également aux chercheurs de diviser les ensembles de données en soi-disant mini-lots afin de réduire la quantité de mémoire nécessaire pour les traiter.

«Ceci est crucial pour les ensembles de plus en plus générés avec des millions de cellules», déclare Welch. “Cette année, il y a eu cinq à six articles avec deux millions de cellules ou plus et la quantité de mémoire dont vous avez besoin juste pour stocker les données brutes est nettement supérieure à ce que quiconque a sur son ordinateur.”

Welch compare la technique en ligne au traitement continu des données effectué par les plateformes de médias sociaux comme Facebook et Twitter, qui doivent traiter les données générées en permanence par les utilisateurs et diffuser des publications pertinentes dans les flux des gens. “Ici, au lieu d’écrire des tweets, nous avons des laboratoires du monde entier qui réalisent des expériences et publient leurs données.”

Cette découverte a le potentiel d’améliorer considérablement l’efficacité d’autres projets ambitieux tels que la carte du corps humain et l’Atlas des cellules humaines. Selon Welch, “Comprendre le complément normal des cellules dans le corps est la première étape vers la compréhension de la façon dont elles tournent mal dans la maladie.”

Source de l’histoire:

Matériel fourni par Michigan Medicine – Université du Michigan. Original écrit par Kelly Malcom. Remarque: le contenu peut être modifié pour le style et la longueur.

.

A propos Technoguide

Voir aussi

Modèle mathématique prédisant les schémas de propagation de la maladie – Technoguide

Au début de la pandémie de COVID-19, les responsables de la santé ont saisi la …

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Défiler vers le haut