Inteligencia Artificial IA | 11 DIC 17

Google y la foto más precisa del genoma humano

Google lanzó una herramienta llamada DeepVariant que utiliza las últimas técnicas de inteligencia artificial (IA) para construir una imagen más precisa del genoma de una persona a partir de los datos de secuenciación.
Autor/a: MIT Tecnology Review 

Casi 15 años después de que se secuenciara el genoma humano por primera vez, dar sentido a la enorme cantidad de datos que codifica la vida humana sigue siendo un enorme reto. Pero también es precisamente el tipo de problema ideal para el aprendizaje automático.

DeepVariant ayuda a convertir las lecturas de secuenciación de alto rendimiento en una imagen de un genoma completo. Identifica automáticamente pequeñas mutaciones de inserción y de eliminación y las de pares de bases únicas en los datos de secuenciación.

La secuenciación de alto rendimiento se popularizó en la década de 2000, lo que facilitó la secuenciación de cada vez más genomas. Pero los datos generados sólo han dado lugar a una pequeña pincelada, y generalmente con errores, de la realidad de un genoma al completo. A los científicos les suele costar distinguir entre pequeñas mutaciones y errores aleatorios generados durante el proceso de secuenciación, especialmente en secciones repetitivas de un genoma. Estas mutaciones pueden estar directamente relacionadas con enfermedades como el cáncer.

Existen varias herramientas para interpretar estas lecturas, incluidas GATK, VarDict y FreeBayes. Sin embargo, estos programas de software suelen utilizar enfoques estadísticos y de aprendizaje automático más sencillos para identificar mutaciones al intentar descartar errores de lectura.

"El problema está en las partes difíciles del genoma, donde cada una de las [herramientas] tiene fortalezas y debilidades", explica el científico investigador de la Escuela de Salud Pública de la Universidad de Harvard (EEUU) Brad Chapman, que ayudó a desarrollar DeepVariant.

El experto añade: "Estas delicadas regiones son cada vez más importantes para la secuenciación clínica, y es importante disponer de múltiples métodos".

Chapman trabajó con investigadores del equipo Google Brain, un grupo especializado en desarrollar y aplicar técnicas de inteligencia artificial; con Verily, otra subsidiaria de Alphabet centrada en las ciencias de la vida; y con el vicepresidente de DNAnexus, una plataforma en la nube para el almacenamiento de datos genómicos, Andrew Carroll.

El equipo recopiló millones de lecturas de alto rendimiento y genomas completamente secuenciados del proyecto Genome in a Bottle (GIAB), un proyecto público-privado para promover herramientas y técnicas de secuenciación genómica. Con los datos, alimentaron un sistema de aprendizaje profundo y modificaron los parámetros hasta que aprendió a interpretar los datos secuenciados con un alto nivel de precisión.

El año pasado, DeepVariant ganó el primer premio del PrecisionFDA Truth Challenge, un concurso administrado por la Agencia de Alimentos y Medicamentos de Estados Unidos (FDA, por sus siglas en inglés) para promover una secuencia genética más precisa.

 

Comentarios

Para ver los comentarios de sus colegas o para expresar su opinión debe ingresar con su cuenta de IntraMed.

AAIP RNBD
Términos y condiciones de uso | Política de privacidad | Todos los derechos reservados | Copyright 1997-2024