La bioinformática se ha convertido en los últimos años en una de las ciencias más estudiadas y que más auge ha experimentado, además encuentra aplicación en muchas y muy variadas disciplinas, pero en lo que respecta al tratamiento de grandes volúmenes de datos, un campo de estudio destaca sobre todos los demás: la genómica y especialmente una de sus ramas, la secuenciación del ADN.
La secuenciación del ADN es un proceso complejo y costoso, que ha de ser abordado a lo largo de fases sucesivas. Los sistemas de secuenciación genética capturan cadenas o fragmentos de ADN a partir de una muestra, que más tarde habrán de ser ‘alineados’ con un genoma de referencia de cara a su posterior estudio e interpretación. De entre todas las fases implicadas en la secuenciación del genoma, el alineamiento es una de las más costosas a nivel computacional; una barrera que se manifiesta de manera más acuciante conforme aumenta el número de cadenas de ADN que han de ser alineadas, pudiendo alcanzar cifras de miles de millones.
Hasta ahora, procesar toda esa información con la herramienta de referencia en el campo, BWA o Burrows-Wheeler Aligner, exigía un tiempo de ejecución excesivamente elevado, lo que ha llevado a los profesionales a demandar soluciones para incrementar el rendimiento de los alineadores con el objetivo de obtener resultados en un tiempo razonable.
Para dar respuesta a este desafío científico, los investigadores del CiTIUS han presentado en la revista Bioinformatics la solución BigBWA, una nueva herramienta que permite aprovechar las ventajas de las tecnologías Big Data para incrementar el rendimiento de las operaciones de alineado acometidas por BWA. Obteniendo como resultado un increíble incremento de eficiencia, ya que se ha reducido el tiempo necesario para alinear 6.000 millones de cadenas de ADN de 4 días completos a tan solo 8 horas empleando tan sólo un pequeño clúster de computación compuesto por 6 servidores, por lo que si se aumenta dicho clúster el tiempo de procesamiento se continuará reduciendo.
La principal ventaja de la herramienta es que consigue dividir la labor del alineamiento de secuencias de ADN en multitud de procesos independientes que pueden ejecutarse al mismo tiempo -tanto en distintos procesadores como en distintos servidores-. Sin embargo, el aspecto más singular del trabajo es que no sólo introduce el paralelismo a nivel de cómputo, sino que presenta también soluciones de almacenamiento distribuido. Una aproximación claramente innovadora en el ámbito de la genómica, que junto a la paralelización del código hace posible reducir drásticamente los tiempos de ejecución.
Por otra parte, BigBWA es tolerante a fallos, lo que permite asegurar la correcta finalización de las tareas de alineamiento -incluso si se produjeran errores hardware en alguno de los servidores utilizados durante el proceso-. «Es una solución de software libre que ya está disponible para los profesionales, y puede ejecutarse tanto en pequeños servidores como en sistemas de computación de altas prestaciones». Para Juan Carlos Pichel, investigador principal del equipo responsable del trabajo, «una ventaja sustancial es que el uso de BigBWA no implica ningún tipo de modificación en el código fuente de la herramienta original. Eso significa que cualquier futura actualización en los algoritmos BWA seguirá siendo compatible con nuestra solución».
Noticias de la Ciencia (04/11/2015)
http://noticiasdelaciencia.com/not/16840/aceleran-la-secuenciacion-de-adn-utilizando-tecnologias-big-data/