El CMRI utiliza Oracle AI para ayudar a curar el cáncer infantil y mejorar la eficiencia entre un 30% y 50 %
31 de mayo de 2022 | 6 minutos de lectura
“Oracle nos proporcionó la plataforma de inteligencia artificial y cómputo que necesitábamos para desarrollar investigaciones para curar el cáncer infantil.”
La autora quiere agradecer a Prachi Solomon, ingeniero principal de soluciones de Oracle por sus contribuciones.
Children's Medical Research Institute (CMRI) es un instituto australiano de investigación médica y biológica y una organización sin fines de lucro registrada. Durante más de 60 años, el instituto ha mejorado los resultados de atención médica para niños. Tiene muchas novedades, incluyendo la creación de la primera unidad de investigación para recién nacidos en Australia y el avance de las técnicas de microcirugía para ayudar a reparar vasos sanguíneos y órganos en bebés y niños.
Hoy en día, el CMRI avanza en la investigación de salud para niños en las áreas de cáncer infantil, epilepsia, trastornos oculares y otras enfermedades genéticas. Pero para analizar los datos de la secuenciación de la genómica, la proteómica, las imágenes de alta resolución de microscopios y las simulaciones numéricas, y para gestionar varios terabytes de datos, el CMRI sabía que necesitaba mejores recursos informáticos de los que podría ofrecer su solución existente, y un servicio avanzado de ciencia de datos para respaldar sus objetivos de machine learning.
Al adoptar Oracle Cloud con Oracle AI, el CMRI logró:
- Reducir el tiempo de simulación numérica de 30 a 5 días con OCI Data Science
- Aumentar entre un 30 y un 50 % la eficiencia de sus recursos
- Ahorrar aproximadamente un 30 % de los costos con Oracle Cloud
Objetivos de la nube de CMRI
Con la colaboración de investigadores de todas las ubicaciones y la necesidad de potencia informática adicional, incluidas CPU y GPU rápidas, CMRI sabía que era hora de cambiar la forma en que históricamente gestionaba los pipelines de datos. La institución tenía los siguientes objetivos:
- Optimizar sus procesos para mejorar el rendimiento
- Facilitar una colaboración fluida y aprovechar al máximo los datos
La organización evaluó AWS y Google, así como Oracle. El CMRI sabía que la solución ideal en la nube podría:
- Permitir al instituto aprovisionar la infraestructura casi instantáneamente
- Ampliar o reducir a medida que cambian las necesidades
- Proporcionar seguridad de red virtual y centro de datos físico.
También proporcionaría un servicio de machine learning que gestionaría todo el ciclo de vida del modelo, proporcionaría acceso a bibliotecas y herramientas de código abierto y facilitaría a los científicos de datos que querían compartir y reutilizar modelos.
Además, el CMRI buscó hacer que los datos de investigación fueran compartibles, personalizables y reutilizables para investigadores, científicos de datos y equipos de operaciones. Con un servidor on-premises, los recursos se compartieron entre varias personas, lo que hizo más lento el proceso de investigación. Cuando la pandemia obligó a trabajar desde casa, los investigadores tuvieron que conectarse a sistemas externos, lo que resultaba más lento y menos eficaz.
Suite de servicios seleccionados de machine learning y computación en la nube
El CMRI se alió con Oracle para abordar sus desafíos inmediatos en el apoyo a la investigación médica con análisis de datos a gran escala y datos procedentes de tecnologías NGS de alto rendimiento.
El CMRI eligió OCI Data Science por sus capacidades de machine learning, además de por una serie de otros servicios, que incluyen:
- Oracle Cloud Infrastructure: Oracle Cloud es la primera nube pública creada desde cero para convertirse en una mejor alternativa para cada aplicación. Al reimaginar la ingeniería básica y el diseño de sistemas para la computación en la nube, creamos innovaciones que aceleran las migraciones, mejoran la fiabilidad y el rendimiento de todas las aplicaciones, y ofrecen los servicios completos que los clientes necesitan para crear aplicaciones en la nube innovadoras.
- OCI Data Science: OCI Data Science es un servicio totalmente gestionado y sin servidor para que los equipos de ciencia de datos creen, entrenen y gestionen modelos de machine learning en Oracle Cloud Infrastructure. Proporciona a los científicos de datos un espacio de trabajo colaborativo basado en proyectos para entrenar modelos con herramientas, bibliotecas y paquetes centrados en Python en entornos Conda.
- OCI Object Storage: Oracle Cloud Infrastructure (OCI) Object Storage permite almacenar de forma segura cualquier tipo de datos en su formato nativo. Con redundancia integrada, OCI Object Storage es ideal para crear aplicaciones modernas que requieren escalabilidad y flexibilidad, ya que se puede usar para consolidar múltiples fuentes de datos con fines de analítica, copias de seguridad o archivo.
Productos y servicios
Ruta de migración a Oracle Cloud
El CMRI pasó unos meses probando varias nubes, incluido AWS, pero finalmente eligió OCI debido a sus funciones y usabilidad. La empresa escogió OCI por las siguientes razones:
- Mejor rendimiento para las funciones más importantes para el CMRI
- Ahorro de costos
- Soporte en la nube mejorado, con participación frecuente y reuniones para resolver obstáculos
- Capacidad para abordar la necesidad de actualizaciones y complejidades de infraestructura anticuadas
- Solución de IA integrada con acceso a bibliotecas y marcos de código abierto
Dado que el CMRI había estado probando OCI durante unos meses, les llevó menos de una semana implementar oficialmente proyectos en la nube. El CMRI priorizó los trabajos que requerían un uso intensivo de recursos y que requerían RAM y CPU con uso intensivo de recursos informáticos. También priorizaron proyectos que requerían una gran colaboración, porque estos eran los que más se beneficiarían de la migración a la nube.
Algunas arquitecturas incluyeron el uso de unidades de volumen en bloque en varias instancias mediante una red VCN compartida, lo que significa que el CMRI ya no tiene que copiar datos. Esto les ha permitido cambiar de una instancia de ciencia de datos a una máquina virtual. El CMRI utiliza OCI Object Storage para almacenar juegos de datos archivados. Además, el CMRI utiliza muchos pipelines con un lenguaje de flujo de trabajo específico del dominio y utiliza el reenvío local y el túnel SSH para conectarse a los servidores a través de la red pública de Internet.
Resultados de investigaciones médicas sobre IA y machine learning
Una simulación numérica típica que una vez le tomó al CMRI alrededor de 30 días en realizarse ahora solo toma cinco con OCI Data Science, independientemente del número de simulaciones en ejecución. Esto se logra con OCI Data Science, un servicio de machine learning integral que permite al CMRI proporcionar a los investigadores plantillas básicas para diferentes tipos de análisis y datos, y que los científicos de datos pueden personalizar aún más.
Entre los ejemplos de uso de OCI Data Science se incluyen la simulación de proteínas y la medición de lo que ocurre cuando se introduce una mutación en estas, y si esa mutación hace que las proteínas sean más débiles o más fuertes, y el análisis de datos de proyectos de proteómica.
La migración a OCI ha ayudado al CMRI a obtener acceso constante a la tecnología más actualizada. Galaviz explicó: "Una cosa que teníamos que hacer antes de adquirir OCI era comprar nuestro propio servidor y usar nuestras propias tarjetas gráficas. Pero el problema es que las tarjetas gráficas están evolucionando constantemente, por lo que las nuestras se hicieron obsoletas muy rápidamente. Pero Oracle actualiza constantemente sus tarjetas gráficas para que siempre tengamos hardware actualizado".
El CMRI utiliza GPU proporcionadas por Oracle para ejecutar simulaciones dinámicas moleculares intensivas, además de una herramienta de NVIDIA llamada Parabricks, que ayuda al CMRI a hacer coincidir secuencias de un genoma a un genoma de referencia. El CMRI puede ahora realizar pruebas y aprovisionar recursos con mayor rapidez, en lugar de esperar a que se transfieran datos o se obtengan recursos. Ahora, pueden implementar y configurar nuevos proyectos en un día.
La migración a OCI ha ayudado al CMRI a aprovechar las capacidades de big data y machine learning para automatizar las tareas rutinarias y la consolidación de bases de datos, los informes operativos y el procesamiento de datos por lotes. También ha hecho que los datos estén disponibles mucho más rápido para quienes los necesitan. OCI ha ayudado al CMRI a simplificar la gobernanza y la seguridad. Antes de OCI, el CMRI tenía una unidad compartida centralizada con acceso complicado a través de VPN y unidades de montaje. Ahora, pueden compartir los datos de OCI Object Storage. Con OCI, el CMRI puede colocar más controles en sus entornos y crear entornos específicos para análisis específicos. Esto simplifica la gobernanza, especialmente cuando los paquetes no son compatibles entre diferentes tipos de software. Esto permite al CMRI centrarse en la construcción de una tubería más avanzada para la investigación médica. Hoy en día, el CMRI puede compartir fácilmente datos, código y recursos con las personas a través del instituto.
Estar en una plataforma en la nube unificada también ayuda al instituto a crear flujos de trabajo y generar resultados reproducibles. La modernización habilitada en la nube está brindando oportunidades transformadoras al CMRI, como la realización de investigaciones complejas de terapia génica. Para proyectos como scRNA-Seq y genómica, el CMRI ahora es un entre 30 a 50 % más eficiente con sus recursos. Y su ahorro de costos es aproximadamente un 30 % menor en comparación con el mantenimiento de un servidor.
Objetivos futuros de investigación médica de machine learning
Con el tiempo, el CRMI pretende utilizar OCI Vision y OCI Data Labeling a la hora de automatizar los flujos de trabajo en las celdas delimitadas. El CMRI también planea colocar una imagen en el almacenamiento de objetos, ejecutar scripts para extraerla y procesarla una vez que se haya entrenado la red. Otra oportunidad de expansión que la institución ha explorado es en la integración de big data. Proyecto que involucra proteómica, genómica, transcriptómica requieren muestras y metadatos de diferentes institutos y necesitan integrar datos de diferentes enfermedades como cáncer de mama, de hueso, etc. Para ello, el CMRI utilizará potencia computacional adicional en OCI.
El CMRI está superando continuamente los límites de la investigación médica y, con Oracle, pueden seguir mejorando la vida de los niños.
Para probar Oracle AI, inicia un taller gratuito de machine learning:
Related stories and resources
El CMRI disminuye los costos en un 25 % con Oracle Cloud Infrastructure
El instituto de investigación australiano utiliza OCI Data Science para aprovechar la flexibilidad y las posibilidades de ampliación, descubrir nuevas estadísticas y realizar análisis más rápidamente.