O CMRI usa Oracle AI para ajudar a curar o câncer infantil e melhorar a eficiência em 30% a 50%
31 de maio de 2022 | 6 um minuto
“A Oracle nos forneceu a inteligência artificial e a plataforma de computação de que precisávamos para desenvolver pesquisas para curar o câncer infantil.”
O autor gostaria de agradecer a Prachi Solomon, engenheira principal de soluções da Oracle, por suas contribuições.
O Children's Medical Research Institute (CMRI) é um instituto australiano de pesquisa médica e biológica e uma organização sem fins lucrativos registrada. Por mais de 60 anos, o instituto melhorou os resultados de tratamentos de saúde de crianças. A organização foi responsável por muitas inovações, incluindo a criação da primeira unidade de investigação para recém-nascidos da Austrália e o avanço das técnicas de microcirurgia para ajudar a reparar vasos sanguíneos e órgãos em bebês e crianças.
Hoje, o CMRI avança na pesquisa nas áreas de câncer infantil, epilepsia, distúrbios oculares e outras doenças genéticas. Mas para analisar dados de sequenciamento genômico, proteômica, imagens de alta resolução de microscópios e simulações numéricas – e para gerenciar vários terabytes de dados –, o CMRI sabia que precisava de melhores recursos computacionais do que sua solução atual poderia oferecer e um serviço avançado de ciência de dados para apoiar seus objetivos de machine learning.
Ao adotar a Oracle Cloud com Oracle AI, o CMRI conseguiu:
- Reduzir o tempo de simulações numéricas de 30 para cinco dias com o OCI Data Science
- Ser de 30 a 50% mais eficiente com os recursos
- Economizar aproximadamente 30% em custos com a Oracle Cloud
Objetivos do CMRI na nuvem
Com pesquisadores colaborando em vários locais e a necessidade de poder computacional adicional, incluindo CPUs e GPUs rápidas, o CMRI sabia que era hora de mudar a forma como historicamente gerenciava pipelines de dados. A instituição tinha os seguintes objetivos:
- Otimizar seus processos para melhorar o desempenho
- Facilitar a colaboração e aproveitar os dados ao máximo
A organização avaliou ofertas da AWS, Google e Oracle. Para o instituto, a solução certa iria:
- Permitir que a organização provisione infraestrutura quase instantaneamente
- Expandir ou diminuir conforme as necessidades mudam
- Fornecer data center físico e segurança de rede virtual.
Também forneceria um serviço de machine learning para gerenciar todo o ciclo de vida do modelo, daria acesso a bibliotecas e ferramentas de código aberto e facilitaria para os cientistas de dados compartilhar e reutilizar modelos.
Além disso, o CMRI procurou tornar os dados de pesquisa compartilháveis, personalizáveis e reutilizáveis para pesquisadores, cientistas de dados e equipes de operações. Com um servidor local on-premises, os recursos eram compartilhados entre diversas pessoas, desacelerando o processo de pesquisa. Quando a pandemia exigiu o trabalho a partir de casa, os pesquisadores tiveram de logar nos sistemas externamente, o que era mais lento e menos eficiente.
Conjunto de serviços de nuvem e machine learning selecionados
O CMRI fez parceria com a Oracle para enfrentar seus desafios imediatos no apoio à pesquisa médica com análise de dados em larga escala e dados provenientes de tecnologias NGS de alto rendimento.
O CMRI escolheu o OCI Data Science por seus recursos de machine learning, além de uma série de outros serviços, incluindo:
- Oracle Cloud Infrastructure: Oracle Cloud é a primeira nuvem pública construída desde o início para ser uma nuvem melhor para cada aplicação. Ao repensar a engenharia central e o design de sistemas para computação em nuvem, criamos inovações que aceleram as migrações, oferecem melhor confiabilidade e desempenho para todas as aplicações e fornecem os serviços completos de que os clientes precisam para criar aplicações modernas.
- OCI Data Science: OCI Data Science é um serviço totalmente gerenciado serverless para equipes de ciência de dados criarem, treinarem e gerenciarem modelos de machine learning na Oracle Cloud Infrastructure. Ele fornece aos cientistas de dados um espaço de trabalho colaborativo e orientado a projetos para treinar modelos usando ferramentas, bibliotecas e pacotes centrados em Python em ambientes Conda.
- OCI Object Storage: O Oracle Cloud Infrastructure (OCI) Object Storage permite que os clientes armazenem com segurança qualquer tipo de dados em seu formato nativo. Com a redundância integrada, o OCI Object Storage é ideal para criar aplicações modernas que requerem dimensionamento e flexibilidade, pois pode ser usado para consolidar várias fontes de dados para fins de análise, backup ou arquivamento.
Produtos e serviços
Migração para a Oracle Cloud
O CMRI passou alguns meses testando várias nuvens, incluindo AWS, mas acabou escolhendo a OCI devido aos seus recursos e usabilidade. O instituto escolheu a OCI pelos seguintes motivos:
- Melhor desempenho para os recursos mais importantes
- Contenção de custos
- Suporte aprimorado à nuvem, com engajamento e reuniões frequentes para solucionar problemas
- Capacidade de atender à necessidade de atualizações e complexidades de infraestruturas obsoletas
- Solução integrada de IA com acesso a bibliotecas e estruturas de código aberto
Como o CMRI já estava testando a OCI há alguns meses, demorou menos de uma semana para implementar oficialmente os projetos na nuvem. O instituto priorizou trabalhos que exigiam RAM e CPUs com uso intensivo de computação. Também favoreceu projetos que exigiam muita colaboração, porque esses seriam os projetos que mais se beneficiariam com a migração para a nuvem.
Algumas das escolhas de arquitetura da organização incluíram o uso de unidades de volume em blocos em várias instâncias usando uma rede VCN compartilhada, o que significa que o CMRI não precisa mais copiar dados. Isso permitiu mudar de uma instância de ciência de dados para uma VM. O CMRI usa o OCI Object Storage para armazenar conjuntos de dados arquivados. Além disso, o instituto usa muitos pipelines com linguagem de fluxo de trabalho específica de domínio e usa encaminhamento local e tunelamento SSH para se conectar a servidores através da Internet pública.
Resultados de pesquisas médicas proporcionados por IA e machine learning
Uma simulação numérica típica que antes levava cerca de 30 dias para ser executada, agora leva apenas cinco dias com o OCI Data Science, independentemente da quantidade de simulações. Isso é possível com o OCI Data Science, um serviço completo de machine learning que permite ao CMRI fornecer aos pesquisadores modelos básicos para diferentes tipos de análises e dados, e que os cientistas de dados podem personalizar ainda mais.
Exemplos de usos do OCI Data Science incluem a simulação de proteínas e a medição do que ocorre quando uma mutação é introduzida em proteínas específicas e se essa mutação torna as proteínas mais fracas ou mais fortes, e a análise de dados de projetos proteômicos.
A mudança para a OCI ajudou o CMRI a obter acesso consistente à tecnologia mais recente. Galaviz explicou: “Uma coisa que precisávamos fazer antes de adquirir a OCI era ter nosso próprio servidor e usar nossas próprias placas gráficas. Mas o problema é que as placas gráficas estão em constante evolução, por isso as nossas tornaram-se obsoletas muito rapidamente. Mas a Oracle atualiza constantemente suas placas gráficas para que tenhamos sempre hardware adequado.”
O CMRI usa GPUs fornecidas pela Oracle para executar simulações dinâmicas moleculares intensivas, além de uma ferramenta da NVIDIA chamada Parabricks, que ajuda o instituto a combinar sequências de um genoma a partir de uma referência. O CMRI agora pode testar e provisionar recursos com mais rapidez, em vez de esperar por transferências de dados ou pela obtenção de recursos. Agora, a organização pode implementar e configurar novos projetos em apenas um dia.
A migração para a OCI ajudou o CMRI a aproveitar os recursos de big data e machine learning para automatizar tarefas rotineiras de consolidação de banco de dados, relatórios operacionais e processamento de dados em lote. Também tornou os dados disponíveis com muito mais rapidez. A OCI ajudou o CMRI a simplificar a governança e a segurança. Antes da OCI, o CMRI tinha uma unidade compartilhada centralizada com acesso complicado por meio de VPN e unidades de montagem. Agora, a organização pode compartilhar os dados do OCI Object Storage. Com a OCI, o CMRI pode colocar mais controles em seus ambientes e desenvolver ambientes para análises específicas. Isso simplifica a governança, especialmente quando os pacotes não são compatíveis entre diferentes tipos de software. Também permite que o CMRI se concentre na construção de um pipeline mais avançado para pesquisa médica. Hoje, o CMRI pode compartilhar prontamente dados, códigos e recursos com pessoas em todo o instituto.
Estar em uma plataforma de nuvem unificada também ajuda o instituto a criar fluxos de trabalho e gerar resultados reproduzíveis. A modernização possibilitada pela nuvem está trazendo oportunidades transformadoras para o CMRI, como a realização de pesquisas complexas em terapia genética. Para projetos como scRNA-Seq e de genômica, o CMRI agora é de 30 a 50% mais eficiente com seus recursos. E a economia de custos é de aproximadamente 30% em comparação com a manutenção de um servidor.
Metas futuras de pesquisa médica com machine learning
Eventualmente, o CRMI pretende usar o OCI Vision e o OCI Data Labeling para automatizar fluxos de trabalho em torno de células delimitadoras. O instituto também planeja colocar uma imagem no armazenamento de objetos, executar scripts para extrair a imagem e processá-la assim que a rede for treinada. Outra oportunidade de expansão que a instituição tem explorado está na integração de big data. Projetos envolvendo proteômica, genômica e transcriptômica requerem amostras e metadados de diferentes institutos e precisam integrar dados de diferentes doenças como câncer de mama, câncer ósseo, etc. Para isso, o CMRI utilizará recursos computacionais adicionais na OCI.
O CMRI está continuamente ampliando os limites da pesquisa médica e, com a Oracle, pode continuar a melhorar a vida de muitas crianças.
Para experimentar a Oracle AI, participe de um workshop gratuito sobre machine learning:
Related stories and resources
CMRI cuts costs by 25% with Oracle Cloud Infrastructure
Australian research institute embraces OCI Data Science to unlock flexibility and scalability, discover new insights, and perform analysis faster.