Rapidly build, train, deploy, and manage machine learning models with a data science cloud platform built for teams.
Los científicos de datos pueden acceder y utilizar cualquier fuente de datos en cualquier nube o de forma local. Esto proporciona más funciones de datos potenciales que conducen a mejores modelos.
La integración con OCI Data Flow proporciona una interfaz sencilla para crear y ejecutar trabajos de Spark a gran escala desde el entorno de Data Science. Además, un entorno PySpark permite el desarrollo iterativo de aplicaciones de Data Flow en sesiones de bloc de notas.
Optimice los flujos de trabajo de análisis de datos exploratorios con capacidades de creación de perfiles de datos avanzadas, visualizaciones inteligentes y herramientas de preparación de datos.
OCI Data Science es compatible con las herramientas de manipulación de datos de código abierto favoritas de los científicos de datos, como Pandas, Dask y Numpy, así como con herramientas de visualización de código abierto populares como Plotly, Matplotlib y Bokeh para ayudar a los científicos de datos a explorar datos.
Los entornos de portátiles, integrados y alojados en la nube de JupyterLab permiten a los equipos de ciencia de datos crear y entrenar modelos utilizando una interfaz de usuario familiar.
OCI Data Science brinda familiaridad y versatilidad a los científicos de datos, con cientos de herramientas y marcos de trabajo de código abierto populares. Cree modelos de aprendizaje automático con TensorFlow o PyTorch, o agregue los marcos de su elección.
Con las GPUs de NVIDIA, los científicos de datos pueden crear y entrenar modelos de aprendizaje profundo en menos tiempo. En comparación con las CPUs, el rendimiento se puede acelerar de 5 a 10 veces.
La biblioteca de Accelerated Data Science es compatible con Oracle AutoML, así como con herramientas de código abierto como H2O 3 y auto-sklearn. AutoML ofrece muestreo adaptativo, selección automática de funciones, selección de algoritmos y ajuste de hiperparámetros. AutoML genera un candidato de modelo preciso para ahorrarle al científico de datos un tiempo significativo.
Ahorre tiempo y esfuerzo ajustando modelos con el ajuste automático de hiperparámetros utilizando la función ADS Tuner.
La evaluación automatizada genera un conjunto completo de métricas y visualizaciones para medir el rendimiento del modelo con datos nuevos y comparar modelos candidatos. Esto facilita la producción de modelos de alta calidad para los científicos de datos.
La explicación automatizada del modelo incluye explicaciones globales y locales con predicciones de modelo específicas para el comportamiento general de un modelo. Para los consumidores de modelos, las explicaciones automatizadas independientes del modelo mejoran la comprensión y la confianza, abordan las necesidades regulatorias y aumentan la velocidad de adopción del aprendizaje automático.
Implemente modelos de aprendizaje automático como puntos finales HTTP para entregar predicciones de modelos sobre nuevos datos en tiempo real. Simplemente haga clic para implementar desde el catálogo de modelos y OCI Data Science gestionará todas las operaciones de infraestructura, incluido el aprovisionamiento de cómputo y el equilibrio de carga.
Implemente fácilmente modelos de ciencia de datos como Oracle Functions, una arquitectura sin servidor, a pedido y altamente escalable en Oracle Cloud Infrastructure.
Los miembros del equipo utilizan el catálogo de modelos para conservar y compartir modelos de aprendizaje automático completos. El catálogo almacena los artefactos y captura metadatos en torno a la taxonomía y el contexto del modelo, hiperparámetros, definiciones de los esquemas de datos de entrada y salida del modelo e información detallada de procedencia sobre el origen del modelo, incluido el código fuente y el entorno de entrenamiento donde se entrenó el modelo.
Aproveche los entornos de conda prediseñados y organizados para abordar una variedad de casos de uso, como NLP, análisis de gráficos, Spark y NVIDIA RAPIDS. Publique entornos personalizados y compártalos con colegas, lo que garantiza la reproducibilidad de los entornos de entrenamiento e inferencia.
Los científicos de datos pueden conectarse al repositorio Git de su organización para preservar y recuperar el trabajo de aprendizaje automático.
Los clientes utilizan OCI Data Science para mejorar la colaboración de ciencia de datos y ahorrar tiempo y costos en la creación de modelos de aprendizaje automático.
Utilice Python, el lenguaje más popular para ciencia de datos, con JupyterLab y cientos de bibliotecas y marcos de código abierto como Dask, scikit-learn y XGBoost. O instale las bibliotecas de su elección para disfrutar de la máxima flexibilidad.
Accelerated Data Science (ADS) es una biblioteca Python integral que cubre todo el ciclo de vida de ciencia de datos, lo que hace que agiliza y facilita la producción de modelos de alta calidad.
Con la infraestructura de autoservicio a pedido, los científicos de datos seleccionan la cantidad de recursos informáticos y de almacenamiento que necesitan para abordar proyectos de cualquier tamaño, sin preocuparse por el aprovisionamiento o el mantenimiento de la infraestructura.
Las políticas de seguridad basadas en equipos permiten a los científicos de datos incluir miembros del equipo en proyectos. Estas políticas controlan el acceso a modelos, códigos y datos, lo cual facilita la colaboración y protege el trabajo confidencial. Los controles de seguridad están completamente integrados con Oracle Cloud Infrastructure Identity and Access Management.
Acceda a docenas de tutoriales y cuadernos de ejemplo, que cubren temas desde el acceso a los datos hasta las matemáticas detrás de las técnicas de explicación del modelo. Obtenga una ventaja para abordar diferentes problemas comerciales con una metodología probada y consejos de implementación.
Producto |
Precio unitario |
Métrica |
Procesamiento: estándar, E2 |
CPU virtual por hora |
|
Procesamiento: máquina virtual estándar, X7 |
CPU virtual por hora |
|
Procesamiento: estándar, E3, OCPU |
CPU virtual por hora |
|
Procesamiento: estándar, E3, memoria |
Gigabyte por hora |
|
VM.GPU2.1 (NVIDIA P100) |
GPU por hora |
|
VM.GPU3.x (NVIDIA V100 Tensor Core - 16 GB) |
GPU por hora |
|
Almacenamiento de volumen en bloque |
Capacidad de almacenamiento en gigabytes al mes | |
Unidades de rendimiento de volumen en bloque |
Unidades de rendimiento por gigabyte por mes |
Producto |
Precio unitario |
Métrica |
Almacenamiento de objetos: almacenamiento |
Capacidad de almacenamiento en gigabytes al mes |
Producto |
Precio unitario |
Métrica |
Procesamiento: máquina virtual estándar, X7 |
CPU virtual por hora |
|
Base del equilibrador de carga | Hora del equilibrador de carga | |
Ancho de banda del equilibrador de carga | Mbps por hora | |
Almacenamiento de volumen en bloque |
Capacidad de almacenamiento en gigabytes al mes |
|
Unidades de rendimiento de volumen en bloque |
Unidades de rendimiento por gigabyte por mes (10 VPU en $0,017 para rendimiento equilibrado |
Una práctica común de la industria de la nube es definir las instancias de procesamiento en función de la cantidad de CPU virtuales (vCPU) que incluyen. Cada CPU virtual entrega la capacidad para un subproceso de ejecución. Una CPU virtual no proporciona un núcleo de procesamiento físico completo, sino que es parte de un núcleo. Por el contrario, las formas de procesamiento x86 de Oracle utilizan OCPU que equivalen a núcleos de CPU físicos, cada una de las cuales proporciona dos subprocesos. Para facilitar a los clientes la comparación entre proveedores de servicios en la nube, en Oracle presentamos los precios de las CPU virtuales en nuestras páginas web, mientras que la facturación depende de la cantidad de tiempo de OCPU que consumen. La tarifa de OCPU por hora a la que se factura a los clientes es el doble del precio de CPU virtuales en las páginas web, ya que reciben dos CPU virtuales de potencia de procesamiento en lugar de una.
Oracle Cloud Infrastructure (OCI) Data Science lanzó una nueva función llamada Implementación de modelos para permitir el servicio de modelos de aprendizaje automático como puntos finales HTTP y proporcionar puntuación de datos en tiempo real.
Lea el artículo completoUn recorrido interactivo por la interfaz de usuario.
Experimente la interfaz de usuario con este recorrido interactivo
Experimente el producto en vivo de forma gratuita.
Descubra códigos de muestra, laboratorios y tutoriales
Descubra más en el boletín de Data Science