Oracle Cloud Infrastructure Data Scienceにより、データ・サイエンティストは機械学習モデルを迅速に構築、トレーニング、導入、管理することができます。
データ・サイエンティストは、任意のクラウドまたはオンプレミスにある任意のデータソースにアクセスして使用できます。これにより、使用できるデータの機能が増え、より高品質なモデルにつながります。
OCI Data Flowとの統合により、Data Science環境から大規模なSparkジョブを作成および実行するための簡単なインターフェイスが提供されます。さらに、PySpark環境では、ノートブック・セッションでのData Flowアプリケーションの反復開発が可能です。
最先端のデータ・プロファイリング機能、スマートな視覚化機能、データ準備ツールを使用して、探索的データ分析ワークフローを合理化できます。
OCI Data Scienceは、データ・サイエンティストが好んで使うPandas、Dask、Numpyなどのオープンソースデータ操作ツールと、データ・サイエンティストがデータを探索するのに役立つPlotly、Matplotlib、Bokehなどの一般的なオープンソース視覚化ツールをサポートしています。
組み込みのクラウドホスト型JupyterLabノートブック環境を使用することで、データ・サイエンティストのチームは、使い慣れたユーザー・インターフェイスによりモデルを構築およびトレーニングできます。
OCI Data Scienceには、何百もの一般的なオープンソースのツールとフレームワークが用意されており、データ・サイエンティストは多様なツールやフレームワークの中から使い慣れたものを選択できます。TensorFlowやPyTorchを使用するか、任意のフレームワークを追加して、機械学習モデルを構築できます。
NVIDIA GPUを使用すると、データ・サイエンティストはより短時間で深層学習モデルを構築してトレーニングできます。CPUと比較すると、パフォーマンスは5〜10倍高くなる可能性があります。
Accelerated Data Scienceライブラリは、Oracle AutoMLのほか、H2O 3やauto-sklearnなどのオープンソースツールもサポートしています。AutoMLは、適応サンプリング、自動化された機能選択、アルゴリズム選択、ハイパーパラメーター調整を実現しています。AutoMLによって正確なモデル候補が生成されるため、データ・サイエンティストは時間を大幅に節約できます。
自動化されたハイパーパラメーター調整をADS Tuner機能と共に使用してモデルを調整することで、時間と労力を節約できます。
自動化された評価により生成される一連の包括的なメトリックと視覚化を使用して、新しいデータに対してモデルのパフォーマンスを測定し、モデルの候補を比較できます。これにより、データ・サイエンティストは高品質のモデルを簡単に作成できます。
自動化されたモデル説明には、モデルの全体的な動作についてグローバルおよびローカルの説明に加え、特定のモデル予測も含まれます。モデルのコンシューマは、モデルに依存しない自動化された説明により、理解と信頼性の向上、規制のニーズへの対応、機械学習の導入の加速化を実現できます。
機械学習モデルをHTTPエンドポイントとして導入し、新しいデータのモデル予測をリアルタイムで提供できます。クリックしてモデルカタログから導入するだけで、OCI Data Scienceがコンピューティング・プロビジョニングや負荷分散を含むすべてのインフラストラクチャオペレーションを処理します。
データサイエンス・モデルをOracle Functionsとして簡単に導入できます。Oracle Functionsは、Oracle Cloud Infrastructureの拡張性が高いオンデマンドのサーバーレス・アーキテクチャです。
チームメンバーは、モデルカタログを使用して、完成した機械学習モデルを保存および共有します。カタログには、アーティファクトが保存されるほか、モデルの分類法とコンテキスト、ハイパーパラメーター、モデルの入力および出力データスキーマの定義、モデルの詳細な来歴情報(モデルのソースコードやトレーニング環境など)に関するメタデータが収集されます。
事前に構築され、選別されたconda環境を活用して、NLP、グラフ分析、Spark、NVIDIA RAPIDSなどのさまざまなユースケースに対応できます。カスタム環境を公開し、同僚と共有することで、再現可能なトレーニングおよび推論環境を確保できます。
お客様はOCI Data Scienceを使用して、データサイエンスのコラボレーションを改善し、機械学習モデルの構築にかかる時間とコストを節約しています。
JupyterLabに加え、Dask、scikit-learn、XGBoostなど数百のオープン・ソース・ライブラリとフレームワークで、データサイエンスの分野で最も一般的な言語のPythonを使用できます。または、柔軟性を最大限に高めるために選択したライブラリをインストールします。
Accelerated Data Science(ADS)は、データサイエンス・ライフサイクル全体をカバーするエンドツーエンドのPythonライブラリであり、高品質のモデルをより迅速かつ簡単に作成できます。
セルフサービス型のオンデマンド・インフラストラクチャを使用すると、データ・サイエンティストは、インフラストラクチャのプロビジョニングやメンテナンスについて心配することなく、あらゆる規模のプロジェクトに取り組むために必要なコンピュート・リソースとストレージ・リソースの量を選択できます。
チームベースのセキュリティ・ポリシーにより、データ・サイエンティストはプロジェクトにチームメンバーを含めることができます。これらのポリシーにより、モデル、コード、データへのアクセスを制御して、機密性の高い作業を保護しながらコラボレーションを促進できます。セキュリティ制御は、Oracle Cloud Infrastructure Identity and Access Managementと完全に統合されています。
データにアクセスする方法からモデルの説明の背後にある数学までのトピックをカバーする、数十のチュートリアルとサンプルノートブックを利用できます。実証済みの方法と実装のヒントを使用して、さまざまなビジネス上の問題への取り組みをすぐに開始できます。
製品 |
単価 |
課金単位 |
Compute - Standard - E2 |
vCPU/時間 |
|
Compute - Virtual Machine Standard - X7 |
vCPU/時間 |
|
Compute - Standard - E3 - OCPU |
vCPU/時間 |
|
Compute - Standard - E3 - メモリ |
GB/時間 |
|
VM.GPU2.1(NVIDIA P100) |
GPU/時間 |
|
VM.GPU3.x(NVIDIA V100 Tensorコア - 16 GB) |
GPU/時間 |
|
Block Volume Storage |
ギガバイトストレージ容量/月 | |
Block Volumeパフォーマンス単位 |
GB/月のパフォーマンス単位 |
製品 |
単価 |
課金単位 |
Object Storage - ストレージ |
ギガバイトストレージ容量/月 |
製品 |
単価 |
課金単位 |
Compute - Virtual Machine Standard - X7 |
vCPU/時間 |
|
ロードバランサベース | ロードバランサ時間 | |
ロードバランサ帯域幅 | Mbps/時間 | |
Block Volume Storage |
ギガバイトストレージ容量/月 |
|
Block Volumeパフォーマンス単位 |
GB/月のパフォーマンス単位(Balanced Performanceでは$0.017で10 VPU) |
一般的なクラウド業界の慣行では、含まれる仮想CPU(vCPU)の数に基づいてコンピュート・インスタンスを定義します。各vCPUは、1スレッドの実行のための容量を提供します。vCPUは、物理コンピュートコア全体を提供するのではなく、コアの一部です。対照的に、オラクルのx86コンピュートシェイプは、物理CPUコアと同等のOCPUを使用し、それぞれが2つのスレッドを提供します。お客様がクラウド・サービス・プロバイダー間で比較しやすくするために、オラクルはWebページにvCPUの価格を表示し、請求はお客様が消費するOCPU時間の数に基づいています。顧客が請求される1時間あたりのOCPU料金は、Webページ上のvCPU料金の2倍となります。これは、お客様が1つではなく2つのvCPUの計算能力を得られるためです。
インタラクティブなツアーでこのユーザー・インターフェイスをご体験ください。
製品のライブ体験を無料でお試しください。
サンプルコード、ラボ、チュートリアルをご覧ください。
Data Scienceニュースレターで詳細をご覧ください。