Oracle Cloud Infrastructure(OCI) Data Flow는 인프라 배포 또는 관리의 필요성이 없는 완전 관리형 Apache Spark 서비스로, 대량의 데이터 세트에서의 작업 처리를 수행합니다. 개발자는 Spark Streaming을 사용해서 지속적으로 생성되는 데이터 스트리밍에 대한 클라우드 ETL을 수행할 수 있습니다. 이를 통해 개발자는 인프라 관리가 아닌 앱 개발에 집중할 수 있어 신속한 애플리케이션 제공이 가능합니다.
Discover how Ronin leveraged OCI Data Flow with Apache Spark to build a future where every clinical decision is rooted in data, personalized for a given individual, and rendered efficiently with confidence.
Oracle Developer Live 이벤트를 시청하고 데이터 통합 및 데이터 흐름을 활용하여 데이터 사용 방식을 최적화하는 방법에 대해 알아보세요.
Data Flow로 Spark 애플리케이션을 쉽고, 안전하고, 간단하게 실행하는 방법에 대해 알아보세요.
OCI Data Flow는 Spark 작업이 완료되면 인프라 프로비저닝, 네트워크 설정 및 해제를 처리합니다. 스토리지 및 보안도 관리되기 때문에 빅데이터 분석을 위한 Spark 애플리케이션 생성 및 관리에 필요한 작업이 줄어듭니다.
OCI Data Flow를 사용하면 설치, 패치 또는 업그레이드할 클러스터가 없으므로 프로젝트의 시간과 운영 비용이 절약됩니다.
OCI Data Flow는 개인 전용 리소스에서 각 Spark 작업을 실행하므로 사전 용량 계획이 필요하지 않습니다.
OCI Data Flow를 사용하면 IT 부서는 Spark 작업이 실행되는 동안 사용하는 인프라 리소스에 대해서만 비용을 지불하면 됩니다.
오라클 클라우드 인프라스트럭쳐(OCI)의 탁월한 보안 기능을 활용하세요. 인증, 격리 및 기타 모든 중요 사항이 해결됩니다. 최고 수준의 보안으로 업무상 중요한 데이터를 보호합니다.
OCI Data Flow는 오라클 클라우드의 Identity and Access Management 시스템을 기본적으로 사용하여 데이터와 액세스를 제어하므로 데이터가 안전하게 유지됩니다.
할당량 및 제한을 설정하여 OCI Data Flow에 사용할 수 있는 리소스와 비용을 관리합니다.
OCI Data Flow를 통해 로그 관리 및 운영 UI에 대한 액세스와 같은 일반적인 운영 작업을 단순화하여 개발자는 애플리케이션 구축에 집중할 시간을 확보할 수 있습니다.
OCI Data Flow을 통해 운영 정보를 검색 가능한 단일 UI로 집계하여 Spark 사용자가 수행하는 작업을 쉽게 확인할 수 있습니다.
Spark 작업 문제를 해결하기 위해 로그 및 도구를 추적하는 데는 몇 시간이 걸릴 수 있지만 로그 출력, Spark 기록 서버 등의 통합 보기를 사용하는 경우에는 그렇지 않습니다.
분류, 검색 및 필터링하여 과거의 애플리케이션을 조사하고 비용이 많이 드는 작업에 더 잘 대처하며 불필요한 지출을 피하세요.
관리자는 너무 오래 실행되거나 너무 많은 리소스를 소비하고 비용을 증가시키는 라이브 Spark 작업을 쉽게 검색하고 중지할 수 있습니다.
빅데이터 에코시스템에는 많은 이동 부분과 통합이 필요하지만, OCI Data Flow는 기존 Spark 투자 및 빅데이터 서비스와 호환되므로 서비스를 쉽게 관리하고 필요한 곳에 결과를 제공할 수 있습니다.
Hadoop 또는 기타 빅데이터 서비스에서 기존 Spark 애플리케이션을 마이그레이션하세요.
Spark 작업의 출력을 자동으로 안전하게 캡처하고 저장한 다음 UI 또는 REST API를 통해 액세스하여 분석을 사용할 수 있습니다.
OCI Data Flow의 모든 상황은 애플리케이션 생성부터 실행, Spark 작업 결과 액세스에 이르기까지 간단한 REST API를 사용하여 관리할 수 있습니다.
오라클 클라우드 인프라스트럭쳐(OCI) Data Flow를 사용하여 데이터 처리에 필요한 시간을 75% 줄이고 비용을 300% 이상 절감함으로써 클라이언트 SLA를 충족할 수 있었습니다.Arun Nimmala, 전송 담당 이사 Oracle 글로벌 서비스 통합 및 분석 아키텍처
오라클 클라우드 인프라스트럭쳐(OCI) Data Flow는 Spark 작업을 감독하고 비용을 최적화하며 용량을 확보하여 ETL 오프로드를 관리합니다.
OCI Data Flow의 출력 관리 기능은 Spark를 사용하여 데이터를 쿼리하는 기능을 최적화합니다.
예측할 수 없는 일을 처리하고 비용을 낮추기 위해 리소스가 자동으로 이동될 수 있습니다. 대시보드는 향후 계획을 위해 사용량 및 예산 보기를 제공합니다.
Spark 및 머신 러닝 개발자는 Spark의 머신 러닝 라이브러리 사용 및 OCI Data Flow의 이점을 사용하여 모델을 실행할 수 있습니다.