죄송합니다. 검색 내용과 일치하는 항목을 찾지 못했습니다.

원하시는 정보를 찾는 데 도움이 되도록 다음을 시도해 보십시오.

  • 검색에 사용하신 키워드의 철자가 올바른지 확인하십시오.
  • 입력한 키워드에 동의어를 사용하십시오. 예를 들어 “소프트웨어” 대신 “애플리케이션”을 사용해 보십시오.
  • 새로운 검색을 시작하십시오.
문의하기 Oracle Cloud에 로그인

빅데이터 오픈 소스

오픈 소스를 포함하지 않고 빅 데이터에 대한 이야기를 작성하기가 어렵습니다. 두 데이터가 함께 묶입니다. 오픈 소스 소프트웨어의 개발은 빅 데이터의 진화에 큰 요인이었습니다. 또한 오픈 소스 기술은 빠른 혁신의 기능으로 인해 빅 데이터 생태계의 핵심 요소가 되고 있습니다. 실제로 빅데이터 소프트웨어에서 가장 중요한 이름인 Hadoop, Spark, Cassandra 및 Kafka는 모두 오픈 소스입니다.

기업은 빅 데이터에 오픈 소스를 어떻게 사용하고 있습니까?

오픈 소스 소프트웨어는 취미와 아마추어 개발자의 마음에 드는 명성을 가지고 있지만, 비즈니스 세계는 꽤 오랫동안 미션 크리티컬 환경에서 오픈 소스를 채택하고있다.

기업이 오픈 소스 소프트웨어를 선택하는 몇 가지 이유는 다음과 같습니다.

  • 경쟁력 있는 특징 및 기술 기능
  • 솔루션의 품질
  • 문제 사용자정의 및 수정 기능
  • 낮은 진입 장벽

아마도 오픈 소스의 가장 큰 장점 중 하나는 크고 헌신적인 개발자 커뮤니티입니다. 가장 인기 있는 오픈 소스 프로젝트는 기술을 패치하고 개선하기 위한 막대한 개발자 기반을 제공합니다. 개발자는 경쟁적인 기능과 혁신적인 기능을 제공하는 오픈 소스로 여겨지며, 이는 기존 소프트웨어가 만들 수 있는 것과 비교할 때 특히 유용합니다.

오픈 소스는 자체 개발 또는 자체 소프트웨어를 구축할 IT 리소스가 없는 회사에 특히 유용합니다. 또는 이러한 리소스를 보유한 기업은 직원들에게 더 관심이 있는 최첨단 기술을 제공하기 위해 오픈 소스로 전환할 수 있습니다.

기업은 오픈 소스를 어떻게 확인합니까?

오픈 소스 기술은 많은 것을 약속합니다. 하지만 도전이 없는 것은 아니다. 2016년 North Bridge 및 Black Duck Future of Open Source Study에 따르면 거의 33%의 기업들은 알려진 오픈 소스 취약점을 확인, 추적 또는 수정하는 프로세스를 진행하지 않아 보안 위협에 노출될 수 있습니다.

오픈 소스는 빅 데이터 커뮤니티에 매우 유리했습니다. 오픈 소스 소프트웨어를 통해 기업은 즉시 사용 가능한 코드를 통해 제품을 보다 빠르게 출시할 수 있습니다. 그러나 그것은 항상 일정한 위험을 감수했습니다. 2014년의 OpenSSL Heartbleed 보안 취약성은 취약점의 한 예입니다.

많은 기여자를 통해 얻은 이점에도 불구하고 오픈 소스 소프트웨어는 일반적인 프로그래밍 실수와 보안 블런더의 영향을 받지 않습니다. 대부분의 소프트웨어 엔지니어는 오픈 소스 사용을 추적하지 않으므로 많은 기업에서 직면할 수 있는 보안 및 규제 준수 위험을 모르고 있습니다.

오픈 소스가 완벽하게 사용 가능하고 효과적이려면 대부분의 기업이 통합되어 어느 정도 지원되어야 합니다. 어떤 의미에서는 오픈 소스가 완료되지 않기 때문에 말하기가 더 쉽습니다. 항상 새로운 작업이 있습니다. 또한 오픈 소스 제품은 작업하기 쉽지 않은 경우가 많습니다. 오픈 소스를 사용하려면 교육이 필요할 수 있습니다. 기존 애플리케이션 및 하드웨어와의 호환성은 또 다른 문제입니다. 대부분의 회사는 다른 회사를 통해 오픈 소스를 채택합니다.

Oracle, Databricks 및 DataStax과 같은 기업은 이러한 방식으로 오픈 소스와 협력하고 있습니다. 이 기업들은 오픈 소스를 기업에 제공하여 완전한 가용성을 확보했습니다. 이러한 기업들은 커밋과 다양한 개선 방안을 통해 오픈 소스에 가치를 더하기 때문에 큰 이점이 있습니다.

2017년 오픈 소스 정상회담에서 Linux 설립자 Linus Torvalds는 기업 개발자들의 기업 영향력을 인정하고 오픈 소스 프로젝트에 대한 작업을했습니다. "기업을 오픈 소스로 유지하는 것이 매우 중요합니다."라고 그는 말합니다. "제가 행복했던 것은 한 가지입니다."

Oracle Big Data는 오픈 소스를 어떻게 사용합니까?

2017년 Oracle은 오픈 소스 소프트웨어 개발 및 유지 관리에 있어 주요 역할을 하는 상위 35개 기업 중 하나로 선정되었습니다. 2010년에 Sun Microsystems를 구매하면서 Oracle은 세계에서 가장 인기 있는 오픈 소스 기술을 상속받았습니다. 오픈 소스 빅 데이터 기술에 대한 오라클의 지원은 지난 몇 년간 우리를 위한 지배적인 성장 동인 중 하나였습니다. Oracle은 오픈 소스 개발 및 기반을 지속적으로 지원합니다.

빅 데이터와 관련하여 Oracle은 오픈 소스 소프트웨어와 관련하여 특히 사전 예방적이었습니다. 다음 섹션에서는 Oracle이 빅 데이터 플랫폼의 다양한 영역에서 오픈 소스를 사용하는 방법에 대해 설명합니다. Oracle에서는 빅 데이터로 작업할 때 다음 세 가지 주요 단계가 포함됩니다.

  • 빅 데이터를 통합하여 시스템으로 가져오기
  • 빅 데이터 관리 및 저장 장소 확보
  • 분석을 통해 머신 러닝을 기반으로 데이터를 기반으로 사전 예방적 모델을 파악, 시각화, 감지 및 구축

통합 및 빅데이터

많은 빅 데이터 고객이 특별히 오픈 소스 서비스를 요구하고 있습니다. Oracle은 오픈 소스 개발, 지원 및 홍보를 위해 노력하고 있습니다. Oracle Data Integration 및 Oracle GoldenGate와 같은 Oracle 데이터 통합 제품에는 다른 여러 플랫폼과 함께 오픈 소스 기술이 포함됩니다.

또한 많은 고객이 오픈 소스 프레임워크와 지속적으로 변화하는 지원 기술을 모던화하기를 원한다는 사실을 인지하고 있습니다. 데이터 통합 측면에서 현재 약 25개의 서로 다른 오픈 소스 기술, 데이터 소스, 대상 및 실행 프레임워크를 지원합니다. 지원하는 몇 가지 기술은 다음과 같습니다.

  • Apache Kafka
  • Apache Hive
  • Apache HBase
  • Hadoop 클라우드 시스템
  • Apache Cassandra

오늘날 고객이 보고 있는 것은 빅 데이터 제품의 성숙도 수준입니다. 고려해야 할 가장 중요한 요소 중 하나는 공급업체가 빅 데이터 프레임워크와 관련하여 허용 가능한 지원 전략을 보유하고 있는지 여부입니다. 벤더는 오픈 소스 기술에 대한 헌신에 무심코 접근하지 않는 것이 중요합니다.

제품 성숙도와 함께 빅 데이터 비즈니스 솔루션은 일반적으로 오픈 소스와 비오픈 소스를 혼합하여 사용할 수 있습니다. 기업은 오픈 소스 솔루션으로 빅 데이터 문제를 해결해 왔지만 많은 노력, 헌신 및 전문 지식이 필요합니다.

오픈 소스 기술을 활용할 수도 있고 활용해야 합니다. 그러나 대부분의 경우 다양한 공급업체 기술과 파트너 관계를 맺어야 합니다.

예를 들어, 데이터 레이크를 설정하는 초기 시대에는 많은 입력을 받고 많은 출력에 배포할 수 있는 Kafka와 같은 제품을 활용하고자 했습니다. 그러나 Kafka의 안정성과 견고성을 높이려면 Oracle GoldenGate와 같은 기술이 필요했습니다. GoldenGate는 오픈 소스가 아니지만 GoldenGate와 Kafka는 Kafka와 Sqoop 같은 제품을 사용하는 것보다 데이터 레이크에 대한 인제스트 옵션을 개선합니다. GoldenGate는 Sqoop보다 훨씬 강력하고 성숙한 제품입니다.

빅데이터 관리

데이터 관리 관점에서 Oracle의 빅 데이터 제품 스택은 오픈 소스를 기반으로 합니다.

Oracle은 오픈 소스 혁신을 활용하고 고객에게 제공되는 기능을 보다 효과적으로 제어할 수 있도록 이 접근 방식을 선택했습니다. 빅 데이터를 사용하면 스택 내에 지속적으로 발전하는 여러 구성요소가 있습니다. 그래서 자체 오픈 소스 Hadoop 배포를 결정했습니다.

또한 오픈 소스 소프트웨어를 사용하면 Oracle이 고객에게 더 나은 지원을 제공할 수 있다고 믿습니다. 동시에 다른 소프트웨어 생태계는 진화하고 있는 흥미로운 오픈 소스 프로젝트를 개발하고 있습니다. 그렇기 때문에 Oracle은 다양한 개발 커뮤니티에 계속해서 기여하고 있습니다. 예를 들어, Oracle의 개발 노력은 객체 저장소를 데이터 레이크로 사용하기 위해 진화하고 있습니다.

Oracle은 오픈 소스 커뮤니티에 적극적으로 기여하고 고객에게 더 나은 성능과 기능을 위한 자체 IP를 제공합니다.

R 프로그래밍 언어

Oracle은 단순히 R을 채택한 것이 아니라 실제로 개선했습니다. Oracle의 지원되는 오픈 소스 R 재분배(무료 다운로드)는 데이터베이스 및 Hadoop에서 실행 중인 것과 호환되며 병렬화되었기 때문에 더 빠릅니다.

R은 단일 시스템 대신 여러 노드와 클러스터에서 실행될 수 있으므로 고객은 샘플링에 의존하지 않고 더 많은 데이터 세트에서 더 크고 복잡한 알고리즘을 실행할 수 있습니다. R에 대한 Oracle의 개선 사항을 통해 사용자는 R 구문을 사용하고 그 아래에 다양한 구현을 제공하여 확장성과 성능을 높일 수 있습니다.

또한 Oracle은 R을 다음과 같이 개선했습니다.

  • 데이터베이스 및 R 구문에서 작동할 알고리즘을 생성했습니다.
  • Took R 스크립트 및 실행 가능으로 설정
  • 사용자가 R 스크립트를 실행하고 SQL을 활용하는 작업이 간소화됨

Oracle은 Hadoop 공간도 확장하여 Hive용 R 인터페이스를 도입했습니다.

R, Hadoop 및 오픈 소스에 대한 Oracle의 노력은 단순히 기술에 대한 것이 아닙니다. R 커뮤니티가 2015년에 R 컨소시엄을 만들었을 때 Oracle은 창립 멤버였습니다. R 컨소시엄은 R 오픈 소스 커뮤니티에 혜택과 지원을 제공하기 위해 설립되었습니다. Oracle은 R의 성장과 개발을 계속 지원하고 R 패키지 품질에 대한 채택 모범 사례를 장려했습니다.

빅 데이터를 위한 공간 및 그래프 데이터베이스

Oracle Spatial 및 Oracle 그래프 분석 서비스 및 데이터 모델은 Apache Hadoop 및 NoSQL 데이터베이스 기술에서 빅 데이터 워크로드를 지원합니다. 둘 다 오픈 소스 라이브러리와 구성 요소를 통합하여 오퍼링을 마무리합니다. Oracle은 대부분 Apache 기반 프로젝트에서 이러한 구성요소 중 일부를 인프라용으로 사용했습니다.

Oracle은 관계를 상호 이익으로 봅니다. 예를 들어 공간/그래프 측에 대한 오라클의 분석은 사용자 정의 방식이지만, 그래프 데이터 분석을 위한 도메인별 언어인 Green-marl이라는 오픈 소스 프로젝트를 기반으로 하여 고객 분석을 위한 질문을 보다 신속하게 처리할 수 있도록 하기 때문에 이 프로세스를 가속화했습니다.

Oracle이 오픈 소스에 기여할 때 일반적으로 오픈 소스를 활용하고 사용자 지정하며 개선합니다. 오픈 소스에 대한 Oracle의 기여 예는 다음과 같습니다.

  • Cytoscape: Oracle은 다른 사람이 데이터를 공간 데이터베이스에 로드할 수 있도록 GDAL 확장과 같은 배송 구성 요소를 개발합니다.
  • 속성 그래프 쪽: Oracle은 우리가 작업하는 제품 또는 프로젝트를 확장하고 버그 및 보안 문제를 파악하며 적절한 개발자에게 피드백을 제공할 기회를 찾습니다. 가장 크게 기여한 기능은 RDF W3C입니다.
  • Oracle은 공간 데이터의 임포트, 익스포트 및 형식 변환을 위해 이를 통합했습니다. Oracle은 Oracle Spatial 및 Oracle Graph 드라이버를 제공합니다.