검색 결과가 없습니다

검색어와 일치하는 결과가 없습니다.

원하시는 정보를 찾는 데 도움이 되도록 다음을 시도해 보십시오.

  • 검색에 사용하신 키워드의 철자가 올바른지 확인하십시오.
  • 입력한 키워드에 동의어를 사용하십시오. 예를 들어 “소프트웨어” 대신 “애플리케이션”을 사용해 보십시오.
  • 아래에 표시된 인기 검색어 중 하나를 사용해 보십시오.
  • 새로운 검색을 시작하십시오.
인기 질문

그래프 데이터베이스 정의

그래프 데이터베이스란 그래프를 만들고 조작하기 위한 특수한 단일 목적 플랫폼으로 정의됩니다. 그래프에는 노드, 에지 및 속성이 포함되며, 모두 관계형 데이터베이스가 할 수 없는 방식으로 데이터를 표현하고 저장하는 데 사용됩니다.

그래프 분석은 일반적으로 사용되는 또 다른 용어로, 특히 데이터 포인트를 노드로 사용하고 관계를 에지로 사용하여 그래프 형식의 데이터를 분석하는 프로세스를 말합니다. 그래프 분석에는 그래프 형식을 지원할 수 있는 데이터베이스가 필요합니다. 이는 전용 그래프 데이터베이스 또는 그래프를 포함한 여러 데이터 모델을 지원하는 컨버지드 데이터베이스가 해당될 수 있습니다.

그래프 데이터베이스 유형

그래프 데이터베이스 중 인기 있는 유형으로 속성 그래프와 RDF 그래프, 두 가지를 꼽을 수 있습니다. 속성 그래프는 분석 및 쿼리에, RDF 그래프는 데이터 통합에 중점을 둡니다. 두 가지 유형 모두 포인트(꼭짓점)와 해당 포인트 사이의 라인(에지)의 모음으로 구성됩니다. 그러나 차이점도 있습니다.

속성 그래프

속성 그래프는 데이터 간의 관계를 모델링하는 데 사용되며 이러한 관계를 기반으로 쿼리 및 데이터 분석 작업을 지원합니다. 속성 그래프에는 주제에 대한 자세한 정보 등을 포함하는 꼭짓점과 이 꼭짓점 간의 관계를 나타내는 에지가 있습니다. 꼭짓점과 에지는 속성(properties)이라고 하는 요소(attributes)를 가질 수 있으며, 이를 사용하여 연결될 수 있습니다.

이 예에서는 동료 및 이들의 관계 집합이 속성 그래프로 표시됩니다.

그래프 데이터베이스

다방면으로 유용한 특성 덕분에 속성 그래프는 금융, 제조, 공공 안전, 소매 분야를 포함한 다양한 산업 및 부문에서 광범위하게 사용됩니다.

RDF 그래프

RDF(Resource Description Framework) 그래프는 명령문을 나타내도록 설계된 W3C(Worldwide Web Consortium)의 표준을 따르며, 복잡한 메타 데이터 및 마스터 데이터를 표현하는 데 가장 적합합니다. RDF 그래프는 연결된 데이터, 데이터 통합 및 지식 그래프에 자주 사용됩니다. 도메인 내에서 복잡한 개념을 나타낼 수 있을 뿐 아니라 데이터와 관련하여 풍부한 의미 체계 및 추론도 제공할 수 있습니다.

RDF 모델에서 문장은 세 가지 요소로 표현됩니다. 꼭짓점 2개와 이 두 점을 연결하는 에지 1개로 구성된 RDF 트리플은 문장의 주어, 술어, 목적어를 반영합니다. 모든 꼭짓점과 에지는 URI 또는 고유한 리소스 식별자로 식별됩니다. RDF 모델은 잘 정의된 의미 체계를 갖춘 표준 형식으로 데이터를 표현하기 때문에 정보 교환이 수월해집니다. 정부 통계 기관, 제약 회사 및 헬스케어 기관에서 RDF 그래프를 널리 사용하고 있습니다.

그래프와 그래프 데이터베이스의 원리

그래프와 그래프 데이터베이스로 생성한 그래프 모델로 데이터 내 관계를 표현할 수 있습니다. 사용자는 연결을 기반으로 “트래버설 쿼리”를 수행하고 그래프 알고리즘을 적용하여 패턴, 경로, 커뮤니티, 인플루언서, 단일 장애 지점 및 기타 관계를 파악할 수 있으므로 대규모 데이터를 보다 효율적으로 분석할 수 있게 됩니다. 그래프는 분석, 통찰력 도출, 그리고 서로 다른 데이터 소스를 연결할 때에 그 힘을 발휘합니다.

그래프를 분석할 때 알고리즘은 꼭짓점 사이의 경로와 거리, 꼭짓점의 중요성, 꼭짓점의 클러스터링 등을 살펴 봅니다. 예를 들어 중요도를 판단하기 위한 알고리즘은 들어오는 에지, 인접한 꼭짓점의 중요도와 기타 지표를 살펴 봅니다.

그래프 알고리즘(그래프에 있는 데이터 간의 관계 및 동작을 분석하도록 특별히 설계된 작업)을 사용하면 다른 방법으로는 알기 어려운 것을 이해할 수 있습니다. 그래프를 분석할 때 알고리즘은 꼭짓점 사이의 경로와 거리, 꼭짓점의 중요성, 꼭짓점의 클러스터링 등을 살펴 봅니다. 알고리즘은 들어오는 에지, 인접한 꼭짓점의 중요도와 기타 지표를 종종 활용하여 중요도를 판단합니다. 예를 들어, 그래프 알고리즘은 소셜 네트워크 또는 비즈니스 프로세스에서 다른 사람과 가장 많이 접속한 개인 또는 항목을 식별할 수 있습니다. 알고리즘은 개인 또는 관련 트랜잭션을 접속하는 커뮤니티, 이상 징후, 공통 패턴 및 경로를 식별할 수 있습니다.

그래프 데이터베이스는 명시적으로 관계를 저장하기 때문에 꼭짓점 간 연결을 활용하는 쿼리 및 알고리즘을 실행하는 시간을 몇 시간이나 며칠에서 1초 이내로 단축할 수 있습니다. 조인을 계속해서 실행할 필요가 없어지며, 분석 및 머신 러닝에 데이터를 더 쉽게 적용할 수 있어 우리가 사는 세상에 대해 더 많은 것을 알 수 있게 됩니다.

그래프 데이터베이스의 장점

그래프 형식은 멀리 떨어진 접속을 찾거나 관계의 강도 또는 품질과 같은 항목을 기반으로 데이터를 분석할 수 있는 더 유연한 플랫폼을 제공합니다. 그래프를 사용하면 소셜 네트워크, IoT, 빅 데이터, 데이터웨어 하우스에서 연결 및 패턴을 탐색하고 발견할 수 있으며 뱅킹에서의 사기 감지, 소셜 네트워크에서 접속 발견 및 고객 360을 포함한 여러 비즈니스 사용 사례에 대한 복잡한 트랜잭션 데이터도 탐색할 수 있습니다. 오늘날 그래프 데이터베이스는 관계를 더 명확하게 연결하는 방법으로서 데이터 과학의 일부로 점점 더 많이 사용되고 있습니다.

그래프 데이터베이스는 명시적으로 관계를 저장하기 때문에 꼭짓점 간 연결을 활용하는 쿼리 및 알고리즘을 실행하는 시간을 몇 시간이나 며칠에서 1초 이내로 단축할 수 있습니다. 조인을 계속해서 실행할 필요가 없어지며, 분석 및 머신 러닝에 데이터를 더 쉽게 적용할 수 있어 우리가 사는 세상에 대해 더 많은 것을 알 수 있게 됩니다.

그래프 데이터베이스는 매우 유연하고 강력한 도구입니다. 그래프 형식 덕분에 훨씬 적은 노력으로도 더 깊은 통찰력을 얻기 위해 복잡한 관계를 결정할 수 있습니다. 그래프 데이터베이스는 일반적으로 PGQL(Property Graph Query Language)과 같은 언어로 쿼리를 실행합니다. 아래 예시는 PGQL 및 SQL에서 동일한 쿼리를 보여줍니다.

그래프 분석 사용

위의 예시에서 볼 수 있듯이 PGQL 코드는 더 간단하고 훨씬 더 효율적입니다. 그래프는 데이터 간의 관계를 강조하기 때문에 여러 다양한 유형의 분석에 이상적입니다. 특히 그래프 데이터베이스는 다음과 같은 점에서 탁월합니다.

  • 두 개의 노드 간 최단 경로 찾기
  • 가장 많은 작업 및 가장 큰 영향을 생성하는 노드 결정
  • 네트워크의 최대 취약점을 식별하기 위해 연결 분석
  • 그룹 내 접속 거리/밀도를 기반으로 네트워크 또는 커뮤니티 상태 분석

그래프 데이터베이스와 그래프 분석의 원리

그래프 데이터베이스의 간단한 실례로는 대중적인 파티 게임인 “케빈 베이컨의 여섯 단계(Six Degrees of Kevin Bacon)”를 시각적으로 표현한 아래 이미지가 있습니다. 처음 접하는 사람들을 위해 설명하자면, 이 게임에선 Kevin Bacon과 같은 영화에 출연한 배우들의 연결 고리를 만들어야 합니다. 관계에 대한 이러한 강조는 그래프 분석을 입증하기 위한 이상적인 방법입니다.

두 가지 범주의 노드가 있는 데이터 세트를 상상해 보십시오. 지금까지 만든 모든 영화와 그 영화에 등장한 모든 배우를 떠올립니다. 그런 다음 그래프를 사용하여 Kevin Bacon을 Muppet 아이콘인 Miss Piggy에 접속하라는 쿼리를 실행합니다. 결과는 다음과 같습니다.

그래프를 사용하는 데이터 세트

이 예시에서 사용 가능한 노드(꼭짓점)는 배우와 영화 모두이고, 관계(에지)는 “연기를 했다”는 상태입니다. 여기에서 쿼리는 다음 결과를 반환합니다.

  • Kevin Bacon은 The River Wild에서 Meryl Streep과 함께 연기했습니다.
  • Meryl Streep은 Lemony Snicket’s A Series of Unfortunate Events에서 Billy Connolly와 함께 연기했습니다.
  • Billy Connolly는 Muppet Treasure Island에서 Miss Piggy와 함께 연기했습니다.

그래프 데이터베이스는 이 Kevin Bacon 예시에 대해 다음과 같은 다양한 관계를 쿼리할 수 있습니다.

  • “Kevin Bacon과 Miss Piggy를 연결하는 체인 중 가장 짧은 것은 무엇입니까?” (위의 Six Degrees 게임에서 사용된 최단 경로 분석)
  • “가장 많은 배우와 작업한 배우는 누구입니까?” (연결 중심성)
  • “Kevin Bacon과 다른 모든 배우 사이의 평균 거리는 얼마입니까?” (근접 중심성)

물론 이것은 대부분의 그래프 분석 사용에 비해 훨씬 재미있는 예시입니다. 그러나 이 접근 방식은 거의 모든 빅 데이터, 즉 많은 수의 레코드가 서로 자연스럽게 연결되어 있는 모든 상황에 적용됩니다. 그래프 분석을 사용하는 가장 일반적인 방법 중 일부는 바로 소셜 네트워크, 커뮤니케이션 네트워크, 웹 사이트 트래픽 및 사용량, 실제 도로 데이터, 금융 거래 및 계정을 분석하는 것입니다.

그래프 데이터베이스 사용 사례: 돈세탁

그래프 데이터베이스 사용 사례

돈세탁의 원리는 간단합니다. 더러운 재산을 이리저리 옮겨 합법적인 자금과 섞은 후 실물 자산으로 둔갑시킵니다. 파나마 페이퍼스 분석에 사용된 프로세스와 동일합니다.

더 구체적으로 말하면, 순환 송금은 범죄자가 사기로 얻은 대량의 자금을 자기 자신에게 보내는 것인데, 이때 돈을 "정상적인" 계정들로 옮기며 유효한 이체처럼 보이도록 함으로써 돈의 출처를 숨깁니다. 여기서 “정상적인” 계정이란 사실 위조한 ID를 사용해 생성한 계정을 말합니다. 이러한 계정은 일반적으로 도난당한 신원(이메일 주소, 주소 등)을 사용하여 생성되기 때문에 특정 정보가 유사하다는 특징이 있으며, 이 정보는 그래프 분석을 통해 사기의 출처를 밝힐 수 있습니다.

이메일 주소, 비밀번호, 주소 등을 포함한 정보를 공유하는 엔티티뿐만 아니라 엔티티 간의 거래로 그래프를 만들면 부정행위 탐지 작업을 더욱 간단하게 할 수 있습니다. 그래프가 생성되면 간단한 쿼리를 실행하여 유사한 정보를 가진 계정을 가진 고객을 모두 찾아 어떤 계정이 서로 돈을 보내고 있는지 알 수 있습니다.

그래프 데이터베이스 사용 사례: 소셜 미디어 분석

그래프 데이터베이스는 다양한 시나리오에서 사용할 수 있지만 일반적으로 소셜 네트워크를 분석하는 데 사용됩니다. 실제로 소셜 네트워크는 많은 양의 노드(사용자 계정)와 다차원적 접속(다양한 방향으로의 참여)을 포함하고 있기 때문에 이상적인 사용 사례를 만들어 냅니다. 소셜 네트워크에 대한 그래프 분석은 다음 사항을 결정할 수 있습니다.

  • 사용자는 어떻게 활성화됩니까? (노드 수)
  • 어떤 사용자가 가장 많은 영향력을 가집니까? (접속 밀도)
  • 양방향 참여가 가장 많은 사용자는 누구입니까? (접속 방향 및 접속 밀도)

그러나 봇에 의해 부자연스럽게 왜곡된 정보의 경우 쓸모가 없습니다. 다행히도 그래프 분석은 봇을 식별하고 필터링하는 훌륭한 수단을 제공할 수 있습니다.

실제 사용 사례에서 Oracle 팀은 특히 데이터를 왜곡한 가짜 봇 계정을 식별하기 위해 Oracle Marketing Cloud를 사용하여 소셜 미디어 광고 및 트랙션을 평가했습니다. 이러한 봇의 가장 일반적인 동작은 리트윗 대상 계정을 포함하여 인위적으로 인기를 높이는 것입니다. 간단한 패턴 분석을 통해 리트윗 수와 이웃에 대한 접속 밀도를 사용하여 살펴볼 수 있습니다. 본래 인기 있는 계정은 봇 기반 계정에 비해 이웃과 다른 관계를 보였습니다.

이 이미지는 본래 인기 있는 계정을 보여줍니다.

그래프 데이터베이스 사용 사례: 소셜 미디어 분석

또한 이 이미지는 봇 기반 계정의 동작을 보여줍니다.

그래프 데이터베이스 사용 사례: 소셜 미디어 분석

여기서 핵심은 그래프 분석의 힘을 사용하여 자연스러운 패턴과 봇 패턴을 식별하는 것입니다. 여기에서 해당 계정을 필터링하는 것만큼이나 간단하지만 그래도 봇과 리트윗 계정 간의 관계를 자세히 조사하는 것도 가능합니다.

소셜 미디어 네트워크는 전체 사용자 기반 경험에 영향을 주는 봇 계정을 제거하기 위해 최선을 다합니다. 이러한 봇 탐지 프로세스가 정확한지 확인하기 위해 한 달 후에 플래그가 지정된 계정을 확인했습니다. 결과는 다음과 같습니다.

  • 일시 중단됨: 89%
  • 삭제됨: 2.2%
  • 여전히 활성 상태임: 8.8%

처리된 계정의 매우 높은 비율(91.2 %)은 패턴 식별 및 정제 프로세스 모두 정확성을 보여주었습니다. 표로 정리한 표준 데이터베이스에서는 훨씬 더 오래 걸렸지만 그래프 분석을 사용하면 복잡한 패턴을 빠르게 식별할 수 있습니다.

그래프 데이터베이스 사용 사례: 신용 카드 사기

그래프 데이터베이스는 사기를 감지하는 수단으로 금융 업계의 강력한 도구가 되었습니다. 카드에 내장된 칩을 사용하는 것과 같은 사기 방지 기술의 발전에도 불구하고 사기는 여전히 여러 가지 방식으로 발생할 수 있습니다. 마그네틱 스트립에서 세부 정보를 훔칠 수 있는 스키밍 장치는 아직 칩 리더를 설치하지 않은 곳에서 일반적으로 사용되는 기술입니다. 이러한 세부 정보가 일단 저장되면 위조 카드에 로딩되어 구매하거나 돈을 인출할 수 있습니다.

사기 탐지 수단으로서 패턴 식별은 보통 첫 번째 방어선입니다. 예상 구매 패턴은 위치, 빈도, 상점 유형 및 사용자 프로필에 맞는 기타 항목을 기반으로 합니다. 예를 들어 샌프란시스코 베이 지역에 머무르는 사람이 심야 시간에 플로리다에서 갑자기 구매를 하는 등 무언가 완전히 비정상적으로 보이는 경우, 잠재적인 사기로 플래그를 지정합니다.

이를 위해 필요한 컴퓨팅 성능은 그래프 분석을 통해 상당히 단순화됩니다. 그래프 분석은 노드 간에 패턴을 설정하는데 탁월합니다. 이 경우 노드 범주는 계정(카드 소지자), 구매 위치, 구매 범주, 거래 및 터미널로 정의됩니다. 자연스러운 행동 패턴을 쉽게 식별할 수 있습니다. 예를 들어, 지정된 달에 사람은 다음을 수행할 수 있습니다.

  • 각기 다른 애완동물 상점(터미널)에서 애완동물 사료(구매 카테고리) 구매
  • 특정 지역(구매 위치)에서 주말마다 레스토랑 음식값 지불(거래 메타데이터)
  • 지역 철물점(계정 위치, 구매 위치)에서 보수용 하드웨어(구매 카테고리) 구입

사기 감지는 일반적으로 머신 러닝으로 처리되지만 그래프 분석은 이러한 노력에 더하여 보다 정확하고 훨씬 효율적인 프로세스를 만들 수 있습니다. 관계에 초점을 맞춘 덕분에, 분석 결과는 데이터를 실제로 사용하기 전에 큐레이션하고 준비하여 사기 레코드를 결정하고 플래그를 지정하는 데 효과적인 예측 인자가 되었습니다.

그래프 데이터베이스의 미래

그래프 데이터베이스 및 그래프 기술은 지난 10년 동안 컴퓨팅 성능과 빅 데이터가 증가함에 따라 진화했습니다. 실제로 이들이 복잡한 데이터 관계로 이루어진 멋진 신세계를 분석하기 위한 표준 도구가 될 것임이 점점 더 분명해졌습니다. 기업과 조직이 빅 데이터 및 분석 기능을 지속적으로 추진하고 있는 가운데, 점점 더 복잡한 방식으로 통찰력을 이끌어낼 수 있는 능력은 그래프 데이터베이스를 현재의 요구와 미래의 성공을 위해 반드시 필요한 것으로 만듭니다.

Oracle을 통해 그래프 기술을 더욱 쉽게 도입할 수 있습니다. 오라클 데이터베이스와 Oracle Autonomous Database에는 그래프 데이터베이스와 그래프 분석 엔진이 포함되어 있으므로 사용자는 그래프 알고리즘, 패턴 일치 쿼리 및 시각화 기능을 사용하여 데이터에서 더 많은 통찰력을 얻을 수 있습니다. 그래프는 단일 데이터베이스 엔진에서 다중 모델, 다중 워크로드 및 다중 테넌트 요구사항을 모두 지원하는 Oracle의 컨버지드 데이터베이스에 포함됩니다.

모든 그래프 데이터베이스가 고성능이라고 주장하지만, Oracle이 제공하는 그래프 제품은 쿼리 성능 및 알고리즘 측면에서 우수할 뿐 아니라 오라클 데이터베이스와 긴밀하게 통합됩니다. 따라서 개발자는 기존 애플리케이션에 그래프 분석 기능을 쉽게 추가하여 데이터베이스가 기본적으로 제공하는 확장성, 일관성, 복구, 액세스 제어 및 보안을 활용할 수 있습니다.