Govind Gopinathan Nair, 금융 범죄 및 규정 준수 기술 제품 관리자 | 2022년 1월 24일
디지털 결제의 급속한 도입과 금융 기술 서비스의 확산으로 인해 전 세계적으로 금융 서비스에 대한 접근성이 확대되었고, 전 세계로 자금을 이동시키는 것이 더 쉽고 빨라졌습니다. 이로 인해 재무 활동의 수와 여기에 수반되는 데이터의 양이 폭발적으로 증가했습니다. 이러한 대규모 데이터에는 금융 범죄를 탐지하고 예방할 수 있는 신호가 담겨 있습니다.
오늘날 사용되는 대부분의 자금 세탁 방지(AML) 솔루션은 거래 활동의 복잡하고 의심스러운 패턴을 식별하도록 설계되지는 않은, 규칙 기반의 동작 탐지 시스템입니다. 게다가 기존의 AML 시스템은 관계형 데이터베이스를 사용하는 경우가 많으며, 이러한 관계형 데이터베이스에서 엔터티 간의 관계와 연결성을 파악하는 것은 어려울 수 있습니다. 이는 잠재적인 자금 세탁 사례를 탐지하고 조사하는 데 방해가 될 수 있는 중요한 한계입니다.
금융 기관들에게 금융 범죄와 싸울 수 있는 진화하는 기술은 그래프와 그래프 분석의 조합입니다. 그래프와 그래프 머신 러닝은 이미 일부 대형 기술 회사에서 추천과 검색을 지원하는 지식 그래프를 구축하고, 단백질 접힘 문제를 해결하고 신약을 발견하기 위한 최첨단 연구를 지원하는 데 사용되고 있습니다. 마찬가지로 그래프와 그래프 분석은 금융 산업의 금융 범죄를 퇴치하는 데 강력한 도구가 될 수 있습니다.
가장 단순한 형태의 그래프는 엔터티를 나타내는 노드 또는 정점으로 구성되며, 이 노드 또는 정점은 엔터티 간의 관계를 나타내는 에지로 연결됩니다. 이러한 그래프는 관계의 특성에 따라 방향성이 있거나 없을 수도 있습니다. 그래프는 관계를 포착하는 가장 자연스러운 방법입니다. 더욱이 속성 그래프를 사용하면 노드와 에지에 대한 추가 데이터를 노드 및 에지 속성으로 포착할 수 있습니다.
최신 그래프 분석 도구는 엔터티 간의 관계, 노드와 에지 속성에 의해 포착된 엔터티의 속성, 그리고 이러한 속성이 시간에 따라 어떻게 변화하는지 분석할 수 있습니다. PGQL과 같은 그래프 쿼리 언어를 사용하면 사용자가 복잡한 패턴을 정확하게 쿼리할 수 있습니다. 또한 최신 그래프 신경망은 그래프의 토폴로지 및 관계를 노드 및 에지 속성과 결합하는 이러한 그래프의 표현을 학습할 수 있습니다. 따라서 그래프 분석은 관계, 복잡한 종속성, 숨겨진 연결고리, 네트워크, 클러스터를 분석하는 데 사용되는 도구로 새롭게 떠오르고 있습니다.
그래프를 사용하여 재무 엔터티, 거래 및 관계를 자연스럽게 나타낼 수 있습니다. 그래프 분석을 통해 AML 애플리케이션은 고객, 계좌, 가구 등의 개체 간 거래, 공유 주소, 전화번호 또는 이메일을 기반으로 관계를 식별, 쿼리, 분석 및 시각화할 수 있습니다. 따라서 분석가와 AML 실무자가 금융 거래 데이터를 마이닝하여 통찰력을 얻고 복잡하고 명확하지 않은 관계를 이해하는 데 필요한 도구로 빠르게 각광받고 있습니다.
그래프 분석은 엔터티 간의 연결성 및 관계를 분석하는 기능을 통해 AML에 이상적인 도구입니다. 그래프 분석은 자금 세탁에 혁신적으로 대처할 수 있는 여러 기회를 제공합니다. 이를 통해 기존 AML 프로그램의 효능과 효과성이 몇 배나 향상될 수 있습니다. 방법을 살펴보겠습니다.
근접 중심성, 차수 중심성, 고유 벡터 중심성 등과 같은 순위 알고리즘을 사용하여 그래프의 노드 순위를 매길 수 있습니다. 이러한 측정 단위는 서로 다른 차원을 따라 그래프에 대한 노드의 중요성을 캡처합니다.
예를 들어, 차수 중심성은 그래프에서 각 노드가 얼마나 연결되어 있는지를 파악하는 반면, 고유 벡터 중심성은 그래프에서 노드가 다른 연결성이 높은 노드와 얼마나 연결되어 있는지를 측정합니다. 이러한 중심성 측정은 재무 그래프에서 가장 중요한 노드를 결정할 수 있습니다.
차수 분포 알고리즘은 그래프의 구조를 분석하는 쉬운 방법입니다. 예를 들어, 일반적인 거래 그래프에서 가장 높은 정점 차수(이웃의 수)를 가진 엔터티는 일반적으로 비즈니스 엔터티입니다. 기관에서는 고객의 차수 분포를 분석하고, 고객 프로필을 감안하여 비정상적으로 높은 차수를 가진 이상치를 파악할 수 있습니다. 이러한 법인은 지속적인 고객 파악(KYC) 프로세스의 일환으로 실사을 강화하거나, 지속적인 실사의 후보가 될 수 있습니다.
PGQL과 같은 그래프 쿼리 언어를 사용하면 복잡한 자금 이동 패턴을 포착하는 쿼리 또는 시나리오를 작성할 수 있습니다. 이러한 도구를 사용하면 특정 고위험 패턴에 대해 보다 맞춤화된 모니터링을 수행할 수 있습니다. 이는 특히 이러한 최종 수익적 수혜자(UBO)가 복잡한 소유권 및 거래 체인에 포함되는 UBO를 식별하는 데 유용합니다.
그래프 알고리즘은 거래가 아닌, 그래프에서 노드 사이의 가장 짧은 경로를 찾는 데 사용할 수 있습니다(거래가 아닌 관계만 고려하는 그래프). 동일한 노드 간의 거래 그래프에서 가장 짧은 경로(거래 데이터만 고려)가 훨씬 더 긴 경우 자금 계층화 시도를 나타낼 수 있습니다.
또한 최신 그래프 신경망을 사용하면 그래프의 노드에 대한 임베딩이나 표현을 학습할 수도 있습니다. 임베딩은 노드의 토폴로지, 관계 및 속성을 포착합니다. 이러한 임베딩은 고객 위험 점수 부여 또는 이벤트 점수 부여와 같은 다운스트림 모델에서도 사용할 수 있어 모델의 성능을 크게 향상시켜 오탐과 누락 비율을 모두 줄일 수 있습니다. 이러한 임베딩의 설명 가능성에 대한 우려를 해결할 수 있는 그래프 신경망 설명 도구도 제공됩니다.
경보에 위험 신호가 들어올 때마다, AML 분석가는 해당 경보가 격리된 인시던트인지 상호 연결된 인시던트인지 확인하는 것이 중요합니다. 기존 AML 조사에서는 분산된 데이터 세트(고객, 계정, 거래등)에서 연결성을 식별하기가 어려울 수 있습니다. 그러나 사례를 나타내는 그래프를 구성하면 그래프 시각화 및 분석을 수행할 수 있으므로 조사자가 조사 대상 기업에 대해 상황에 맞는 정보를 얻을 수 있습니다.
최신 그래프 딥 러닝 기술을 사용하면 사건에 대한 임베딩을 학습한 다음 조사관에게 유용한 지침을 제공할 수 있는 유사한 의심스러운 활동 보고서(SAR)를 표면화할 수도 있습니다.
금융 기관의 장기적인 목표는 금융 범죄 지식 그래프를 작성하는 것입니다. 기관에서는 모던 자연어 처리(NLP) 및 그래프 데이터베이스를 결합하여 고객에 대한 모든 정형 및 비구조적, 내부 및 외부 데이터를 포착하는 단일 금융 범죄 그래프를 생성할 수 있습니다. 이를 통해 고객에 대한 보다 심층적인 이해가 가능해져 KYC, 조사, 마케팅 등 다양한 기능에서 유용하게 활용될 수 있습니다.
이는 그래프 분석을 가능하게 하는 잠재적인 사용 사례의 샘플링에 불과합니다. 기관은 대규모 도입을 시작하기 전에 더 간단한 사용 사례를 실험할 수 있습니다.
그래프 분석을 통해 데이터 과학자는 이상 징후와 패턴을 식별하여 탐지 기능을 개선하고, 비용을 절감하고, AML 규정 준수에 걸리는 시간을 단축할 수 있습니다. 또한 조사자의 생산성을 크게 향상시키고 복잡한 활동 패턴을 이해하는 데 도움이 되는 강력한 시각화 기능도 제공합니다.
AML 도구 키트의 일부로 그래프 분석을 구현하려면 숙련된 리소스, 투자 및 노력이 필요합니다. 그러나 그래프 분석 기능을 도입하면 은행과 금융 기관의 AML 규정 준수 프로그램을 상당한 수준으로 강화할 수 있으므로 들어가는 비용보다 이점이 더 큽니다.