|
Feature
Linux 클러스터
저자 David Baum
고성능, 저비용 데이터 웨어하우징 솔루션을 위한 대안으로 Linux 클러스터가 각광받고 있습니다.
점점 더 많은 기업이 운영 환경에 비즈니스 인텔리전스(BI) 기능을 통합하면서, 지속적으로 증가하는 데이터 웨어하우스 환경을 위한 비용 절감 방안을 고려하고 있습니다. 과거의 대규모 데이터 웨어하우스 환경은 하이-엔드 SMP(symmetric multiprocessing) 컴퓨터 환경에서 구현되었으며 OLTP 시스템보다 낮은 수준의 가용성만으로도 충분했습니다. 하지만 데이터 웨어하우스 환경의 사용자 기반이 내부/외부적으로 점차 확장되면서 IT 비용을 통제하는 한편으로 서비스 레벨을 개선하려는 노력이 시작되고 있습니다. 많은 기업들이 저가형 Linux 기반 서버 클러스터에 데이터 웨어하우스를 구축하기로 결정하고 있는 것도 바로 이러한 이유 때문입니다.
Linux 파워
과연 Linux가 하이-엔드 데이터 웨어하우스와 BI 시스템에 적합한 환경일까요? 밴더빌트 대학의 IT 전문가들은 그렇게 생각합니다. 최근까지만 해도 테네시주에 위치한 밴더빌트 대학은 지속적으로 확장하는 정보 시스템의 비용 관리 문제로 애를 먹고 있었습니다. 밴더빌트 대학의 IT 관리자들은 Linux 기반 Oracle Real Application Clusters 환경에 오라클 데이터베이스를 구축함으로써 저가형 Intel 기반 하드웨어를 활용할 수 있음을 깨달았습니다. 솔루션의 경제적 효과는 대단히 매력적이었습니다. 2-노드 RISC 기반 서버를 한 대 구축하는데 10만 달러의 비용이 드는 반면, 2-노드 Intel 기반 솔루션은 3만 달러에 불과했습니다. “테스트를 통해 UNIX에서 Linux로 전환하는 경우 비용 대비 서버 용량 및 성능을 3배 수준으로 개선하고, 추가적으로 가용성을 크게 개선할 수 있다는 결론을 얻었습니다.” 밴더빌트 대학 관리 정보 시스템 담당 부회장 팀 겟세이의 말입니다.
|
고객 프로필
Vanderbilt University
www.vanderbilt.edu
밴더빌트 대학은 테네시주 내쉬빌에 소재한 대학 기관으로 11,000명 이상의 학생을 교육하고 있습니다. 1873년 설립된 밴더빌트 대학은 10개의 학부, 공공 정책 교육원, 메디컬 센터, Freedom Forum First Amendment Center 등을 포함하고 있으며 테네시주 중부에서 가장 큰 규모의 기관이기도 합니다.
업종: 교육
직원 수: 18,551 (메디컬 센터 직원 포함)
오라클 제품 및 서비스: Oracle Application Server; Oracle Database, including Oracle Partitioning, Oracle Enterprise Manager Grid Control, Oracle Real Application Clusters
MLT Vacations
www.nwaworldvacations.com
미네소타주 미네아폴리스/세인트 폴에 소재한 MLT Vacations는 Northwest Airlines의 자화사이며 미국에서 가장 큰 여행 패키지 제공업체 중 하나입니다. 매년 1백만 명 이상의 고객들이 MLT Vacation의 두 가지 브랜드, NWA WorldVacations와 Worry-Free Vacations를 통해 여행 상품을 구입하고 있습니다.
업종: 여행
직원수: 450
오라클 제품 및 서비스: Oracle Database, Oracle Real Application Clusters |
밴더빌트 대학은 Red Hat Enterprise Linux가 설치된 16 대의 HP ProLiant DL580 서버에 Oracle Database 10g와 Oracle Real Application Clusters를 구성하고 있습니다. Oracle Real Application Clusters 환경은 클러스터에 저가형 서버를 점진적으로 추가하는 방식으로 데이터 웨어하우스의 확장성을 개선할 수 있게 합니다. 겟세이는 밴더빌트 대학이 매년 20 개의 프로세스와 수 TB 규모의 스토리지를 데이터 웨어하우스 환경에 추가할 것이라 예측합니다.
"단순히 운영체제뿐 아니라 데이터 웨어하우스 환경의 전체 컴포넌트 비용을 절감하는 것이 가능합니다.” 메사츄세츠주 케임브리지에 위치한 포레스터 리서치의 애널리스트 루 어고스타는 이렇게 말합니다. “운영체제는 전체 구성 비용의 5 퍼센트밖에 차지하지 않으며, 경우에 따라서는 1 퍼센트에 불과할 수도 있습니다. 오라클 데이터 웨어하우스 고객의 비용을 절감할 수 있게 하는 것은 Linux 자체가 아니라 오라클이 Linux 기반으로 구현한 저가형 그리드 컴퓨팅 솔루션들입니다."
Linux 클러스터의 확산
어고스타는 비용 문제를 제외하더라도, Linux와 같은 오픈 소스 운영체제의 도입에는 여러 가지 이유가 있을 수 있다고 말합니다. “그 중 하나로, IBM, HP, 오라클, Dell과 같은 대규모 벤더가 Linux를 지원하고 있다는 점을 들 수 있습니다.” 그의 말입니다. “두 번째로, 많은 사람들이 Windows보다 저렴하고 비독점적인 대안을 필요로 하고 있습니다. 마지막으로, Linux가 상용 컴포넌트를 기반으로 실행되기 때문에, 벤더의 테크놀로지 독점을 피할 수 있습니다."
오늘날 엔터프라이즈 환경에 Linux가 폭넓게 확산된 것에는 Linux에 대한 오라클의 투자가 많은 기여를 했습니다. 오라클은 Novell, Red Hat, Linux 커뮤니티와 긴밀하게 협력하면서 오라클 제품과 Linux 커널이 최적의 상태로 구성되고 하부 하드웨어에 맞게끔 튜닝되어 있음을 보장하기 위한 노력을 계속해 왔습니다. 오라클은 유연한 통합 24/7 기술 지원을 Linux 고객에게 제공합니다. 이러한 비즈니스 역학이 밴더빌트 대학이 중앙 집중적인 인프라스트럭처를 기반으로 코어 데이터베이스를 관리하고, 밴더빌트 대학과 밴더빌트 메디컬 센터의 데이터 웨어하우스 환경을 통합하기 위한 엔터프라이즈 그리드를 구축하는 촉매제가 되었습니다. 밴더빌트 대학의 Linux 기반 정보 시스템은 매우 높은 수준의 보안과 가용성을 제공하고 있습니다. 클러스터 내의 서버에 장애가 발생하는 경우, 나머지 서버들이 계속해서 서버를 제공하므로 24/7 가용성이 보장됩니다. 캘리포니아주 레드우드 시티에 소재한 IT 컨설팅 업체인 Mainstay Partners에 의하면, 밴더빌트 대학은 이러한 인프라스트럭처를 기반으로 표준화된 저가형 서버/스토리지 디바이스를 확장해 나감으로써 620만 달러의 하드웨어 구매/유지보수 비용을 절감할 수 있었습니다.
사용자 환경과의 동반 확장
이러한 비용 절감과 안정성의 개선이 매우 큰 매력 요소이긴 하지만기업들이 Linux 기반의 고성능, 고확장성 환경으로 데이터 웨어하우징 기반을 전환하는 데에는 또 다른 이유가 있습니다. 엔드 유저 리포팅 기능이 인기를 끌면서 데이터 웨어하우징의 활용 방법에도 변화가 확인되고 있습니다. 과거에는 이러한 시스템이 소규모 정보 분석가 그룹, 또는 상위 경영진이나 실무 관리자들에 의해서만 사용되었습니다. 오늘날의 BI 솔루션은 엔터프라이즈 환경의 다양한 유형의 비즈니스 정보, 그리고 파트너, 고객으로까지 확장되고 있습니다. 이처럼 운영 환경에 초점이 맞추어진 BI 시스템은 기업의 다양한 코어 정보 시스템에 영향을 미치며, 전략적/전술적인 용도로, 그리고 전문 분석가, 파워 유저뿐 아니라 기업의 일반 직원들에 의해서도 활용됩니다.
|
인텔리전스 환경을 위한 최적화
오라클은 지난 수 년 동안 데이터 웨어하우스 환경에서의 성능을 최적화하기 위한 오라클 데이터베이스의 개선 작업을 추진해 왔습니다. 이에 관련한 몇 가지 핵심 기능이 아래와 같습니다:
인텔리전트 쿼리 최적화 (Intelligent query optimization). 쿼리 최적화는 관계형 데이터베이스 환경에서 복잡한 SQL 구문의 성능을 개선해 줍니다 쿼리 옵티마이저는 각 쿼리의 실행을 위한 최선의 전략을 결정합니다. 예를 들어 특정 쿼리에 인덱스를 사용할 것인지, 또는 다수의 테이블을 조인(join)하는 과정에서 어떤 조인 테크닉을 사용할 것인지 선택합니다. 이러한 작업은 SQL 성능에 지대한 영향을 미칩니다. 쿼리 옵티마이저는 애플리케이션과 엔드 유저의 관점에서 투명하게 동작합니다.
Materialized views.Materialized View(MV)는 Oracle8i에서 처음 소개된 기능입니다. MV는 데이터베이스 내부에 물리적으로 존재하는 특수한 형태의 뷰로 이해할 수 있습니다. MV는 조인(join), 집산(aggregate) 등의 결과를 저장하고 있으며, 매우 많은 비용을 수반하는 조인, 집산 작업 결과를 미리 계산해 놓음으로써 쿼리 실행 속도를 개선합니다.
비트맵 인덱싱(Bitmapped indexing).비트맵 인덱스(bitmapped index)는 인덱스를 저장하는데 필요한 시간과 용량을 혁신적으로 절감해 줍니다. 오라클이 특허를 보유한 비트맵 인덱스는 데이터 웨어하우스 환경에서 특히 자주 사용되고 있습니다 다른 데이터베이스들이 ‘다이내믹’ 비트맵 인덱스만을 제공하는데 반해, 오라클은 ‘리얼(real)’ 비트맵 인덱스를 제공합니다. 리얼 비트맵 인덱스는 인덱스에 대한 압축된 비트맵 표현을 데이터베이스에 저장하는 인덱스 구조인 반면, 다이내믹 비트맵 인덱스는 쿼리 프로세싱 과정에서 B-트리 인덱스 구조를 비트맵 구조로 변환합니다. 리얼 비트맵 인덱스는 정규 B-트리 인덱스에 비해 훨씬 큰 공간 절감 효과를 제공합니다. 또 공간 절감 효과를 통해 디스크 I/O를 최소화할 수 있으므로 성능 개선 또한 가능합니다.
데이터 파티셔닝. 파티셔닝은 복잡한 쿼리의 성능을 개선하고 대규모 데이터의 관리를 개선하는데 있어 중요한 기능입니다. 오라클 파티셔닝 기능은 다양한 종류의 range, hash, list 파티셔닝 메커니즘을 제공합니다. 예를 들어, ‘range partitioning’은 데이터의 롤링 윈도우(rolling window)가 적용되는 환경에서 매우 유용하게 활용됩니다. 데이터의 영역 별로 'range partitioning’을 적용함으로써 데이터 웨어하우스의 로드/드롭 사이클을 크게 개선하고, 효율성과 관리성을 극대화할 수 있습니다.
|
“사용자들은 점점 더 독립적인 경향을 띠고 있습니다.” 미국 최대 여행 패키지 제공업체 중 하나인 MLT Vacations의 애플리케이션 그룹 매니저 론 레인스마는 이렇게 말합니다. “사용자들은 데이터를 분석해서 자신만을 위한 해답을 얻기를 기대합니다. 이러한 요구에 대응하는 것은 쉽지 않은 일입니다. 고객들은 점점 더 복잡한 질문을 제기합니다. 우리는 새로운 리포트 요청과 데이터 규모가 매년 10 퍼센트씩 증가하고 있음을 확인하고 있습니다."
Oracle Real Application Clusters는 MLT Vacations와 같은 기업이 변화하는 비즈니스 요구를 지원하고 고가용성 및 비즈니스 연속성을 보장하기 위한 정보 시스템의 확장을 가능하게 합니다. MLT Vacations의 시스템 서비스 관리자 크리스 코로나에 의하면, 이러한 클러스터 환경은 장애 서버를 자동을 복구함으로써 예기치 않은 서비스 중단에 유연하게 대처하고 다른 서버들로 데이터베이스 서비스를 계속할 수 있게 합니다. 클러스터에 최소한 하나의 서버가 실행 중인 한, 데이터는 언제나 접근 가능합니다. 이러한 탄력적인 구성을 통해 유지 보수 작업, 서버 장애 상황에서도 MLT Vacations의 웹 사이트, 예약 시스템, 데이터 웨어하우스 애플리케이션을 온라인 상태로 유지할 수 있습니다.
"OLTP 시스템 뿐 아니라 데이터 웨어하우스의 관점에서도 안정성은 점점 더 중요한 문제로 부각되고 있습니다.” 코로나의 말입니다. “많은 사용자들이 웨어하우스를 이용하여 매출, 재고, 가격 데이터를 분석하거나 고객 이슈, 신용 정보, 수익성을 추적하고 있습니다."
시스템의 핵심 기능
그리드 컴퓨팅의 핵심 전략의 하나로 프로세스와 스토리지 용량의 사용률을 극대화하는 목표가 있습니다. 일반적으로 기업은 컴퓨팅 파워를 구매하는 과정에서 자신들이 필요로 하는 이상의 용량을 추산하고, 이러한 잉여 용량에 대한 기술지원, 유지보수 비용까지 부담하고 있습니다. 설사 궁극적으로 모든 용량을 소진한다 하더라도, 이러한 방법은 결코 비용효율적인 비즈니스 방안으로 볼 수 없습니다. Oracle Real Application Clusters는 이러한 시나리오에 변화를 가능하게 하며, 기업이 정보 시스템을 점증적으로 확장하고 필요한 경우에만 서버 용량을 추가함으로써 자본 지출을 최소화합니다.
"Oracle Real Application Clusters 테크놀로지를 기반으로 구현된 오라클 데이터 웨어하우스는 ‘Shared-Everything’ 아키텍처를 기반으로 하기 때문에 매우 뛰어난 유연성을 갖습니다. 오라클의 데이터 제품 마케팅 담당 부사장 윌리엄 하디의 말입니다. 오라클 클러스터 데이터베이스 환경의 서버가 장애를 일으킨 경우에도, 다른 서버들을 통해 서비스가 계속됩니다. 따라서 데이터의 가용성이 보장되고 애플리케이션은 무중단 상태에서 운영이 가능합니다. “또 데이터베이스 클러스터의 온 디맨드 확장이 가능하다는 장점이 있습니다.” 하디는 이렇게 덧붙입니다. “Oracle Real Application Clusters는 클러스터에 추가된 추가적인 프로세싱 파워를 자동으로 온라인 상태로 전환합니다."
다른 이들도 이러한 접근 방법의 효율성을 인정하고 있습니다. “우리는 비즈니스가 성장함에 따라 정보 시스템을 쉽게 확장할 수 있기를 원했습니다” MLT Vacations의 레인스마의 말입니다. “기존에 운영하던 SMP 서버에는 확장성의 벽이 존재했으며, 이는 조만간 새로운 대형 서버를 구입해야 함을 의미했습니다. Oracle Real Application Clusters 환경에서는 필요할 때마다 소형 서버들을 추가해 나갈 수 있습니다."
SMP 서버를 Intel/Linux 기반의 오라클 데이터베이스, Oracle RAC 클러스터 환경으로 교체한 후, MLT Vacations는 시스템 성능을 개선하는 한편으로 테크놀로지 비용을 절감할 수 있었습니다. 이 회사는 이번 IT 투자의 결과로 향후 5 년 동안 소프트웨어, 하드웨어, 교육, 유지보수 등의 비용을 1백만 달러 가량 절감할 수 있을 것으로 예상하고 있습니다. “Linux 기반 오라클 환경으로 전환한 후 우리는 기대 이상의 성능과 비용효율성을 확인하고 있습니다.” MLT Vacations의 엔터프라이즈 테크놀로지 서비스 담당 디렉터 마이클 크레스는 이렇게 말합니다. “SMP 서버 환경에서는 아무리 많은 수의 프로세서를 장착한 서버라 하더라도, 프로세서 하나만을 별도로 오프라인 처리하는 것이 불가능했습니다."
Linux와의 동반 성장
MLT Vacations의 데이터 웨어하우스는 기업이 경제 침체 상황에서 비용 절감 효과를 제공하였을 뿐 아니라, 재고, 가격, 수익성 등의 추이를 예측하고 분석하는 핵심 자원으로 활용되고 있습니다. “지난 수년 동안 우리는 비용을 통제하고 비즈니스 규모를 조정하는데 초점을 맞추어 왔습니다.” 크레스의 말입니다. “이제부터는 비즈니스 성장을 진지하게 전망할 수 있게 되었습니다. 이러한 성공 과정에서 핵심적인 역할을 담당한 것이 바로 데이터 웨어하우스 시스템입니다."
"매일 단위로 관리자들에게 전송되는 플래시 리포트는 어제, 지난 주, 지난 달의 전년 동기 대비 매출 자료를 제공합니다.” 크레스의 말입니다. “또 재고 보고서를 통해 과거와 현재의 주문 상황을 비교할 수 있습니다. 데이터 웨어하우스가 없었다면 이러한 정보를 시기 적절하게 제공할 수 없었을 것입니다."
쿼리 성능을 개선하고 대규모 시스템 환경을 지원하기 위해, 오라클은 OS 벤더들과 긴밀하게 협력하면서 Linux 커널의 변경 작업을 위한 베스트 프랙티스(I/O 서브시스템에서 데이터베이스 요청을 비동기적으로 처리하는 방법, 대용량 메모리 환경의 지원, 64-비트 아키텍처 애플리케이션 지원 등)를 구현하고 있습니다. Linux 고객의 데이터 웨어하우스 환경이 성장하고 사용자의 수가 증가함에 따라 이러한 기능 역시 그 중요성이 더욱 강조될 것입니다.
"테라바이트 규모의 데이터 웨어하우스는 이제 매우 일반적인 경우가 되었습니다.” 메사츄세츠주 월섬에 소재한 데이터베이스 전문 컨설팅 업체 Winter Corporation의 사장 리처드 윈터는 이렇게 말합니다.
많은 오라클 고객들이 클러스터 Linux 플랫폼을 기반으로 멀티테라바이트 웨어하우스를 구현하고 있습니다. 한 소매업체는 Intel Xeon 서버와 저가형 스토리지 어레이, Red Hat Enterprise Linux 운영체제를 기반으로 16-노드 Oracle Real Applications Clusters 데이터 웨어하우스를 실행하고 있기도 합니다. 이 데이터 웨어하우스는 그 규모가 23 테라바이트에 달하며 그 규모와 쿼리 수가 매년 두 배씩 증가하고 있습니다.
관리의 단순화
데이터 웨어하우스가 수 테라바이트 단위로 확장되면서, 데이터베이스 관리 업무 또한 점점 더 복잡해지고 있습니다. 윈터는, 시스템의 아키텍처가 확장을 지원할 수 없다면 데이터 웨어하우스는 궁극적으로 무용지물이 될 수 밖에 없다고 단정합니다. 오라클은 이러한 문제에 대응하기 위해 서버 엔진에 셀프-관리, 자동화 기능을 추가하였습니다. 데이터베이스를 포함하는 전체 오라클 환경은 Oracle Enterprise Manager Grid Control을 통해 관리됩니다. 오라클의 하디에 의하면, 이러한 전략은 개발, 구축, 변경 관리, 구성, 일상 운영업무, 성능 진단에 이르는 전체 애플리케이션 라이프사이클을 단순화하는 효과를 제공합니다. “Grid Control은 데이터베이스, 미들웨어, 스토리지 자원을 포함하는 전체 인프라스트럭처를 관리, 모니터링합니다. 자동화된 스토리지 관리, 자동화된 메모리 관리, 자동화된 백업/복구 기능을 통해 다양한 운영 업무에 수반된 복잡성을 제거하고, 대규모 데이터를 관리하는 환경에서도 서비스 레벨 목표를 만족할 수 있습니다. 또, 관리자들은 클러스터 리소스를 기본적인 관리 단위로 설정하고, 시작, 중단, 모니터링, 페일오버, 재시작 등의 작업을 쉽고 간단하게 실행할 수 있습니다.
밴더빌트 대학은 Oracle Enterprise Manager Grid Control을 이용하여 사용자 프로비저닝, 데이터베이스 클로닝, 소프트웨어 설치 작업 등을 수행합니다. 데이터 웨어하우스가 전체 대학과 병원의 의사결정 요구사항을 반영하기 위해 확장되면서 이러한 전략의 중요성 또한 점점 더 커지고 있습니다. “우리의 DBA들은 구성, 고가용성 작업, 복구, 모니터링 등의 작업을 단 한 차례만 수행합니다.” 겟시는 이렇게 말합니다. “Oracle Real Application Clusters는 업데이트된 내용을 해당되는 노드에 자동으로 배포합니다. Oracle Real Applications Clusters의 자동화된 페일오버 기능은 많은 시간을 소요하는 수작업 프로세스를 제거하는 효과를 제공합니다. Oracle Enterprise Manager Grid Control 덕분에 16-노드 데이터베이스 클러스터를 훨씬 쉽게 관리할 수 있게 되었습니다."
비용적 측면
기업들은 IT 비용을 절감하고 핵심 OLTP 시스템의 고가용성을 보장하기 위한 대안으로 클러스터 Linux 솔루션에 관심을 집중하고 있습니다. 실제로 많은 기업들이 저가형 Linux 클러스터가 데이터 웨어하우스 환경에 제공하는 혜택을 깨닫고 있습니다..
Linux 클러스터 기반으로 구현된 데이터 웨어하우스는 매우 저렴한 비용으로 엔터프라이즈 레벨의 성능, 확장성, 24/7 가용성을 제공합니다. 이것은 Linux가 서버 시장에서 약진하고 있는 이유 중 하나입니다. 가트너 데이터퀘스트는 2008년까지 Linux가 전세계 서버 시장에서 21.8 퍼센트의 점유율을 차지할 것이라고 예측합니다. 이는 2003년 대비 12.6 퍼센트나 증가한 결과입니다.
오라클의 하디는 이렇게 결론을 짓습니다. “오늘날의 비즈니스 시스템은 점증하는 사용자 기반과 복잡한 쿼리를 지원하기 위한 대규모 데이터 웨어하우스 환경을 필요로 합니다. Linux 클러스터 솔루션을 이용하면 향후 성장 요구사항을 쉽게 만족하는 한편으로 서비스 레벨을 개선하고 컴퓨팅 비용을 절감할 수 있습니다. 이는 경제적인 측면에서 큰 의미를 갖습니다."
David Baum (david@dbaumcomm.com)은 캘리포니아주 산타 바바라에 거주하는 프리랜스 비즈니스 작가입니다.
|