Jeffrey Erickson | Senior Writer | 2025년 7월 31일
'종이 문서나 PDF의 정보를 직접 읽고 회계 애플리케이션에 입력하는 작업에 내 업무 시간을 투자하고 싶다'고 생각하는 사람은 아무도 없을 것입니다. AI 기반 문서 이해(document understanding) 기술의 유용성은 바로 그 점에서 기인합니다. 문서 이해는 사람들이 기꺼이 넘기고 싶어 하는 번거로운 작업을 대신해 주는 기술입니다. 또한 문서 처리 가속화, 비용 절감, 정확성 향상에도 도움을 줍니다. 문서 이해 기술은 기업의 SaaS 애플리케이션 워크플로에 통합되는 경우가 많으며, 최근에는 AI 훈련 데이터를 위한 텍스트 라벨링과 AI 에이전트의 다단계 작업 완료에 필요한 정보 제공에 사용되고 있습니다. 이는 결과적으로 사람들이 사고, 구축, 의사 소통 등 선호하는 작업에 더욱 집중할 수 있도록 만들어 줍니다.
문서 이해란 PDF나 종이 문서 스캔본과 같은 텍스트 파일에서 정보를 추출하여 비즈니스 애플리케이션으로 전달하는 자동화된 프로세스입니다. 이는 수동 데이터 입력을 최소화하고 나아가 완전히 제거함과 더불어 정확성을 향상시킵니다. 문서 이해의 기반 기술은 정교한 머신러닝(ML) 알고리즘입니다. ML은 이미지 처리 단계부터 시작해 가격, 이름, 청구서, 구매 주문(PO) 번호 등의 관련 정보를 발견, 추출하는 단계, 데이터베이스에 저장한 후 관련 비즈니스 시스템에 통합하는 단계 등 다양한 단계별로 핵심적으로 사용되는 기술입니다.
예를 들어 제조업체는 문서 이해 기술을 활용해 구매 주문서에서 정보를 추출하고 이를 회계 원장 및 재고 관리 시스템에 자동으로 입력함으로써 영업 프로세스의 속도와 정확성을 크게 향상시킬 수 있습니다. 마찬가지로 기업은 문서 이해 기반 경비 처리 시스템을 도입해 영수증 이미지에서 관련 정보를 추출한 후 직원이 작성해야 하는 경비 보고서의 초안을 자동으로 생성할 수 있습니다.
문서 이해는 AI와 ML의 성공적인 초기 사용 사례 중 하나입니다. 비즈니스 애플리케이션에 통합되어 워크플로를 자동화함으로써 수동 데이터 입력 및 문서 처리 단계에 많은 시간을 할애해야 했던 전문가들에게 더 가치있는 작업을 수행할 시간을 더해 줍니다. 자연어 처리(NLP) 및 검색 증강 생성(RAG)과 결합된 문서 이해 기술은 문서의 의미론적 의미를 이해하고 문서 분류 및 정보 검색을 지원하는 시스템의 필수 요소로 활용될 수 있습니다.
핵심 요점
문서 처리(document processing)는 문서 이해의 핵심 구성 요소입니다. 다양한 파일 형식에서 데이터를 추출하여 구조화된 형식으로 변환하고, 데이터베이스에 분류하여 온라인 양식의 필드 입력 및 송장 처리, 급여, 영업, 경비 회계 등의 부서별 업무를 지원합니다.
이와 같은 작업을 수행하는 문서 처리 시스템에는 사전 정의된 규칙이 필요합니다. 규칙이 설정되면 머신러닝 알고리즘은 가격, 날짜, 이름, 주소, 관련 메모, 계좌 번호 및 기타 비즈니스 데이터가 포함된 텍스트 블록, 표, 필드에서 데이터를 식별하고 추출할 수 있습니다. 기업은 수동 데이터 입력 프로세스를 자동화함으로써 오류를 줄이고 부서별 업무 처리를 획기적으로 가속화할 수 있습니다.
문서 이해 소프트웨어 및 클라우드 서비스는 ML과 AI를 활용하여 청구서, 영수증 등 다양한 유형의 문서로부터 데이터를 추출하고, 이를 비즈니스 프로세스용 정보 제공에 사용되는 애플리케이션 및 워크플로에 제공합니다. 이러한 자동화는 문서 분류 및 데이터 입력과 같은 작업에 효율성과 정확성을 더해 줄 수 있는 새로운 방법입니다.
문서 이해 프로세스는 PDF, 스캔본, JPEG 등 다양한 형식의 문서에서 텍스트, 표, 서명을 식별하고 추출할 수 있습니다. 추출된 데이터는 JSON 페이로드와 같은 구조화된 형식으로 반환되며, 필드 유형과 값이 포함되어 애플리케이션 및 워크플로에 쉽게 통합될 수 있습니다. 문서를 기계가 읽고 편집할 수 있는 텍스트로 변환하여 AI 시스템의 출력에 활용할 수 있도록 만들어 주는 문서 이해는 생성형 AI 서비스 및 AI 에이전트 활용을 지원하는 중요한 기술이 되었습니다.
AI 에이전트는 작업을 할당받고, 환경을 조사하고, 역할에 따라 규정된 조치를 취하고, 경험을 기반으로 행동을 조정할 수 있는 소프트웨어 엔티티입니다. 관련 작업은 여러 단계로 구성된 복잡한 작업인 경우가 많고 종종 텍스트 기반 데이터 접근이 필요합니다. 예를 들어, 공급망 관리 에이전트는 스캔된 서류 양식을 비롯한 다양한 출처와 형식의 구매 주문을 분석하여 물류 최적화를 지원하는 임무를 수행할 수 있습니다.
문서 이해 서비스는 데이터 라벨링 도구에도 활용될 수 있습니다. 이를 통해 사용자는 문서 샘플에서 특정 필드를 시각적으로 강조 표시하고 직접 라벨링할 수 있습니다. 이는 맞춤형 대규모 언어 모델(LLM)을 미세 조정하기 위한 훈련 데이터 세트를 생성하는 과정에서 필수적인 단계입니다. 이는 향후 유사한 문서에서 정보를 이해하고 추출하는 모델의 능력을 향상시키는 선순환 구조를 형성합니다.
일반적으로 ERP, 공급망 관리, CRM 및 기타 비즈니스 애플리케이션, 특히 SaaS 시스템을 통해 사용할 수 있는 문서 이해 기능은 사용자의 업무 효율성을 높여 주는 핵심적인 기능입니다. 애플리케이션 개발자는 텍스트 추출 API, 테이블 식별 API, 문서 분류 API와 같은 API를 통해 문서 이해 클라우드 서비스에 접근하여 직접 구축한 애플리케이션 내의 문서 처리 작업을 자동화할 수 있습니다.
기업은 처리 속도를 높이며 비용을 절감하고 인적 오류 위험을 최소화하기 위해 문서 이해 기술을 도입합니다. 그와 같은 이점을 구현하는 구체적인 방식은 다음과 같습니다.
생성형 AI는 광학 문자 인식(OCR) 및 규칙 기반 시스템과 같은 기존 방식을 보완함으로써 문서 이해 능력을 크게 발전시켰습니다. 그러나 이 분야에서 주목받는 신기술은 그뿐만이 아닙니다.
생성형 AI와 NLP가 문서 이해 시스템의 역량을 강화함에 따라(예: 문서 내 이미지 지원, 복잡한 레이아웃 이해, 비정형 데이터에서도 높은 정확도로 정보 추출) 문서 이해 기술은 인간에 더 가까운 이해 능력을 갖추게 되었고 그 사용 사례의 범위도 크게 확장되고 있습니다. 향후 문서 이해 시스템의 활용이 더욱 확대될 것으로 예상되는 분야는 다음과 같습니다.
어떤 산업이든, 문서 내용을 더 정확하게 처리하고 이해할 수 있게 된 기업은 의사 결정 개선, 효율적 워크플로, 고객 서비스 향상, 텍스트 데이터에 숨겨진 가치 있는 인사이트 도출 등을 통해 다양한 부문을 개선할 수 있습니다. 결과적으로 효과적인 문서 이해는 시간과 비용 절감, 오류 감소, 더 데이터 중심적이고 경쟁력 있는 기업으로 이어집니다.
Oracle Cloud Infrastructure(OCI) Document Understanding은 애플리케이션에 문서 이해 기능을 추가하고자 하는 기업에게 강력하면서도 비용 효율적인 솔루션을 제공합니다. 기업용 애플리케이션은 간단한 API와 명령줄 인터페이스 도구를 통해 사전 구축된 AI 모델을 사용하여 여러 언어로 작정된 문서들로부터 텍스트, 표 및 기타 주요 데이터를 추출할 수 있고, 필요한 경우 더 많은 맞춤형 문서 추출 도구를 사용할 수도 있습니다.
OCI Document Understanding은 미지급금 처리, 경비 처리 및 콘텐츠 관리와 같은 핵심 엔터프라이즈 업무에 사용되는 Oracle 컴퓨터 비전 및 자연어 처리 기술을 기반으로 구축되었습니다. Oracle Cloud는 기업 고객이 해당 기술을 더 잘 활용할 수 있도록 지원하고자 데이터를 업로드 및 라벨링하고 최첨단 AI 서비스에서 커스텀 모델을 훈련할 수 있는 직관적인 인터페이스를 제공합니다. OCI는 Document Understanding 외에도 모든 애플리케이션 사용자들이 경쟁력 있는 가격 정책을 통해 이용할 수 있는 다양한 AI 서비스 오퍼링을 제공합니다.
문서 이해는 머신러닝을 활용해 수동 비즈니스 프로세스를 자동화하는 과정 초기의 주요 성공 사례입니다. 경제 전반의 정보량이 지속적으로 증가 중인 지금, 문서 이해 기술은 기업이 데이터를 더 효율적으로 처리 및 활용하고 인력이 더 가치 있는 업무에 집중할 수 있도록 지원할 것입니다. 또한 문서 이해는 훈련 과정에서, 그리고 출력물 개선을 통해서 생성형 AI의 유용성을 향상시킬 수 있는 핵심 기술로서의 역할을 앞으로도 계속 수행할 것입니다. 특히 AI 에이전트가 더 많은 업무를 자동으로 수행하게 될 미래에 더욱 중요하게 사용될 기술입니다.
문서 이해는 AI가 더 많은 데이터에 보다 효과적으로 액세스할 수 있도록 지원함으로써 AI의 출력물을 개선하고 그 사용 방식을 간소화할 수 있는 핵심 기술입니다. 그러나 문서 이해는 2025년 클라우드 서비스의 사용량 증가를 견인하는 여러 요소 중 하나일 뿐입니다.
문서 이해는 기존 OCR과 어떻게 다른가요?
OCR은 문서 이해 프로세스의 기반인 핵심 기능으로서 이미지, PDF 등에 포함된 텍스트를 편집 가능한 텍스트로 변환합니다. 문서 이해는 해당 텍스트를 비즈니스 애플리케이션에서 활용할 수 있도록 처리하는 기술입니다.
문서 이해를 사용해 처리할 수 있는 문서 유형으로는 어떤 것들이 있나요?
문서 이해 프로세스는 PDF나 .jpg, .png 같은 이미지 파일 등의 문서를 스캔하고 발견한 텍스트를 편집 가능한 형태로 변환합니다. 영수증, 청구서, 대출 신청서 등의 문서 내 필드를 스캔하고, 이름, 금액, 날짜 및 기타 중요한 세부 정보를 인식해 해당 정보를 비즈니스 애플리케이션에서 활용할 수 있도록 만들어 줍니다.
문서 이해 솔루션으로 처리되는 데이터의 보안 수준은 어느 정도인가요?
문서 이해 프로세스의 데이터 보안 수준은 해당 프로세스에 포함된 아키텍처 및 데이터 보안 조치에 비례합니다. 데이터가 저장 및 전송 중에 암호화되나요? 백업되었나요? 적절한 액세스 제어 수단을 사용하고 있나요? 이와 같은 요소들을 적용함으로써 모든 데이터 프로세스의 보안을 강화할 수 있습니다.