'문맥'과 '구조'까지 이해하는 인공지능(AI)
Ai 신기술·2025. 5. 13.
최근 문서 인공지능(AI) 기술이 비약적으로 발전하고 있습니다. 기존의 광학 문자 인식(OCR)이 단순히 글자를 인식하는 수준에 그쳤다면, 이제는 문서의 문맥과 구조까지 이해하는 단계로 진화하고 있습니다.특히 비전언어모델(VLM) 기반 OCR 기술은 계약서나 보고서처럼 다양한 형식의 문서에서도 표, 조항, 서명란 등을 AI가 자동으로 식별하고, 구조화된 데이터로 변환해주는 능력을 보입니다.비전언어모델(VLM)이란?VLM(Vision-Language Model)은 이미지와 언어를 동시에 이해할 수 있는 인공지능입니다. 쉽게 말해, 이미지 전문가와 언어 전문가가 함께 일하는 것처럼 동작합니다. 문서 내에서 도장, 손글씨, 표, 문단 등을 AI가 시각적으로 파악하고, 그 안의 텍스트를 문맥적으로 해석하는 방식..