OCR (Optical Character Recognition) là công nghệ chuyển đổi chữ viết trong hình ảnh hoặc tài liệu scan thành văn bản số. Tuy nhiên, kết quả OCR truyền thống thường gặp hạn chế khi xử lý tài liệu phức tạp, bố cục đa dạng hoặc chất lượng hình ảnh kém. Đây là lúc LLM (Large Language Model) đóng vai trò hỗ trợ quan trọng.
LLM có khả năng hiểu ngữ cảnh và cấu trúc ngôn ngữ, giúp hệ thống phát hiện và sửa các lỗi phổ biến sau OCR, đồng thời suy luận nội dung ngay cả khi dữ liệu đầu vào không hoàn toàn chính xác. Nhờ đó, văn bản được trích xuất trở nên mạch lạc và dễ sử dụng hơn.
Sự kết hợp giữa OCR và LLM giúp nâng cao độ chính xác trong xử lý tài liệu, đặc biệt với các trường hợp phức tạp như hợp đồng, biểu mẫu hay giấy tờ hành chính. Đây là nền tảng cho các hệ thống xử lý văn bản thông minh trong môi trường số.

