Dạo này mình tìm hiểu về AI thì thấy có hai khái niệm hay bị nhắc tới là NLP và công nghệ OCR. Nghe thì có vẻ hơi kỹ thuật, nhưng thực ra ứng dụng của hai công nghệ này khá gần với đời sống hằng ngày, nên mình viết lại một bài chia sẻ ngắn cho ai đang tò mò giống mình.

Trước hết, NLP là gì?


NLP là viết tắt của Natural Language Processing, hay còn gọi là xử lý ngôn ngữ tự nhiên. Hiểu đơn giản thì NLP là công nghệ giúp máy tính hiểu được ngôn ngữ của con người, tức là chữ mình viết ra hoặc lời mình nói.

Ví dụ như khi bạn gõ câu hỏi lên Google, chatbot trả lời đúng ý, hay hệ thống hiểu được nội dung email để phân loại, tất cả đều có NLP phía sau. NLP giúp máy biết câu nào là câu hỏi, đâu là thông tin chính, đâu là cảm xúc tích cực hay tiêu cực. Nói ngắn gọn thì NLP giúp máy hiểu nội dung ngôn ngữ, chứ không chỉ đọc từng chữ rời rạc.

Còn công nghệ OCR thì lại giải quyết một vấn đề khác. OCR là viết tắt của Optical Character Recognition, tức là công nghệ nhận dạng ký tự quang học. Công nghệ này giúp máy đọc chữ từ hình ảnh, ví dụ như ảnh chụp giấy tờ, hóa đơn, CMND, sách scan hay ảnh chụp màn hình.

Nếu không có OCR thì máy chỉ thấy đó là một tấm hình. Nhờ OCR, máy có thể nhận ra trong hình đó có chữ gì, số gì, sắp xếp theo dòng ra sao. Bạn nào từng dùng app scan tài liệu rồi copy được chữ từ ảnh ra chắc đã gặp OCR rồi, chỉ là mình không để ý tên gọi thôi.

Điểm thú vị là NLP và OCR thường đi cùng nhau trong các hệ thống AI. OCR sẽ làm nhiệm vụ chuyển chữ trong hình ảnh thành văn bản, sau đó NLP sẽ tiếp tục xử lý phần văn bản đó để hiểu nội dung. Ví dụ như hệ thống tự động đọc hóa đơn: OCR đọc chữ trên hóa đơn, NLP hiểu đâu là tên sản phẩm, đâu là giá tiền, đâu là tổng cộng.

Có thể hình dung đơn giản thế này:


OCR giúp máy nhìn và đọc chữ, còn NLP giúp máy hiểu ý nghĩa của chữ đó.

Nhờ sự kết hợp này mà nhiều quy trình trước đây phải làm thủ công giờ được tự động hóa, như nhập liệu giấy tờ, xử lý hồ sơ, đọc hợp đồng, trích xuất thông tin từ tài liệu scan. Điều này giúp tiết kiệm rất nhiều thời gian và công sức cho con người.

Theo mình thấy, NLP và công nghệ OCR không phải là thứ gì quá xa vời hay “cao siêu”. Chúng chỉ là cách để máy tính ngày càng hiểu thế giới của con người tốt hơn, từ chữ viết, hình ảnh cho tới ngôn ngữ tự nhiên. Và đó cũng là lý do vì sao mấy năm gần đây AI phát triển rất nhanh trong các ứng dụng thực tế.