Dịch vụ sửa máy tính pc laptop máy in - Nạp mực máy in Trường Tín Tphcm
Dịch vụ sửa máy tính pc laptop máy in - Nạp mực máy in Trường Tín Tphcm

Cách trích xuất văn bản tiếng Việt trong ảnh

--
Web Tin Học Trường Tín có bài: Cách trích xuất văn bản tiếng Việt trong ảnh Các công cụ trích xuất chữ trong ảnh trực tuyến có rất nhiều để chúng ta chọn lựa, có thể nhận diện chữ tiếng Việt trong ảnh.

Công nghệ nhận dạng ký tự quang học ORC dùng để làm nhận diện hình ảnh của chữ viết tay hoặc đánh máy thành các văn bản tài liệu, giúp người dùng có được nội dung mau hơn thay vì phải gõ lại bằng tay thủ công hay chuyển từ hình ảnh sang Word. Vì vậy đã có rất nhiều phần mềm OCR, hay nhiều trang web OCR trực tuyến để người dùng chọn lựa tham khảo. Hầu hết các công cụ đều có bổ trợ tiếng Việt nên qui trình bạn xử lý và lấy nội dung từ ảnh thuận tiện hơn rất nhiều. Trong bài viết này bạn đọc sẽ có 2 chọn lựa công cụ trích xuất nội dung từ ảnh trực tuyến, hỗ trợ nhiều định hình hình ảnh khi tải lên.

1. Chuyển chữ trong ảnh thành văn bản trên img2txt

  https://img2txt.com/en  

Trang web img2txt ngoài việc trích xuất nội dung từ hình ảnh mà còn có thêm một số tính năng kiểm tra chính tả, chỉnh sửa tư liệu trên Google Docs và lưu nội dung bằng nhiều định hình phổ biến khác.

Bước 1:

Chúng ta truy cập vào trang chủ của img2txt theo link dưới đây rồi nhấn vào biểu tượng tệp để tải hình ảnh. Sau đó chọn ngôn ngữ hiển thị trong file hình ảnh . Kích thước tập tin tải lên nhiều nhất là 8MB.

Tiếp đến nhấn Upload để tiến hành tải hình ảnh lên.

Tải hình ảnh

Bước 2:

Chúng ta chờ quá trình nhận diện và trích xuất chữ trong ảnh trên img2txt. Khi hoàn thành người sử dụng sẽ thấy toàn bộ nội dung văn bản có trong hình ảnh.

Nội dung text 

Bước 3:

Nhìn sang cạnh phải màn hình người dùng sẽ thấy có nhiều tùy chọn không trùng lặp dành cho nội dung được trích xuất từ hình ảnh.

  • Copy result: Sao chép tài liệu vào bộ nhớ đệm.
  • Translate a text: Dịch nội dung với Google Translate.
  • Check spelling: Kiểm tra chính tả văn bản.
  • Edit in Google Docs: Chỉnh sửa văn bản trích xuất trên Google Docs.
  • Download: Chọn định hình muốn tải tư liệu về.
  • Source: Như định dạng gốc.
  • Plain text: Trong định dạng txt.
  • Adobe Acrobat: Trong định dạng tư liệu PDF.
  • Microsoft Word: Trong định hình docx.
  • OpenOffice: Trong định dạng odf.

Tùy chọn tài liệu 

2. Hướng dẫn dùng NewOCR chuyển ảnh sang chữ

Bước 1:

Người dùng truy cập vào link dưới đây để vào trang chủ của NewOCR.

  • https://www.newocr.com/

Bước 2:

Tại giao diện trang chủ bấm vào nút Chọn tệp để tải file hình ảnh hoặc file PDF muốn chuyển thành dạng văn bản. Bên dưới nhấn chọn vào ngôn ngữ gốc trong tư liệu đã tải lên trang chủ. Có thể chọn nhiều ngôn ngữ đồng thời tùy vào nội dung tài liệu tải lên.

Tải tệp lên

Bước 3:

Nhấn tiếp vào nút Upload màu xanh bên dưới rồi nhấn vào Upload + OCR để triển khai nhận diện ký tự có trong tài liệu.

Nhận dạng ký tự

Bước 4:

Quá trình tải tệp lên và nhận dạng ký tự sẽ lệ thuộc vào dung lượng và số lượng trang nếu tải file PDF lên. Kết quả sẽ hiển thị nội dung tư liệu ở bên dưới.

Kết quả nội dung

Với hình ảnh thì NewOCR cũng hoạt động ổn định, nhận diện được cả ký tự tiếng Việt.

Tải hình ảnh

Kết quả cũng hiển thị nội dung có trong hình ảnh.

Nội dung trong ảnh

Bước 5:

Khi đã có tài liệu hoàn chỉnh, bấm vào nút Download và chọn lựa các định dạng tư liệu muốn tải xuống.

Chọn định dạng tải

Bước 6:

Trên NewOCR còn có tùy c họn dịch ngôn ngữ qua các nguồn dịch như Google Dịch, Bing Translator, với mặc định chuyển ngôn ngữ sang tiếng Anh.

Dịch ngôn ngữ

Nếu muốn chuyển qua ngôn ngữ khác chỉ cần chọn ngôn ngữ đích tại To rồi nhấn nút Translate để dịch là xong.

Dịch ngôn ngữ

Với trang web NewOCR, chúng ta sẽ có được nội dung văn bản nhanh nhất, trích xuất từ file PDF hay file hình ảnh. Việc NewOCR nhận dạng được cả tiếng Việt giúp ích cho người sử dụng rất nhiều. Người dùng cần kiểm tra lại nội dung sau khi hiển thị trước lúc chọn tải xuống.

Xem thêm:

  • Những công cụ chuyển đổi file trực tuyến tốt nhất cho mọi nhu cầu định dạng của bạn
  • Hướng dẫn toàn tập Word 2016 (Phần 16): Chèn ảnh và tùy chỉnh vị trí xuất hiện của ảnh
  • Cách cách chuyển định dạng PDF sang ảnh JPG, PNG

Chúc các bạn thi hành thành công!

NewOCR, img2txt, nhận dạng văn bản trong ảnh, cách chuyển pdf sang word, cách chuyển ảnh sang word, cách nhận dạng chữ trong pdf, ứng dụng ocr, ứng dụng ocr trực tuyến

Nội dung Cách trích xuất văn bản tiếng Việt trong ảnh được tổng hợp sưu tầm biên tập bởi: Tin Học Trường Tín. Mọi ý kiến vui lòng gửi Liên Hệ cho truongtin.top để điều chỉnh. truongtin.top tks.

Bài Viết Liên Quan


Xếp Hạng post

Bài Viết Khác

--