GitHub - toibaonguyen/Demo-fpt

Bước 1: Cài đặt python 3.12.1
Bước 2: Clone source này về
Bước 3: Mở terminal và chạy các lệnh sau để tạo môi trường ảo: py -3.12.1 -m pip install virtualenv py -3.12.1 -m virtualenv venv
Bước 4: Kích hoạt môi trường ảo bằng lệnh sau: venv\Scripts\activate
Bước 5: Chạy các lệnh sau để cài các thư viện cần thiết: pip install opencv-python pip install numpy pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu pip install easyocr
Bước 6: Cài các extension sau:

Bước 8: Đặt giá trị đường dẫn của ảnh vào biến path_to_image trong file main.py:

Các ảnh bên trong folder process_images là các ảnh ghi lại quá trình chuyển đổi của ảnh:

Các ảnh bên trong folder ocr_slices là các ảnh được cắt nhỏ ra từ bảng để thực hiện việc đưa vào model ocr để detect text

Format đúng của ảnh phải là một bảng hình chữ nhật gồm N hàng x M cột và các đoạn text, trong mỗi ô nhỏ hình chữ nhật không được quá sát nhau để tránh gây ra vấn đề khi lọc ô:

Dưới đây là 2 mẫu chuẩn có thể sử dụng:
Dưới đây là mẫu không được:

Lý do là vì các text trong ô của 2 cột sau quá sát nhau:

Ngoài ra có thể sử dụng những model ocr tiếng việt khác để thay thế khi detect text trong từng ô.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
__pycache__		__pycache__
images		images
ocr_slices		ocr_slices
process_images		process_images
OcrToTableTool.py		OcrToTableTool.py
README.md		README.md
TableExtractor.py		TableExtractor.py
TableLinesRemover.py		TableLinesRemover.py
main.py		main.py
output.txt		output.txt
read_me_first.txt		read_me_first.txt
requirements.txt		requirements.txt

Provide feedback