2012-02-20 27 views
12

Tôi đang xây dựng một ứng dụng iOS (chụp ảnh và chạy OCR) bằng Tesseract (thư viện OCR) và nó hoạt động rất tốt với số lượng và ký tự được viết tốt (sử dụng phông chữ thông thường).7-Segment Display OCR

Sự cố tôi gặp phải là nếu tôi thử trên Màn hình 7 phân đoạn, nó cho kết quả rất xấu.

Vì vậy, câu hỏi của tôi là: Có ai biết cách tôi có thể tiếp cận vấn đề này không? Có cách nào để Tesseract nhận ra những nhân vật này không?

+3

Điều thú vị là (bất kể gói cụ thể này), việc xác định 7 ký tự phân đoạn đơn giản dễ dàng hơn - xử lý hình ảnh đơn giản - phát hiện cạnh và sau đó tìm độ dài và hướng dẫn mang đến cho bạn nửa chừng – Ofir

Trả lời

9

Tôi cũng gặp khó khăn trong việc nhận dạng chữ số từ hình ảnh của màn hình LCD.

tôi đã có một số thành công biên của tiền xử lý hình ảnh với ImageMagick để bao phủ một bản sao của hình ảnh trên chính nó với một sự thay đổi dọc nhẹ để lấp đầy khoảng trống giữa các phân đoạn:

$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png 

Cuối cùng , tuy nhiên, ân huệ tiết kiệm của tôi là "Bảy nhận dạng ký tự quang học phân đoạn" nhị phân: http://www.unix-ag.uni-kl.de/~auerswal/ssocr/

Rất cám ơn tác giả, Erik Auerswald, cho mã này!

+0

Làm thế nào để chạy ssocr trên iOS? – phnmnn

+0

Bạn đã sử dụng Android như thế nào? –

2

Tôi chưa thử OCRing 7-Segment Display, nhưng tôi nghi ngờ rằng sự cố có thể do các ký tự không được kết nối thành phần gây ra. Tesseract không xử lý các phông chữ bị ngắt kết nối tốt khỏi trải nghiệm của tôi.

Xói mòn đơn giản (xử lý hình ảnh) có thể giúp đỡ bằng cách kết nối các đoạn, nhưng bạn sẽ phải thử nghiệm và chơi với kích thước hạt nhân để ngăn chặn quá nhiều biến dạng.

+0

Tôi biết điều đó. Tôi đã thử tô màu các điểm ảnh cho bản thân chỉ để thử OCR trên ảnh (với các chữ số được kết nối) và nó vẫn không hoạt động. Có lẽ bởi vì phông chữ là lạ, vì vậy tôi đang cố gắng để làm việc trên phông chữ. Thx cho câu trả lời của bạn anw :) – Karim

+2

Sau đó, đào tạo tesseract bằng cách sử dụng phông chữ đó. Nó có lẽ là tốt hơn để sử dụng phông chữ sau khi phân đoạn các phân đoạn, nhưng bạn nên thử cả hai (đào tạo bằng cách sử dụng bản gốc và các phông chữ được kết nối) để xem đó là tốt hơn. –