2011-12-16 7 views
6

Giả sử tôi có một số hệ thống quét tài liệu, trong đó tất cả các tài liệu đều sử dụng cùng một phông chữ và cỡ chữ.Làm thế nào để phát hiện chính xác, hình dạng được xác định trước với hough biến đổi, giống như một "W"?

Trong các tài liệu này, sẽ luôn có cùng một chữ cái "W". Giả sử nó luôn là 20 px lớn. Làm thế nào tôi có thể thiết lập biến đổi hough để nhận ra chữ cái này "W" ở số 20 px lớn trong tài liệu của tôi?

Trả lời

3

tìm kiếm Một Google nhanh chóng mang lại những thông tin sau quan tâm:

Generalizing the Hough Transform to Detect Arbitrary Shapes

và nó trông giống như một lecture sử dụng giấy trên như nguồn của nó.

Ngoài ra, nếu đó là "W" thực tế, một công cụ OCR như Tesseract có phù hợp hơn với nhu cầu của bạn không?

+0

Tesseract không hoàn hảo, nhưng chắc chắn là tốt hơn so với bất kỳ giải pháp được cải tiến nào để nhận dạng ký tự. – Sam

+0

Đúng! Kịch bản là khá tùy ý mặc dù. Những gì tôi đã được moreso nhận được là một thực tế rằng đó là một vài đường thẳng. Tôi cảm thấy như biến đổi Hough sẽ có thể xử lý hình dạng mà là những đường thẳng đơn giản khá dễ dàng. đây không phải là trường hợp à? Bình chọn, liên kết tuyệt vời với tesseract. –

1

Biến đổi Hough cho các đường tìm phương trình đường phù hợp nhất. Bạn sẽ cần phải thực hiện xử lý bổ sung để chỉ tìm các đoạn đường. Nếu độ dày ký tự là vài pixel, thì để tìm các dòng có hiệu quả bạn có thể muốn giảm độ dày xuống một pixel. Có những kỹ thuật để làm điều đó, nhưng cũng có nhiều bẫy thuật toán khác nhau.

Khi bạn có các đoạn đường, bạn sẽ vẫn phải viết một thuật toán để xác định các ký tự dựa trên vị trí tương đối và góc của các đoạn thẳng. Nó khó hơn lần đầu tiên xuất hiện.

Tương quan chéo chuẩn hóa (khớp mẫu) có thể hoạt động nếu bạn chắc chắn rằng hình ảnh sẽ luôn xoay vòng, các ký tự sẽ luôn có cùng kích thước, v.v. một số vòng quay và một số biến thể ngược lại.

Tất cả những điều đó sang một bên, có thể sẽ rẻ hơn trong thời gian dài để sử dụng gói OCR thương mại hoặc dự án nguồn mở hợp lý tốt. OCR khó thực hiện nếu bạn chưa quen với xử lý hình ảnh.