Tôi đang xem xét thực hiện một dự án nhỏ như một phần của các bậc thầy của tôi để làm ocr chỉ cho sheetmusic thay vì văn bản.OCR cho bản nhạc
Tôi nghĩ PIL và Python sẽ tốt cho chứng minh đơn giản về khái niệm "ghi chú" R.
Câu hỏi của tôi là: Có ai có bất kỳ "không làm điều đó với PIL sử dụng xyz thay thế" hoặc một cái gì đó trong hẻm đó?
EDIT: liên kết delicius tôi về vấn đề này nếu có ai quan tâm: http://delicious.com/seet/DIKU-09b4%2Bb1
============================ =============================================
EDIT2 :
Hiện tại, tôi biết nhiều hơn về OCR cho bản nhạc hoặc OMR khi được gọi.
Trong học viện, khu vực đã được nghiên cứu từ cuối 60/đầu 70 và xây dựng hệ thống OMR không phải là một nhiệm vụ đơn giản. Để có được một bản tóm tắt của các vấn đề và nghiên cứu cho đến đầu năm 2000, bạn có thể đọc "The challenge of Optical Music Recognition" mà là khá thành công trong việc vẽ lên các dòng của lĩnh vực này.
Về phần mềm hiện tại tôi biết ít nhất sau đây:
Và các bài kiểm tra không khoa học của tôi đã cho tôi ý tưởng rằng photoscore là thứ mạnh mẽ nhất.
Đối với phần mềm nguồn mở Audiveris là điều hoàn chỉnh duy nhất tôi tìm thấy và được viết bằng Java.
Về câu hỏi ban đầu của tôi, tôi đang sử dụng Gamera. Gamera là một công cụ mã nguồn mở để phân tích hình ảnh tài liệu, cung cấp các công cụ để thực hiện tất cả các công cụ cơ bản cần thiết để phân tích hình ảnh để nhận dạng. Gamera có giao diện python và khả năng viết C++ "bộ công cụ". Ví dụ: có thể là download and use a staffline removal toolkit for gamera.
Hãy nghĩ rằng phản đối duy nhất sẽ là hiệu suất, điều này không quan trọng đối với một dự án học thuật. –
Mọi cập nhật hoặc đề xuất? – dassouki
"Cảm giác" của tôi về công cụ thương mại tốt nhất là Photoscore – svrist