Phụ thuộc vào định nghĩa "thời gian thực", nhưng có, bạn có thể thực hiện tương đối nhanh chỉ với các chữ số 0-9 trên iPhone 4, đặc biệt nếu bạn có phông chữ, điều kiện ánh sáng, v.v. mà họ sẽ xuất hiện.
Tôi khuyên bạn nên đọc bài viết trên how Sudoku Grab does its recognition of puzzles bằng camera iPhone. Trong trường hợp của họ, một mạng thần kinh được huấn luyện đã được sử dụng để xác định các chữ số, nên đơn giản và nhanh chóng hợp lý trên phần cứng iOS hiện đại.
Các thư viện nhận dạng hiện tại ngoài đó, như OpenCV, sẽ sử dụng CPU của iPhone để thực hiện quá trình xử lý. Tôi đã nghe nói rằng họ có thể thực hiện các tác vụ phức tạp hơn như nhận diện khuôn mặt đủ nhanh để sử dụng với các nguồn video trong khi hiển thị số lần nói lắp tối thiểu.
Để có hiệu suất tốt hơn nữa, tôi tin rằng có rất nhiều tiềm năng trong GPU có thể lập trình trên các thiết bị iOS mới hơn. Trong my benchmarks, tôi thấy tốc độ 14X - 28X khi sử dụng GPU của iPhone 4 để xử lý hình ảnh đơn giản. Trong khi rất ít người đang xem xét điều này ngay bây giờ, một thứ như mạng thần kinh của Sudoku Grab phải là một quá trình đủ song song để hưởng lợi từ việc chạy trên GPU.
Nguồn
2011-02-03 16:30:31
thể trùng lặp của: http://stackoverflow.com/questions/3140455/training-tesseract-to-use-with-iphone –
@Daniel: Trong khi câu hỏi đó hỏi làm thế nào để sử dụng Tesseract để đọc các số trong bất kỳ hình ảnh tĩnh nào, điều này đang nghiên cứu khả năng thực hiện loại xử lý này từ luồng video trực tiếp. Tôi tin rằng có đủ sự khác biệt ở đây để biện minh cho một câu hỏi mới. –