6

Tôi đang xây dựng một ứng dụng cần chụp ảnh và suy ra các thẻ liên quan đến nó. Những thẻ đó có thể là về những thứ, tính từ hoặc thậm chí là những cảm xúc liên quan đến bức tranh.Cần API gắn thẻ hình ảnh tự động, có bất kỳ đề xuất nào không?

Tôi đã tìm thấy ALIPR. Nhưng tôi đã thử nghiệm nó, some other people tested it cũng và nó không hoạt động tốt. ALIPR tạo ra quá nhiều lỗi trong tập hợp 15 thẻ được dự đoán. Ít nhất là đối với ứng dụng của tôi, tốt hơn là có ít thẻ nhưng đúng.

Tốt hơn, API phải dựa trên web và miễn phí. Bất kỳ đề xuất?

Cảm ơn trước!

Trả lời

4

Tôi nghĩ rằng nếu hình ảnh có thể được gắn nhãn tự động, Google sẽ từ bỏ số image labeler một thời gian dài trước đây. Thật không may, máy tính có rất nhiều khó hiểu hình ảnh.

Edit:

  • Nếu bạn quan tâm trong nghiên cứu computer vision có một cái nhìn tại CVPapers, đặc biệt là Open Source Computer Vision Implementations. Ghi nhãn hình ảnh tự động không được giải quyết (trừ khi bạn có một tập hợp chủ đề rất cụ thể/hạn chế).

  • Trích từ The Google Guide từ thứ ba ngày 13 tháng 3 năm 2007:

    Cụm từ “Larry Page” và “Sergey Brin” xuất hiện gần hình ảnh của Eric Schmidt, hoặc chú thích hình ảnh, hoặc trong các liên kết đến những hình ảnh đó. Google đoán rằng các từ có liên quan đến hình ảnh. Công nghệ của Google chưa đến mức nó có thể cho biết những gì có trong hình ảnh bằng cách nhìn trực tiếp vào nó.

HTH, đừng hy vọng quá cao.

PS: Tôi hy vọng bạn (hoặc người khác) chứng minh tôi sai và chia sẻ nó ở đây với tôi ;-)

Edit2:

Tôi chỉ cần stumbled trên Voc 2010 Challenge, trong đó, theo ý kiến ​​của tôi , minh họa rất tốt trạng thái hiện tại của tiến bộ thị giác máy tính. Trong một trong những thách thức các thí sinh phải tìm một đối tượng (từ một tập hợp các đối tượng rất hạn chế) trong hình ảnh và phân loại nó. Trên result page bạn có thể thấy, rằng một trong các thuật toán quản lý để phân loại máy bay không khí với độ chính xác 93%, nhưng "không thành công" ở các danh mục khác.

Đó chỉ là nhiệm vụ tìm kiếm "những thứ", thậm chí không tính từ hoặc cảm xúc.

+0

Trình gắn nhãn hình ảnh của Google phải là người trợ giúp Tìm kiếm hình ảnh của Google, đó chắc chắn không phải là phương pháp ghi nhãn hình ảnh chính tại Google. Nhưng cảm ơn cho bạn suy nghĩ! – fjsj

+0

Tôi có cảm giác rằng Google chủ yếu sử dụng văn bản xung quanh để in nhãn. – bjoernz

3

Kiểm tra https://imagga.com/ Nó có một số kết quả ấn tượng. Ngoài ra một số kết quả cực kỳ thú vị ... Rất may tất cả các thẻ được tạo ra đều có giá trị tin cậy, vì vậy bạn luôn có thể bỏ qua bất kỳ thứ gì nhỏ hơn ngưỡng (~ 15% cho trường hợp sử dụng của tôi). 12.000 hình ảnh một tháng miễn phí, không tệ. Nếu bạn có hơn 12.000 tháng hình ảnh sau đó chỉ cần xếp hàng yêu cầu của bạn.

+0

Hiện tại, họ chỉ cung cấp 2000 hình ảnh miễn phí mỗi tháng: ( – BesLoi

1

thử xem api api tốt nhất tôi đã gặp phải.họ cũng cung cấp 5000 thẻ hình ảnh miễn phí mỗi tháng để bạn có thể kiểm tra nó. họ cung cấp số dự án khởi động cho Android, ios, javascript, trăn vv

có rất nhiều những người khác như imagga, alchemyapi, clevapi vv sử dụng google để tìm thêm

nếu u cần thêm trợ giúp u có thể nhắn tin cho tôi.

+0

Điều này sẽ là bình luận – ketan

3

Nó không hoàn toàn rõ ràng cho dù bạn muốn xác định các thẻ để sử dụng cho mình, hoặc chỉ để cho các phần mềm sử dụng một "lẽ thường" bộ phổ quát của thẻ về các đối tượng thể hiện, vv

Hãy giả sử bạn muốn xác định bộ thẻ của riêng mình - chúng có thể là về năm năm một ảnh được chụp, tâm trạng được liên kết với hình ảnh (dựa trên bảng màu và đối tượng được mô tả v.v.) hoặc một cái gì đó kỹ thuật bạn nee d để phân biệt (ảnh khoả thân, chi tiết, loại nền, v.v.).

Chúng tôi có thể sử dụng máy học cho việc này! Đó là một chi nhánh của trí tuệ nhân tạo học các quy tắc (như cách gắn thẻ hình ảnh - ngay cả các quy tắc rất phức tạp) khi chúng tôi đưa ra nhiều ví dụ về hình ảnh. Vì vậy, bước chính cho bạn là tập hợp một tập hợp các hình ảnh mẫu cho mỗi thẻ bạn muốn. Khi bạn làm điều này, cho hình ảnh mà bạn có hai lựa chọn chính:

  • Sử dụng một khuôn khổ học sâu cho phép bạn áp dụng mạng nơ-ron vào vấn đề. Bạn sẽ cần chia nhỏ dữ liệu của mình thành các phần nhỏ hơn, thực hiện một chút mã hóa và trừ khi bạn có nhiều hình ảnh, hãy sử dụng nhiều thủ thuật khác nhau để làm cho nó học tốt công việc của bạn. Trừ khi bạn quan tâm đến nghiên cứu, caffeTensorFlow là những điều cần xem xét ngay bây giờ (một năm trước, đề xuất khác và một năm nữa tính từ thời điểm này có thể khác).

  • Sử dụng API trực tuyến, như bạn đã đề cập. Nhưng đối với tác vụ mà bạn muốn tập hợp tác vụ của riêng mình, bạn không có nhiều tùy chọn, vì hầu hết các dịch vụ chỉ làm phân loại chung - chúng sắp xếp hình ảnh của bạn dựa trên những đối tượng "cuộc sống hàng ngày" mà chúng phát hiện trên hình ảnh (và đôi khi các trường hợp đặc biệt như NSFW, nhưng thường không ở mức nhạy cảm bạn muốn).

Một tùy chọn mà bạn có trong API dựa trên web là vize.it, trong đó cung cấp một giao diện web, nơi bạn có thể tải lên và gắn nhãn hình ảnh minh họa của bạn và nó cho phép bạn đào tạo API AI của riêng bạn mà tạo ra những thẻ bạn được chỉ định. Vì vậy, bạn đang nhận được tốt nhất của cả hai thế giới. Thật không may, nó không hoàn toàn miễn phí, nhưng kế hoạch là khá chi phí thấp cho số lượng nhỏ của hình ảnh và bạn nhận được một mẫu miễn phí lúc đầu (cộng với quá trình đào tạo là miễn phí quá).

Tuyên bố từ chối trách nhiệm: Tôi là một trong những người đồng sáng lập vize.it.