2010-03-30 8 views
29

tôi đã quan tâm đến công nghệ ngữ nghĩa sau khi đọc rất nhiều sách, blog và các bài báo trên mạng nói rằng nó sẽ làm cho dữ liệu máy dễ hiểu, cho phép các đại lý thông minh lý do lựa chọn tuyệt vời, tự động & thành phần dịch vụ năng động vv ..Có ứng dụng sát thủ nào cho Ontology/semantics/OWL/RDF chưa?

Tôi vẫn đọc những thứ tương tự từ 2 năm nay. Số lượng bài viết/blog/ngữ nghĩa-hội nghị đã tăng lên đáng kể. Nhưng tôi vẫn không thể thấy bất kỳ ứng dụng sát thủ nào. Tại sao nó như vậy? Hoặc là có một số ứng dụng/sản phẩm (thương mại/mã nguồn mở) đã tồn tại, mà thực sự đang làm tất cả những gì đang được khoe khoang?

Để đặt chính xác hơn, có sản phẩm nào tận dụng các công nghệ ngữ nghĩa (đặc biệt là RDF/OWL/SPARQL) và đang cung cấp chức năng/hiệu suất/bảo trì, điều này không thể thực hiện được với các công nghệ hiện có (không có ngữ nghĩa) ? Một số sản phẩm hoàn toàn phụ thuộc vào công nghệ ngữ nghĩa và thực sự bổ sung giá trị cho khách hàng và tạo ra doanh thu?

+3

@narnirajesh: Tôi đã chỉnh sửa bài đăng của bạn, viết 'không' thay vì 'số' khá nhiều làm cho câu không thể đọc được. Sau đó '?' là đủ: không cần phải viết "????" cũng không "?????". Bây giờ để trả lời câu hỏi của bạn, * "là có bất kỳ sản phẩm nào tận dụng các công nghệ ngữ nghĩa (đặc biệt là RDF/OWL/SPARQL)" * Tôi muốn bị trả lời rằng Web 2.0 không tận dụng đủ công nghệ tuân thủ buzzword nhưng don ' Đừng lo lắng, chúng tôi đang đưa các chuyên gia tư vấn không biết gì vào Web 3.0 và họ sẽ viết phần mềm nhanh nhẹn tận dụng buzzwords bằng MDA trong một nhịp tim. – SyntaxT3rr0r

+0

Cảm ơn bạn đã chỉnh sửa :) Tôi đã không hoàn toàn hiểu ý kiến ​​của bạn về các công nghệ ngữ nghĩa. Bạn có thể vui lòng xây dựng? – user304867

Trả lời

6

Web ngữ nghĩa dựa trên các nhà cung cấp nội dung đang nỗ lực ghi chú thích hợp mọi thứ để làm cho máy có thể đọc được.

Đó là quá nhiều công việc cho hầu hết mọi người không phải là thủ thư.

Ứng dụng sát thủ thực sự có vẻ là thứ có thể lấy được ngữ nghĩa từ nội dung không có cấu trúc mà không cần đánh dấu đặc biệt. Nhìn vào công việc tuyệt vời của Google ví dụ đã làm với công cụ tìm kiếm của nó.

Để hệ thống hoạt động, nó không được đặt gánh nặng lên người dùng.

Mặt bằng trung gian là các hệ thống gắn thẻ như ở đây trên Stackoverflow. Chúng hoạt động khá tốt, mặc dù các thẻ hoàn toàn adhoc và trong các phần không phù hợp.

+0

Điều tốt nhất là nếu bạn có thể có nguồn gốc của thông tin ban đầu thêm thẻ ngữ nghĩa khi nó được tạo ra. Và lợi thế của các thẻ ngữ nghĩa trên các thẻ thông thường là chúng ít mơ hồ hơn. –

+0

Nếu bạn cần một người nào đó để xem lại mọi thứ để đưa vào các thẻ ngữ nghĩa, hệ thống của bạn sẽ không mở rộng. Vì vậy, trừ khi hệ thống trở nên tự nhiên để sử dụng nguồn gốc sẽ đánh dấu mọi thứ, nó không hoạt động. – Thilo

+5

Có rất nhiều thông tin ngoài kia đã có cấu trúc ngữ nghĩa, không ở dạng chuẩn. IMO "ngữ nghĩa" nội dung ngôn ngữ tự nhiên là một giấc mơ đường ống, nhưng nếu tất cả các cơ sở dữ liệu công cộng cung cấp một đại diện RDF, nó vẫn có thể cực kỳ hữu ích. –

3

Hỗ trợ ngữ nghĩa sâu là điều thú vị đối với một số địa điểm cần truy vấn mạnh mẽ. Một ví dụ là trong một project Tôi đã làm việc trên gần đây, nơi các dịch vụ được sử dụng để tìm kiếm nơi để gửi khối lượng công việc để được dựa trên ngữ nghĩa. Bản thân RDF/SPARQL rất thú vị vì nó cung cấp cho bạn truy vấn khá phong phú ngay từ dơi, nhưng khi bạn thêm một bản thể luận OWL vào nó thậm chí còn tốt hơn vì nó có nghĩa là bạn có thể trả lời các câu hỏi phong phú hơn. - và chủ nhân của họ - thực sự muốn) trong khi cho phép các nhà cung cấp dịch vụ thể hiện những gì họ đang cung cấp rõ ràng hơn. Mà không phải là để nói rằng nó có nghĩa là tất cả mọi người nói với mọi người tất cả mọi thứ, không phải ở tất cả. Thay vào đó, chúng tôi có các bên mô tả những dịch vụ nào được cung cấp và không phải là cấu hình mà họ đang sử dụng để cung cấp các dịch vụ đó. Và tất cả đều được trao quyền bởi việc sử dụng các công nghệ ngữ nghĩa lan tỏa khắp các hệ thống thông tin.

Hiện tại tôi đang làm việc trên Taverna hiện đang sử dụng RDF để cung cấp hệ thống ghi nhật ký được cải tiến; đặc biệt, người dùng (đặc biệt là các nhà khoa học) có thể tìm kiếm thông qua sự giàu có của thông tin được ghi lại dễ dàng hơn nhiều so với khi họ chỉ cần grep thông qua một tệp văn bản lớn. Sau khi tất cả, nó sẽ là một chút vô lý nếu bạn phải sử dụng khai thác văn bản để tìm hiểu những gì thực sự xảy ra trong công việc khai phá văn bản của bạn ...

15

Tôi nghĩ rằng Drupal 7 là cơ hội trở thành ứng dụng ngữ nghĩa sát thủ. phiên bản của CMS với cơ sở cài đặt khá lớn và khi bản phát hành kết thúc và mọi người bắt đầu nâng cấp đột nhiên tấn trang web sẽ tự động hiển thị RDF dưới dạng RDFa được nhúng mà không có bất kỳ sự can thiệp nào vào phần người dùng.

Từ một quan điểm kinh doanh Tôi nghĩ rằng điều linked data thứ như GoodRelations là một ứng dụng sát thủ tiềm năng, ví dụ xem những bài viết Scott BrinkerPriyank Mohan blog mà thảo luận về cách BestBuy đã trải qua một sự gia tăng 30% trong giao thông sau khi bắt đầu nhúng GoodRelations dựa linked data như RDFa trong trang web của họ.

Nói chung linked data là một cách tuyệt vời để tăng cường trang web của bạn với dữ liệu có thể đọc được trên máy và hiển thị kết quả đáng kể trong khả năng hiển thị trang web của bạn, gần đây tôi đã xem một vài bài thuyết trình của những người từ BBC có ứng dụng wildlife finder ứng dụng dữ liệu sử dụng tài nguyên lịch sử tự nhiên của BBC) đã hoạt động tốt hơn một số trang Wikipedia cho động vật trong kết quả tìm kiếm của Google

+0

GoodRelations thực sự có thể là ứng dụng sát thủ - nếu SEO thực sự được hỗ trợ bởi tính tương thích web ngữ nghĩa, nó sẽ mở ra một đội ngũ các nhà phát triển và người SEO để làm cho nó xảy ra, và tất nhiên Google đã bắt đầu với Tìm kiếm sản phẩm - http: // support .google.com/webmasters/bin/answer.py? hl = vi & answer = 146898 – RichVel

7

Trong sinh học, công nghệ liên quan đến RDF & rất cao. Mọi người muốn cả phân tích cú pháp và mã tùy chỉnh ít hơn để tích hợp dữ liệu và nhiều truy vấn nâng cao hơn. RDF đã cung cấp trước đây; ví dụ, UniProtKB, một trong những nguồn tài nguyên y sinh lớn nhất, đang cung cấp dữ liệu của họ trong RDF. Đối với truy vấn nâng cao, chúng tôi chưa hoàn toàn có, vì hiệu suất và tính sẵn sàng của dữ liệu RDF tốt và bản thể luận OWL vẫn còn thiếu một chút. Nhưng nó bắt đầu, hãy xem BioGateway để biết ví dụ về những gì có thể được thực hiện. Trong ánh sáng đó, các thành phần của các công nghệ này không phải là các ứng dụng sát thủ cá nhân, mà là tất cả các khoản tiết kiệm thời gian tích lũy cho các nhà nghiên cứu có thể khám phá dữ liệu thay vì viết các script đặc biệt và thiết lập cơ sở dữ liệu SQL tạm thời.

+0

Đúng vậy! Khoa học đời sống là nơi mà hầu hết công việc ngữ nghĩa dường như đang xảy ra. Trong bối cảnh này, tôi muốn hỏi bạn - nếu dữ liệu sinh học phù hợp hơn với bản thể học hơn là dữ liệu kinh doanh/giao dịch thông thường nằm trên hầu hết các cơ sở dữ liệu? – user304867

+1

Nói chung, có. Nó phức tạp hơn và liên quan đến nhau. Về mức độ cấu trúc dữ liệu, nó phù hợp với đồ thị của RDF tốt hơn nhiều so với các hàng của SQL. Ngoài ra, mọi người trên khắp thế giới làm việc với dữ liệu của nhau, do đó khả năng giải quyết toàn cầu bất kỳ tài nguyên nào với URI và thêm thông tin vào đồ thị hiện có là kẻ giết người. Trong các ứng dụng kinh doanh truyền thống, dữ liệu vẫn nằm trong nhà. –

+0

Seehttp: //biodiversity.org.au/name/Dodonaea%20viscosa.rdf – paulmurray

3

Tôi đã rất ấn tượng với AceWiki. Đây là một trong số nhiều dự án wiki đang cố gắng tổ chức các thông tin mà mọi người nhập vào.

Nó vẫn đang được tiến hành và có một số hạn chế. Ví dụ, nó chỉ cho phép mọi người nhập các câu phù hợp với một tập con của từ vựng và ngữ pháp tiếng Anh.

Tuy nhiên, tôi hy vọng những điều này diễn ra. Có rất nhiều dữ liệu miễn phí trên mạng (ví dụ: Wikipedia) và chúng tôi không thể tạo các chương trình để giải thích vì nó quá ồn ào.

7

Chỉ cần phát hiện DBpedia. Đó là một nỗ lực đầy hứa hẹn để đại diện cho rất nhiều dữ liệu từ Wikipedia như RDF. Bạn có thể tải xuống toàn bộ quá trình trích xuất dưới dạng tệp 16 GB nhưng cũng có một tệp là keyword search page. Việc được biểu diễn dưới dạng RDF cho phép truy vấn "ngữ nghĩa" rất cụ thể. This hiển thị một số truy vấn mẫu, chẳng hạn như cách bạn sẽ tìm thấy danh sách các trang web chính thức của các công ty có hơn 50000 nhân viên. Bạn thậm chí có thể truy vấn "đám mây" từ xa với bất kỳ trình bao bọc nào có thể giao tiếp với API công khai của nó, chẳng hạn như this Python module.

0

Protege là tốt cho việc phát triển bản thể luận.