Tôi đang cố gắng bắt đầu với Apache Solr, nhưng một số điều không rõ ràng với tôi. Đọc qua tutorial, tôi đã thiết lập một cá thể Solr đang chạy. Những gì tôi thấy khó hiểu là tất cả các cấu hình của Solr (lược đồ và vv) có định dạng XML. Khi họ thêm dữ liệu mẫu, nó cho thấy cách thêm tài liệu xml (java -jar post.jar solr.xml monitor.xml
). Nó chỉ là một lựa chọn xấu của định dạng mẫu? Ý tôi là, họ đang tải lên dữ liệu mô tả tài liệu hay các tài liệu thực tế họ đang thêm là tệp .xml?Bắt đầu với Solr
Tôi đang cố gắng thêm một số sách ở định dạng .txt, vì vậy nếu tôi sử dụng java -jar post.jar mydoc.txt
, tôi có thêm nó không? Làm cách nào để thêm tài liệu này và siêu dữ liệu (tác giả, tiêu đề) về nó?
Điều đó nói rằng, tôi đã cố gắng để thiết lập một trang Html đơn giản để đăng tài liệu lên Solr:
<html>
<head></head>
<body>
<form action="http://localhost:8983/solr/update?commit=true" enctype="multipart/form-data" method="post">
<input type="file">
<input type="submit" value="Send">
</form>
</body>
</html>
Khi tôi cố gắng gửi một tập tin, tôi nhận được câu trả lời này:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">26</int>
</lst>
</response>
Is Điều này đúng? Có nghĩa là tôi đã thêm thành công tệp của mình không? Nếu vậy, một trong những từ trong tập tin, ví dụ là "montagna" (đây là một cuốn sách ý, montagna có nghĩa là núi ...). Nếu tôi truy cập vào url
http://localhost:8983/solr/select/?q=montagna&start=0&rows=10&indent=on
tôi mong đợi một cái gì đó để được trả lại (toàn bộ văn bản có thể, hoặc một số thông tin về các tập tin), nhưng đây là những gì tôi nhận được:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">1</int>
<lst name="params">
<str name="indent">on</str>
<str name="start">0</str>
<str name="q">montagna</str>
<str name="rows">10</str>
</lst>
</lst>
<result name="response" numFound="0" start="0"/>
</response>
Không có vẻ giống như một trận đấu với tôi. Ngoài ra, theo số to this answer, tôi có thể lấy lại văn bản xung quanh các kết quả phù hợp với hl.fragsize
. Làm cách nào để tích hợp điều này trong chuỗi tìm kiếm? Cảm ơn bạn