Cạo dữ liệu từ một bảng có nhiều mảnh vụn. Html bảng cũng giống như:Cắt bỏ dữ liệu từ một bảng có giấy vụn
<table class="tablehd">
<tr class="colhead">
<td width="170">MON, NOV 11</td>
<td width="80">Item</td>
<td width="60" align="center"></td>
<td width="210">Item</td>
<td width="220">Item</td>
</tr>
<tr class="oddrow">
<td> Item </a></td>
<td> Item </td>
<td align="center"> Item </td>
<td></td>
<td> Item </td>
</tr>
<tr class="evenrow">
<td> Item </a></td>
<td> Item </td>
<td align="center"> Item </td>
<td></td>
<td> Item </td>
</tr>
</table>
Toàn bộ danh sách là avialable bởi
items = hxs.select('//table[@class="tablehd"]//td//text()').extract()
Làm thế nào bạn sẽ chia cho từng mục và sau đó gán dữ liệu TD1 - td5ta
làm thế nào bạn sẽ tiếp cận nhiều hàng và colums – bobsr
Điều đó phụ thuộc. Xin vui lòng, cho thấy những gì bạn muốn xem trong đầu ra (mục) đầu tiên. – alecxe
nó hoạt động .. cảm ơn .. cố gắng trích xuất từng mục bây giờ .. có một hàng – bobsr