Bất cứ ai có giải pháp tốt để tìm nguồn HTML của trang có nội dung (trong trường hợp này là các bảng HTML) được tạo bằng Javascript?Bất cứ ai có giải pháp tốt để tìm nguồn HTML của một trang có nội dung (trong trường hợp này là các bảng HTML) được tạo bằng Javascript?
Một xấu hổ đơn giản, mặc dù giải pháp khả thi sử dụng Crowbar:
<?php
function get_html($url) // $url must be urlencode(d)
{
$context = stream_context_create(array(
'http' => array('timeout' => 120) // HTTP timeout in seconds
));
$html = substr(file_get_contents('http://127.0.0.1:10000/?url=' . $url . '&delay=3000&view=browser', 0, $context), 730, -32); // substr removes HTML from the Crowbar web service, returning only the $url HTML
return $html;
}
?>
Ưu điểm khi sử dụng Crowbar là các bảng sẽ được trả lại (và dễ tiếp cận) nhờ vào trình duyệt không đầu mozilla-based. Edit: phát hiện ra rằng vấn đề với Crowbar là một ứng dụng xung đột, không phải là thời gian chết máy chủ, mà chỉ là một sự trùng hợp ngẫu nhiên.