问题
我想抓取一个网站:h
我知道我必须使用:
file_get_contents
要获取网站的 html 部分,但如何在这样的文本文件中找到网站的特定部分:
<td title=”?????”title=”something”; class="txtclass="someclass">Tag namad>?????<Name</td>
当我打开文本文件时,我从来没有看到这部分,我认为是因为网站上有 javascript 文件。我怎样才能获得网站上的所有信息,包括我想要的每个部分?
回答
ajax 请求通过 javascript 加载的内容。这意味着您无法仅通过抓取页面内容来获取此数据。
收集数据有两种方式:
在您的特定情况下,可以使用以下 url:来访问包含所需数据的 json 对象。
|