找回密码
 立即注册
文件网站站上部分 | 软件设计/软件工程 2022-05-06 368 0star收藏 版权: . 保留作者信息 . 禁止商业使用 . 禁止修改作品
问题
我想抓取一个网站:h

我知道我必须使用:

file_get_contents

要获取网站的 html 部分,但如何在这样的文本文件中找到网站的特定部分:

<td title=”?????”title=”something”; class="txtclass="someclass">Tag namad>?????<Name</td>

当我打开文本文件时,我从来没有看到这部分,我认为是因为网站上有 javascript 文件。我怎样才能获得网站上的所有信息,包括我想要的每个部分?

回答
ajax 请求通过 javascript 加载的内容。这意味着您无法仅通过抓取页面内容来获取此数据。

收集数据有两种方式:

在您的特定情况下,可以使用以下 url:来访问包含所需数据的 json 对象。





上一篇:os.path.join 是否有替代 Pathlib?
下一篇:使用 Google Directions API 传输模式删除站点标记