WebScraper使用Integrity v8引擎快速扫描网站,并可以将提取的数据(当前)输出为CSV或JSON。另外,还可以将图像下载到文件夹中。
很容易扫描一个网站-只要输入开始的网址,然后按“去”
易于导出-选择所需的列
大量的提取选项,包括具有特定类或id的HTML元素、正则表达式或多种格式的完整内容(HTML、纯文本、标记)
因为v4.1可以将发现的所有图像下载到一个文件夹中
对爬网和输出文件大小的各种限制的配置
更多…
新功能:
版本4.11.0:
在简单设置和复杂设置中添加用于删除电子邮件地址的选项。
在首选项中添加字段,用于编辑在删除电子邮件地址时使用的正则表达式。
请注意,网页可能会混淆电子邮件地址以防止刮擦。即使电子邮件地址通常出现在页面上,也可能不会出现在页面的源中。