如何批量采集网页?
功能介绍
- “智能网页采集”能够记录用户当前操作所有有产生变化的网页地址;
- “智能网页采集”在记录采集过程中会自动剔除紫鸟域名下的所有地址,避免产生无用地址;
- “智能网页采集”能够自动获取网页的title和地址,网页title可用于网页名称的自动命名;
- “智能网页采集”提供精简面板和完整面板以供用户查看及快速操作;
使用流程
1.开始智能网页采集
- 入口一:管理系统-管理-成员访问控制-新增策略中的“添加新网页”
- 入口二:管理系统-管理-成员访问控制-编辑策略中的“添加新网页”
- 入口三:管理系统-管理-成员访问控制-网页资源管理的“添加新网页”
- 入口四:账号环境下-从“网页元素采集”模式切换为“智能网页采集”模式
先打开“网页元素采集”面板
在面板上点击切换为“智能网页采集”
2.采集网页
- 点击[开始采集]
- 只需正常操作网页,点击需要限制或者访问的网页,系统会自动记录;
采集时可以快速重命名网页,若是系统预设的网页,无法重命名;
- 当前网页的快捷选择,在采集过程中快速选中相关网页作为最后需要配置的网页
4.策略编辑
- 停止采集后即可[配置策略],在小面板和完整面板上都可以操作
常见问题
Q1:新增的“智能网页采集”模式在V5上不显示?
仅在V6上更新此功能,V5不支持。
Q2:智能网页采集面板上有时候是“配置策略”操作,有时候又是“保存至网页资源管理”操作
从不同的入口进入显示的操作不同,尽量符合用户操作的场景。
访问策略入口进入是“配置策略”,其他入口均是“保存至网页资源管理”
Q3:在智能网页采集中停止采集依然无法点击“配置策略”或者“保存至网页资源管理”?
停止采集状态,但没有选择网页的情况也“配置策略”和“保存至网页资源管理”均不可点击,悬浮在按钮上方也会给到提示。


Q4:原来的采集和新的采集是否有冲突?
不冲突,独立操作,采集数据也能独立存储