网络信息采集专家可以将因特网上的信息按规则采集保存到数据库中。并具备以下功能:
多任务,多线程 - 可以同时进行多个采集任务,每个任务可以使用多个线程。
网站登录 - 支持网站登录,并支持网站Cookie,即使需要验证吗才能登录的网站也能轻松穿过。
信息自动识别 - 提供诸如Email地址、电话号码、数字等多种预先定义好的信息类型,用户经过简单的选取即可从浩瀚的网络信息中提取特定的信息。
网页正文提取 - 可以将正文从网页htm代码中提取出来并进行适当的格式转换。
采集结果分类 - 可以根据用户定义的分类信息进行采集结果的自动分类。
预留编程接口 - 定义多个事件,用户可以利用脚本语言进行编程,扩充采集功能。
过滤重复内容 - 软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。
采集深度 - 可以将任务的采集范围限制在某个深度。