水淼关键词网址采集器是一个网络辅助工具,可以让你设置相应的搜索引擎,选择自己适合的模板,然后完成各种去除结果设置,就可以开始收集了。可以输入关键词,然后根据自己的需求进行搜索。模板包含标题、URL等。您还可以自动删除重复的结果,提高收集的准确性。
软件功能
收集网页信息,相关如下:
# URL #:收集的原始URL
# Title #:URL对应的网页的标题
#域名#:原始URL的域名部分,如“//test.shuimiao.net/123.htm”中的“test.shuimiao.net”
# TLD #:取原网址的TLD部分,如“//test.shuimiao.net/123.htm”中的“shuimiao.net”
# Description #:网页标题下面的一段描述性文字。
常见问题
为什么过了一段时间就收不回来了?
此收藏可能受到搜索引擎的限制,因此请重新启动软件以继续收藏。如果不改,那就只能等搜索引擎去屏蔽了,才能继续收藏。百度屏蔽时间一般是半个小时到几个小时。
而现在,即使验证码被屏蔽,软件也会弹出,手动输入验证码(百度,谷歌)。
为什么有些URL在不同批次的关键词采集结果中是重复的?
尤其是只引用#域名#或#顶级域名#后,这种部分URL重复的情况很多。这也很正常,因为每个网站的内页可能包含很多话题,不同的网站内页可能会收集到不同的关键词。域名被引用,同一网站不同内页的域名结果自然会一样。
另外,软件中的自动重复数据删除是针对采集结果的内部重复数据删除,之前采集的结果不在本次重复数据删除的范围内。如果在两个收集的结果中有一些重复的URL,您可以将它们合并,并使用软件来删除重复的URL(水淼文本去重复加扰器)。
为什么采集的网址主题和关键词不一致?
因为#域名#或者#顶级域名#被引用,取域名,域名打开网站首页,而原来采集的URL可能不是首页,而是网站上一篇文章的内页,里面包含关键词主题,所以可以被搜索引擎采集。但是取了域名之后,你打开的域名首页不一定包含该关键词。
为了比较收藏是否正确,可以在保存模板中输入# title #,保存为htm文件。收集完成后,您可以自己打开文件查看比较结果。
更新内容
1.转型支持OEM代理。
2.增加必应和雅虎收藏;多重变化
3.将Bing、Yahoo、Google改为https请求,避免某些情况下收集失败。
4.增加百度新闻采集。
5.一些更新。
6.添加关键字分割线选项。
7.修复百度最新变化无法收集的问题。
8.修复Bing改收藏失败;修复部分电脑无法使用xmlhttps的问题(涉及Google、Bing、Yahoo)。