关键字:管理系统、CRM、邮件服务器、软件开发、系统备份 摘要描述:蜘蛛程序陷阱(Spider traps)是阻止蜘蛛程序爬行网站的障碍物,不在网站使用这些技术,就可以使蜘蛛程序收录更多的网页。 蜘蛛程序陷阱(Spider traps)是阻止蜘蛛程序爬行网站的障碍物,通常源于那些显示网页的技术方法,这些手段能很好地配合浏览器,但对蜘蛛诚信就构成了阻碍。不在网站使用这些技术,就可以使蜘蛛程序收录更多的网页。那么,怎样除掉***流行的蜘蛛程序陷阱? 1. 小心设置 *域名隐藏* 指示(robots directives) (1)它是控制蜘蛛程序的一个方法,它告诉蜘蛛程序在服务器上什么文件是可以被查看的。必须放置在一个站点的根目录下,而且文件名必须全部小写。它只有2个操作声明 ?Useragent(用户代理)。用户代理声明定义了禁止指令适用于哪个蜘蛛程序。如果对用户代理编码了一个星号,指的是针对所有的蜘蛛程序。 ?Disallow(禁止)。禁止声明***那个文件蜘蛛程序不能够查看。可以***一个***的文件名或者任何文件名或者目录的一部分——蜘蛛程序会认为那是一个匹配符号并禁止与那部分名字匹配 的名字。例如:***了“e”可能会禁止全部有“e”的文件被查看,同样,所有文件和任何有“e”为开头的目录。***了“/”,就禁止查看所有的文件。 网站管理员必须使蜘蛛程序远离某些服务器上的目录——***服务器性能。大多数网站服务器都有程序储存在“cgi-bin”目录下,因此在 *域名隐藏* 文件中加入“Disallow: /cgi-bin”是个好主意,这样能够避免将所有程序文件发送给蜘蛛程序,可以节省服务器资源。 ( 2) robots标签<meta name=’robots’> 如果 *域名隐藏* 限制了那个网页,那么robots标签说什么都不重要了,因为蜘蛛程序根本不会看那个网页。 2. 削除弹出窗口 如果站点使用弹出窗口来展示相关内容,那些内容不会被蜘蛛程序收录。如果站点使用弹出窗口来显示链接到其他页面的菜单,蜘蛛程序不能沿着这些链接爬行,蜘蛛程序也找不到这些网页。要想使这些页面被收录,方法就是停止使用弹出窗口,或者创建一个带正常链接的标准页面。 3. 不要下拉导航 蜘蛛程序对javascript 编写的下拉导航会面临和弹出窗口一样的问题:他们不能模拟点击上面的链接(沿着链接爬行)。解决方法是重新以正常的HTML重写这些链接,或者提供替代的通道使得蜘蛛程序能够访问这些页面。 4. 简化动态网址(Dynamic URLs) 在动态页面出现的早期,蜘蛛程序是拒绝爬行这些动态页面的。但随着时间的推移,越来越多的网页变成了动态网页。搜索引擎也开始调整自己。搜索蜘蛛现在可以在一定条件下收录动态页面: (1) URL含有不超过两个动态参数 (2)从目录列表或者站点地图链接过来的所有有效URL 电话:0755-28726491 4006-230-260(免长话费 传真:0755-84153080 手机:13923762823 网址www(dot)cffy88(dot)com 邮箱:visar@cffy88(dot)com QQ:8862071,861725263 公司地址:深圳市龙岗区布吉大芬茂业城帝景峰3-33C
|