企亿推信息网
专注网络推广服务

txt协议文件网站优化技巧

???上面提到了很多关于站点优化的相关内容,今天小边想分享的内容是文件优化。做网站优化的人应该知道Robots.txt嗯,我们可以直接与搜索引擎蜘蛛交谈,告诉蜘蛛哪些内容可以捕获,哪些内容不能捕获。这与我们今天要谈论的文件优化有关。

txt协议文件网站优化技巧

(图1)

????Robot.txt用法详解及robot.txt问题汇总???????(1)为什么设置?Robots.txt??????在进行SEO操作时,我们需要告诉搜索引擎哪些页面重要,哪些页面不重要。蜘蛛可以抓取重要的页面。屏蔽不重要的页面可以减轻网站服务器的负担。???????(2)一些常见的问题和知识点????当蜘蛛找到一个网站时,第一步是抓取网站Robots.txt文件(当然是官方说的,有时候不遵守);????建议设置所有网站Robots.txt如果你认为网站上的所有内容都很重要,你可以建立一个空的robots.txt文件;???????(3)在robots.txt在文件中设置网站地图????你可以在robots.txt向蜘蛛网站地图所在地址添加网站地图。???????(4)Robots.txt的顺序?????在蜘蛛协议中,Disallow与Allow这是一个非常重要的问题,如果设置错误,可能会导致抓取错误。?????引擎蜘蛛程序将成功匹配第一个Allow或Disallow确定是否访问某个URL,一个例子可以让你更清楚:????User-agent:*2.Allow:/seojc/bbs3.Disallow:/seojc/在这种情况下,蜘蛛/seojc/bbs但是/seojc不能抓取目录文件。蜘蛛可以通过这种方式访问特定目录的一部分url。?????让我们观察下调位置。?????User-agent:*2.Disallow:/文件夹/3.Allow:/seojc/bbs/seojc/如果目录出现在第一行,抓取目录下的所有文件,因此第二行Allow无效,因为禁止在第一行抓取seojc目录下的所有文件,bbs目录恰到好处seowhy目录下。所以匹配不成功。???????(5)Robots.txt路径问题?????在蜘蛛协议中,Allow和Disallow后面有两种路径形式,即绝对链接和相对链接。绝对链接是完整的URL形式,相对链接只针对根目录。这是重点记忆。??????(6)斜杠问题????Disallow:/seojc禁止抓取seoic本目录下的所有文件,如:seojc.1.html、seojc/rmjc.php不允许抓取;????Disallow:/seojc/表示禁止抓取seojc本目录下的文件允许捕获seojc.1.html,但不允许抓取seojc/rmjc.php。?????综上所述,以上是小编想和大家分析的站内优化文件优化。看完后你是否感到惊讶?我不知道有这么多秘密。其实站内优化的知识远不止这些,下次有机会和大家分享一些其他的。好了,今天就和大家分享一下。?

未经允许不得转载:启新网站SEO优化 » txt协议文件网站优化技巧
分享到: 更多 (0)
加载中~