【如内容违法或虚假,请联系上述邮件删除】 马上注册,一同讨论正确快速的建站办法
您需求 登录 才能够下载或查看,没有帐号?快速注册
x
GSA测试:链接和文本排序对比
经常会看到,好多网站面包屑上的位置标题会被加上链接,像下面这种:
京东的面包屑
同样也有下面这种位置标题没有链接的面包屑,如下图:
中关村面包屑
大约猜测了一下,这在搜索引擎计算中会有一定的影响。
从搜索引擎原理的角度看,页面上的文本和链接是分开处置的。正文提取的时分,是将页面上的文本信息单独提取处置,而把页面上的链接等等会被提取到另一个表中去。TF(词频)计算的时分,是依托页面上的文本中止计算。猜测,页面上的链接锚文本会被过滤掉,不参与TF的计算。
下面用GSA做的一些测试来考证猜测:
做了两个页面,内容完整一样,页面上有三个用于测试的词【国平 刚子 66699303】,词中间用空格隔开。
gnbase-nolink.html是纯写出来的,gnbase-link.html是用三个链接将词指向自己(自链)。
纯文本 and 带链接
测试结果如下:
分别搜索:国平、刚子、66699303 排名在前面的都是不带链接的页面gnbase-nolink.html。
从上图看,不带链接的文本在摘要的时分,将中间的空格去除掉了,把三个词衔接在一同。
但是link页面的自链效果没有表现出来,或者说是自己指向自己的锚文本没有直接呈现文本效果好。
PS:测试的时分疏忽掉了,link这个页面是14号曾经抓取并收录过的,nolink是15号新加上去的,开端测试link显现的日期为2012-05-14,后来发现后改了一下页面,GSA自动重新抓取了一次,link页面的日期才同步到15号。在搜索三个测试词的时分,link固然抓取早,但是排名却没有后抓取的纯文本页面高。不过在搜索页面标题的时分,还是先抓取的link页面排名高。
由此可见,页面文本会直接参与页面的TF计算,链接锚文本被扫除在外。
附录一些搜索数据:
百度关键字 | 网站 | 排名
华为时间管理法 | 360buy | 1
华为时间管理法 杨玉柱 | kongfz | 1
华为时间管理法 杨玉柱 | 360buy | 4
再生勇士9 | 360buy | 1
再生勇士9 施鸥 | kongfz| 3
再生勇士9 施鸥 | 360buy | 4
。。。。
呈现这么一个状况就是,360buy很多书名排名很好,但是加上作者名之后,排名就很不理想,以至翻页都找不到。点击看了页面,书名普通都是文本方式呈现,而作者呈现的时分用链接指向了作者的页面。
假如分离TF*IDF的一些因历来看的话,书名与检索词之间取得了不错的相关性,而作者由于没有参与到页面TF的计算,没有取得相应的得分。当只搜索【书名】的时分,书名的TF*IDF相关度够了,排名前面;但搜索【书名 作者】时,TF*IDF(书名) TF*IDF(作者)的值没抵达排名前列的请求。
文章来源:光年论坛 seo论坛http://www.wocaoseo.com/(关注老榕树网络旗下“网络思维”微信公众号:wlsw360 (每天都有好文章)
本帖如有虚假或违法,请联系邮箱删除,本社区删贴不收任何费用,欢迎举报。老榕树社区属老榕树网络旗下网站,旨在为老榕树用户提供创业咨询、网站建设技术交流、源码下载、提供各种实用工具。如有部分帖子涉及违法、虚假,请你第一时间与社区联系,把需要删除的社区链接提供给我们,我们核实之后,第一时间删除。邮箱:125175998@qq.com |