设为首页收藏本站客户端下载

老榕树社区

 找回密码
 立即注册
社区推荐
 
任务统计:
发布数/完成数/奖励数:
0/0/0
承接数/奖励数/收入数:
0/0/0

9万

主题

9万

帖子

28万

积分

论坛元老

Rank: 8Rank: 8

积分
287813
扫一扫,手机访问本帖
跳转到指定楼层
楼主
发表于 2014-9-11 10:38:10 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【如内容违法或虚假,请联系上述邮件删除】 马上注册,一同讨论正确快速的建站办法 您需求 登录 才能够下载或查看,没有帐号?快速注册 x GSA测试:链接和文本排序对比 经常会看到,好多网站面包屑上的位置标题会被加上链接,像下面这种: 京东的面包屑 同样也有下面这种位置标题没有链接的面包屑,如下图: 中关村面包屑 大约猜测了一下,这在搜索引擎计算中会有一定的影响。 从搜索引擎原理的角度看,页面上的文本和链接是分开处置的。正文提取的时分,是将页面上的文本信息单独提取处置,而把页面上的链接等等会被提取到另一个表中去。TF(词频)计算的时分,是依托页面上的文本中止计算。猜测,页面上的链接锚文本会被过滤掉,不参与TF的计算。 下面用GSA做的一些测试来考证猜测: 做了两个页面,内容完整一样,页面上有三个用于测试的词【国平 刚子 66699303】,词中间用空格隔开。 gnbase-nolink.html是纯写出来的,gnbase-link.html是用三个链接将词指向自己(自链)。 纯文本 and 带链接 测试结果如下: 分别搜索:国平、刚子、66699303 排名在前面的都是不带链接的页面gnbase-nolink.html。 从上图看,不带链接的文本在摘要的时分,将中间的空格去除掉了,把三个词衔接在一同。 但是link页面的自链效果没有表现出来,或者说是自己指向自己的锚文本没有直接呈现文本效果好。 PS:测试的时分疏忽掉了,link这个页面是14号曾经抓取并收录过的,nolink是15号新加上去的,开端测试link显现的日期为2012-05-14,后来发现后改了一下页面,GSA自动重新抓取了一次,link页面的日期才同步到15号。在搜索三个测试词的时分,link固然抓取早,但是排名却没有后抓取的纯文本页面高。不过在搜索页面标题的时分,还是先抓取的link页面排名高。 由此可见,页面文本会直接参与页面的TF计算,链接锚文本被扫除在外。 附录一些搜索数据: 百度关键字 | 网站 | 排名 华为时间管理法 | 360buy | 1 华为时间管理法 杨玉柱 | kongfz | 1 华为时间管理法 杨玉柱 | 360buy | 4 再生勇士9 | 360buy | 1 再生勇士9 施鸥 | kongfz| 3 再生勇士9 施鸥 | 360buy | 4 。。。。 呈现这么一个状况就是,360buy很多书名排名很好,但是加上作者名之后,排名就很不理想,以至翻页都找不到。点击看了页面,书名普通都是文本方式呈现,而作者呈现的时分用链接指向了作者的页面。 假如分离TF*IDF的一些因历来看的话,书名与检索词之间取得了不错的相关性,而作者由于没有参与到页面TF的计算,没有取得相应的得分。当只搜索【书名】的时分,书名的TF*IDF相关度够了,排名前面;但搜索【书名 作者】时,TF*IDF(书名) TF*IDF(作者)的值没抵达排名前列的请求。 文章来源:光年论坛 seo论坛http://www.wocaoseo.com/(关注老榕树网络旗下“网络思维”微信公众号:wlsw360 (每天都有好文章)

 

                                                   本帖如有虚假或违法,请联系邮箱删除,本社区删贴不收任何费用,欢迎举报。老榕树社区属老榕树网络旗下网站,旨在为老榕树用户提供创业咨询、网站建设技术交流、源码下载、提供各种实用工具。如有部分帖子涉及违法、虚假,请你第一时间与社区联系,把需要删除的社区链接提供给我们,我们核实之后,第一时间删除。邮箱:125175998@qq.com

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  • 关于我们| 企业文化| 备案编号:滇ICP备13002355号
  • Copyright 2013 最新最精彩-社区论坛 版权所有 All Rights Reserved
快速回复 返回顶部 返回列表