请选择 进入手机版 | 继续访问电脑版
设为首页收藏本站客户端下载

老榕树社区

 找回密码
 立即注册
社区推荐
 
任务统计:
发布数/完成数/奖励数:
0/0/0
承接数/奖励数/收入数:
0/0/0

3495

主题

4230

帖子

2997

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2997
扫一扫,手机访问本帖
发表于 2016-12-10 11:46:58 | 显示全部楼层 |阅读模式
【如内容违法或虚假,请联系上述邮件删除】   
  我是一个纯采集站长,下面的这些总结,有些是关于关于SEO,有些是关于采集和运维,都是很基础的个人见解,仅作分享,请自辨好坏是非,理论出真知。

  原创好还是采集好?
  当然是原创好,由于百度是这么说的,谁叫人家是裁判。
  为什么我原创了很多文章,还是不收录?收录了没排名?
  一个搜索引擎,它的中心价值是要为用户提供他/她最需求的结果。搜索引擎是有统计网民需求的,关于网民需求量小或者简直没有需求的内容,即便你是原创也可能被搜索引擎疏忽,由于它不想糜费资源在无意义的内容上。
  对网民需求量大的内容,收录应该会比较多、比较快,但是,正由于收录多,即便你是原创,也可能很难挤进排名。
  搜索引擎统计网民需求以什么来标识?
  关键词。每一个人搜索一个关键词时,就标明他/她对这个词相关的内容有需求。而且,运用搜索引擎的人,通常是有问答需求、检索查询需求。当然搜索引擎内部肯定有十分庞大的剖析系统,对这些需求中止精确的定位,详见百度指数。比如搜索的关键词是"手机",很有可能是想要买手机或者查某款的价钱,也可能只是想要下载漂亮的壁纸。但是,假如是想要壁纸,就会有更精确的关键词"手机壁纸",以下拉框或者相关搜索的方式呈现出来。
  既然原创好,为什么要采集?
  1. 固然原创好,但只需办法恰当,采集的效果并不会比原创差多少,以至比没控制到办法的那些原创好很多。
  2. 肉体有限,原创很难保证长期大量更新,假如请个编辑,投入产出比可能是负数。
  市面上采集器那么多,应该用哪个好?
  每个采集器都有它的共同之处,所谓存在即合理。请依据自己的需求来选择即可。我的采集器是自己开发的,开发的过程中思索了以下几方面,运用其他采集器的也可作参考:
  1. 直接提供已分类的海量关键词,这些关键词都是百度曾经统计的有网民需求的词(有百度指数),或者是这些词的长尾词,来自百度下拉框或相关搜索。
  2. 直接按关键词采集,智能剖析网页正文中止抓取,不需求自己写采集规则。
  3. 抓取到的正文经过规范的标签清算,段落全部以
  标签呈现,乱码一概去除。
  4. 依据采集到的内容自动配图,图片一定是与该内容相关度十分高的。以这种方式替代伪原创,既不影响可读性,又使文章图文并茂,做到比原创所提供的信息更丰厚。
  5. 正文内容中的关键词自动加粗,也可自定义要插入的关键词。但没有做句子重排、段落重排等影响可读性的所谓"伪原创"功用。
  6. 可直接运用关键词和其相关词组协作为标题,也可抓取目的网页标题。
  7. 可中止微信文章采集。
  8. 不用触发或者挂机。
  9. 集成百度站长平台主动推送,加快收录。
  不同的网站程序,比如织梦、WordPress、dz、zblog、帝国cms或者其他,对SEO有什么影响?
  理论上没有影响。由于搜索引擎并不知道你是什么程序,或者它能够经过一些规则辨认出来,也不可能由于程序自身的不同而影响它的判别。
  那什么会影响SEO呢?答案是模板。由于基本上这些程序都有模板机制,同样程序能够输出不同的页面,不同的程序也能够输出同样的页面,这就是模板。模板肯定之后,你的每一个页面就依照这个框架来输出,也就是整个html结构曾经肯定。而这些html,正是搜索引擎要重点关注的,它得从这些html中得到它想要的信息。因而,一套好的模板十分重要。
  模板设计应该留意哪些细节?
  1. 权重结构次第。整个页面的html中(留意是html,而不是显现出来的版面),越靠前的位置,权重越高。由此引申出来,"title"、keyword、description三个标签,由于最靠前,权重最高。其次通常是导航,也是基本上是最靠上的,权重也十分高。再次就是文章标题和正文。这是依据html的前后来排序的。
  2. 由于搜索引擎首先要遵照W3C规范,所以,W3C定义的一些原本就是用来表示重要信息的标签,权重自然就高,比如,特别是h1,用来表示当前页面最重要的信息,普通每个页面只能有一个,其权重估量与title相当,也通常是用来放当前页面的标题,当然也有为了进步首页权重,用h1来放置logo或首页链接,都是能够的。另外还有em、strong这样的标签,用来表示强调,普通以为strong权重高于标签,同样也是加粗作用,但我们以为从SEO的角度看是没有权重增强的。
  3. css或者js代码对搜索引擎来说通常是无意义的,尽量运用单独的文件来寄存,或者在允许的状况下放到html尾部去
  网站结构规划应该留意哪些问题?
  1. URL设计。URL也是能够包含关键词的,比如你的网站是关于电脑的,你的URL中能够包含"PC",由于它在搜索引擎眼里通常是"电脑"的同义词。URL不要太长,层次尽量不要超越4层,这个就点到为止。
  2. 栏目设计。栏目通常是与导航相关联的,设计时应该思索网站整体的主题,用户可能会对哪些内容感兴味,栏目称号最好是网站的几个主关键词,这样也便当应用导航的权重。
  3. 关键词规划。理论上每一个内容页都应该有它的中心关键词,同一个栏目下的文章,尽可能盘绕栏目关键词展开。一个简单粗暴的办法就是直接用栏目关键词的长尾词。
  动态、伪静态、静态,这三者哪个好?
  这个不能混为一谈,引荐运用伪静态或静态。这三者的区别,是能否生成静态文件,以及URL格式能否动态。生成静态文件,实质上是为了加快访问速度,减少数据库查询,但会不时增加占用空间;伪静态只是经过URL重写修正URL,实践上还是每次都要经过程序运算、查询数据库再输出页面,对加快访问速度完整无效。动态与伪静态的差别只在于URL,带问号加参数。
  所以关注两个点就好:网站翻开速度能否够快?你能否需求节约效劳器空间?
  不同的网站程序,数据库操作的效率可能不同。普通来讲,内容页数量在1万以内的,页面翻开速度都是比较快的,数据量更大一些,抵达5万、十万以至更多,通常就要思索静态化了。
  有哪些途径改善访问速度?
  1. 上面曾经说到的静态化。
  2. 通常很多网站模板中都有随机调用文章或者相似的版块,事实上对数据库来说,随机是一项比较重的担负,在模板中应该尽量减少随机文章的调用。假如不可避免,能够思索从数据库上优化,对有索引的字段排序通常比没有索引要快很多。
  3. 将图片、js、css等不经常修正的文件,放到专用的静态效劳器上,多个js、或者多个css能兼并的尽量兼并到一个文件,减少http衔接次数。
  4. 运用各类云加速产品。对普通网站来说,免费的百度云加速或者360的云加速都还能够。
  文章比较多,网站曾经开启静态,但是每次全站更新都要花很长时间怎样办?
  我的做法是运用缓存机制,这里只提供一个思绪,可能需求自己二次开发。
  网站设定为伪静态,每一个央求抵达时,程序检查能否存在对应的缓存html文件,假如该文件的生成时间是多少小时或几天以前,我们判定它需求更新,这时分执行正常流程,程序查询数据库,生成html后,写入到缓存文件,再输出到客户端。
  当下一次访问抵达时,比如1分钟以后又来一个访问相同页面,再次检查缓存文件时间。从时间上能够判别文件十分新,完整不用更新,则直接读取文件内容输出到客户端。这样每个页面都能够完成自动生成,也只需第一个访客会感遭到速度慢,后面的访客访问时都相当于是静态访问,速度是十分快的。
  假如是独立效劳器,还能够思索自动检测效劳器负载,假如负载原本就高,那就算判别出来需求更新,也暂时不更新,改为直接输出。
  图片是援用远程网址好还是放在自己效劳器好?
  这个也是各有优劣。援用远程网址,能够节约自己的带宽,但很可能会由于对方效劳器迟缓、或删除资源、或防盗链,图片无法显现。假如下载到自己效劳器,当然一切都自己掌控,但是图片会十分占用空间,总体上可能比生成静态所占的空间更大,而且假如访问量大,图片是最吃带宽的。
  网站内链应该怎样优化?
  内链是百度官方引荐的优化伎俩之一,所以这是一定要做的。通常表现的方式是正文中呈现某个关键词,给这个关键词加上一个链接,指向另一个正好是这个关键词相关内容的页面。因而就降生了一些所谓的优化手法,强行在正文中插入一些关键词和链接,以此中止相似互推的操作。还有的为了进步首页权重,四处都放上网站称号,并做上首页链接,以为这样能够进步目的页面的权重。但是这些很可能都是适得其反,由于搜索引擎会统计每个链接的点击率。假如放在醒目位置点击却很少的链接,有可能会判别为作弊。所以,请只在正文中原本就有的关键词上做内链,就能够了。
  段落重排、句子重排、同义词交流这些伪原创手法到底好不好?
  不好。由于搜索引擎曾经智能,曾经不是简单的数据库检索,它会自然语义剖析(详情请搜索"NLP"),凡是语义解析比较艰难的句子或者段落,它是能够判别为可读性差的,所以我以为这些"伪原创"可能是自作聪明。
  评论模块基本上没有人用,该要还是不要?
  要。评论模块最头疼是事情是渣滓评论,通常真正发言的访客很少,渣滓评论一大堆,整天和营销软件斗智斗勇。这里提供一个我曾经完成的计划,对收录可能有一定辅佐(没有依据的,只是猜测):
  保管评论框、但遏止评论。一切评论由自己的网站程序生成。前面提到搜索引擎会自然语义剖析,其中有一项重要的才干,就是情感判别。搜索引擎会计算每条评论的情感值,是positive(积极)还是negative(消极),细致倾向是10%还是90%。假如评论内容表达的是积极情感,则能够给你的正文加分,反之则减分。至于怎样自动生成积极的评论,就八仙过海各显神通吧。
  这是在网络社交展开起来后的必然趋向,用这种方式来反映一个页面的用户体验度。同理还有分享、点赞等,原理相似。
  绿萝卜算法之后,外链到底还有没有用?
  有用。参见搜索引擎三定律之相关性定律。既然是定律,就不会改动。谁的内容被援用得多,谁就是权威。在主动推送呈现之前,外链应该算是蜘蛛认识一个页面内容的第一渠道。
  外链一定要锚文本或者裸链吗?
  不是。搜索引擎肩负重担,要努力发现真正有价值的东西,扫除那些没价值的东西。所以有可能你直接提交的链接没收录,在他人中央随意发个纯文本网址,被它发现了,还计算了加分。
  除了锚文本和裸链,还能够用关键词+网址的方式发纯文本。这样在网址前面的那个关键词是会自动与该网址关联的。
  还有,有些链接固然加了nofollow属性,但是在百度计算外链的时分,还是会计算的。
  收录和索引到底什么关系?
  收录表示蜘蛛来抓取过、剖析过。索引表示蜘蛛剖析之后,以为内容有一定价值。只需进入索引的内容才有可能出往常搜索结果中,展示给用户。也就是说只需索引的内容才有机遇带来流量。

                                                    
(关注老榕树网络旗下“网络思维”微信公众号:wlsw360 (每天都有好文章)

 

                                                   本帖如有虚假或违法,请联系邮箱删除,本社区删贴不收任何费用,欢迎举报。老榕树社区属老榕树网络旗下网站,旨在为老榕树用户提供创业咨询、网站建设技术交流、源码下载、提供各种实用工具。如有部分帖子涉及违法、虚假,请你第一时间与社区联系,把需要删除的社区链接提供给我们,我们核实之后,第一时间删除。邮箱:125175998@qq.com

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  • 关于我们| 企业文化| 备案编号:滇ICP备13002355号
  • Copyright 2013 最新最精彩-社区论坛 版权所有 All Rights Reserved
快速回复 返回顶部 返回列表