每天拿出一分钟来学习,你的生命会更加精彩。
  • 首页
  • 洪雨seo
  • 洪雨seo再聊百度文章收录和排名的关键问题

洪雨seo再聊百度文章收录和排名的关键问题

发布:洪雨2019-12-27 8:19分类: 洪雨seo 标签: 洪雨seo 黑帽seo

    破解了百度文章收录的算法,收录和排名就变成小菜一碟,其中以指纹算法为首。

    之前洪雨针对百度文章收录的指纹算法已经写过文章了《洪雨seo浅谈百度指纹算法和破解策略》http://www.zhizhuowz.com/post-145.html,想了解的可以先看一下。

    对于指纹算法,百度自身是没有详细说明的,作为一名seoer对于原理算法只能是猜测。

    其实做seo时间长了,而且对于编程有一定了解的人,就会对算法更加敏感一些。洪雨这次就大胆猜测,百度指纹算法的几种计算方式。

    洪雨先假设一个前提,所有指纹都用md5来统计。

    1.短句md5

    之前洪雨认为,百度会以一句为一个截点计算md5,后来发现好像,分的更细!百度是以标点符号来划分md5的。

    什么意思?

    举例,“今天啊,天气还不错。”这句话,其实是以逗号为截点,也就是说,计算了三个md5的值。“今天啊”是一个md5,“天气还不错”是一个md5值,“今天啊,天气还不错。”是一个md5值。以此类推,三个点就是6个md5,四个点就是10个md5,五个点就是15个md5,六个……

    又或许,百度更加变态,已经以单字为截点进行计算了,一篇文章的md5数量为天文数字。不过这种可能性较小,因为会消耗巨大算力,成本太高。

    2.段落md5

    以段落为截点,计算md5这个没什么好说的。独段计算,也整体计算,跟上面的算法一样。    

    3.关键词指纹。

    每个关键词都有自己的md5指纹,百度会通过分词筛选你文章的关键词,然后和数据库中的指纹进行比对。

    不过洪雨认为,这种比对不是决定文章原创与否,而是决定文章的属性,跟收录无关。

    4.归类指纹

    每个关键词,不仅仅带有各自的md5,而且各自都有多个领域的“归类分”。

    什么叫归类分?

    举个例子,比如“外星人”这个词,他可以是外星人的意思,可以是戴尔的一个笔记本电脑系列,也可以是一部电影。这三个分类各不相同,一个是科学领域,一个是计算机电子产品,一个是影视剧。所以“外星人”这个词就最少带有这三个领域的归类分。

    当很多关键词聚集在一起的时候。百度会进行全领域分数计算,哪个领域分数高,你的文章就分属到哪个领域里。

    在这个领域里,再进行其他的运算。

    这个很关键,比如你这篇文章,如果放在A领域里,可能分数只能排在10名,而放在竞争度小的B领域里,可能就排在第一了。

    另外提一下,相近词和同义词所带有的“归类分”是一样的,所以,你懂的。

    5.时间指纹

    以前百度没有时间算法,是近一两年刚添加的。意思就是说谁先发布的文章,就给谁更高的加分。

    6.标题指纹

    这个算法很关键,估计也没几个优化师关注,培训也很少提到。

    雨多年实践得出,现在百度对标题的指纹尤为重视,权重非常高。标题OK就等于成功了一大半。甚至一个标题的页面,就会有很好的收录和排名。

    说道这里,洪雨想到多年前做过的一个测试,网站只有标题没有内容时,排名很好,后来添加了文章(没有内容只有标题),排名却开始浮动,后来文章加了内容,反而排名下降了。

    这证明了什么?

    这证明,文章内容不符合seo的规范,反而会给网站减分。

    7.图片指纹

    百度为了提高用户体验,建议文章都穿插一定比例图片。这个比例洪雨建议100~200字之间插入图片。

    如果不加图片,没什么惩罚,穿插了图片的文章对排名是有好处的,图片可以改变文章整体的md5,而且图片本身也是计算md5的。

    尤其要注意图片的alt标签,加和不加区别还是很明显的。

    8.频率指纹

    这个好理解,就是某个关键词出现的频率高,相应加分就高。就是洪雨经常说的关键词堆叠,一个老算法,就不多说了,最早最简单的黑帽技巧,虽然被玩烂了,但现在依然可以玩,想了解的查看洪雨之前的文章。

    9.原创度阀值

    不要以为文章原创度越高越好,太高是不符合正常规律的。难道你自己写的文章,就一定能100%跟别人一句不重复?

    这是不可能的!

    经过洪雨多年实践经验,超过80%的原创度的文章,百度会引起百度算法注意,超过90%原创度的文章,百度会谨慎收录,谨慎排名。

    那么80%~100%原创的文章,百度会不会收录?

    答案是会的,但收录效果并不尽人意,得出结论,原创度并不是越高越好。一个完全的新站,没有一点外链和权重,单纯靠发布文章,文章的收录率10%~20%,放出时长2个月。

    由于测试的文章均为中性,排名就不用说了。

    10.全站指纹

    百度会对你网站全站进行指纹计算,甚至你网站模版都会记录在案。所以克隆站,镜像站,雷同站群等,都会被算法注意。

    11.体验算法

    体验算法很简单,就是用户看了你的网站很短时间就关掉了。证明没价值,持续的看,就证明有价值。

    如果你网站,大量的人看一眼就关掉了,证明不是垃圾站,也是没用的网站,一定有问题。收录和排名就不用说了,严重的甚至降权。

    换句话说,如果用户停留时间长,那么文章收录和排名就会好。怎样应用你懂的。

    就说这些吧,最后做个小总结

    伪原创这些年不行了,主要还是因为加入了归类算法,垃圾文章和垃圾站这些年也不行了,主要也是因为原创度阀值和全站指纹。

    以前人们会采集一些文章,然后打散句子段落进行重组,现在是行不通的,因为每个句子都被记录了md5,就算重组,依然不是原创。如果随机文字和关键词重组,虽能算原创,但归类算法,全站指纹,体验算法都很难过。

    不过,别慌,按照算法制定策略就是了。我写的《百度收录王》不就一直在更新吗,根据每一个已知的算法应对生成文章,算法加了,软件也加,算法更新了,软件也更新,就算垃圾文章也一样ok。真心不是广告,洪雨实事求是罢了。

    最后提醒一句,如果你不是认真做站,只要别人举报你,那只能等着死翘翘了。

    

温馨提示如有转载或引用以上内容之必要,敬请将本文链接作为出处标注,谢谢合作!

已有 0/1388 人参与

欢迎使用手机扫描访问本站,还可以关注微信哦~