前端工程师的SEO优化

seo就是搜索引擎优化,通过优化手段让搜索引擎更加高效地抓去到你的页面,从而在搜索结果中排前。当然了,对于度娘来说,钱是最好的优化方法(手动滑稽)

既然要考虑如何做好SEO,那么首先就要理解网络爬虫这只“小蜘蛛”的是按照什么样的规则去抓去页面,我们就能针对性地作出能吸引“小蜘蛛”过来“觅食”的反应

网络爬虫爬取规则

一、内容原创

这是最重要的一点,以百度为例,爬虫每天进行运作,都会记录它爬过的内容性质,那么就会对抓取内容进行筛选。独一无二的文章内容就是蜘蛛最喜欢的“食物”。

二、内容之间的相关性

蜘蛛对我们的内容并没有理解性,它只会对词语或句子进行判断。拿现在的百度来说,网站的内容越具有相关性,或者文章的内容和标题越具有相关性。被收录的可能性就越大

三、抓取顺序,从上到下,从左到右,广度遍历

爬虫对页面的爬取顺序是从上到下,从左到右的,先爬取的部分权重更高。而且,大部分情况下爬虫会优先爬取第一层级页面内容,再去爬取第二层级,依次往下(也存在优先爬取纵深的算法,不过并不常见)。越往后元素的权重就越小。

四、工作机制

还是以百度为例,通过百度蜘蛛拿到的页面先放到补充数据区,再通过各种程序的计算,比如对比整站内容、多次爬取对比自身内容等,再放入检索区,再形成相对稳定的排名

通过以上分析可得,要想推广一个网站,少不了对这个网站的运营,比如保持更新频率,站外引流,持续添加站内引流信息等等。作为一个优秀前端工程师,在开发网站的时候就需要保持对SEO的敏感性。下面我将从网页布局优化代码优化两个角度分析我们在开发的时候可以对SEO优化这个步骤做哪些事情。

网页布局优化

扁平化结构

顾名思义,在设计网站整体架构的时候,层级不要过于复杂。通常蜘蛛最多爬取到三层,再往下效率就非常低了。

控制网站首页链接的数量

链接数量不要太少,保证和其他页面的相关性;也不要太多,增加爬虫的负担。通常在100以内即可

导航优化

最好使用文字作为导航,更易被蜘蛛识别。如果一定要使用图片链接,一定要加上alttitle属性进行说明。

使用面包屑导航,不仅提高用户体验,还能增大页面间的相关性

页面大小

页面体积不要过大

其他细节

在各种细节注意页面的相关性以及页面的层级复杂程度

以翻页控件为例,我们通常可以见到三种实现方式

  • 第一种:【上一页】【当前页码】【下一页】。对爬虫来说,每一页都是一个纵深层级
  • 第二种:【上一页】[1][2][3][4]...【下一页】。比上一种方案要好,对部分页码进行平铺,当前页码和周围页码相差一个层级
  • 第三种:【页码】【下拉框】。通过下拉框选择页数。所有页面都在下一个层级,对蜘蛛最友好(当然这种方案对用户体验就不太友好了【摊手】)


代码优化

语义化标签

小蜘蛛也是认识标签的,h5新增的许多语义化标签都可以被小蜘蛛识别,并且有不同的权重值

比如小蜘蛛看到h1标签就知道这是网站的标题,一定包裹了重要的信息,看到P就知道是正文,看到strong就知道是强调内容,等等等等,和整个页面都是div搭建起来相比,语义化标签无疑让小蜘蛛走的更加顺利,让他知道什么是重点。

这里容易被忽略的一点是,br的含义是文本回车,所以不要为了空行而在标签之间写上br

  • 错误写法
<div></div></br></br>
<div></div>
  • 正确写法(慕课网案例)


标题,关键字,描述

页面的标题、关键字、描述也是优先爬取的内容,并且如果他们之间,以及他们和网站内容之间的的相关性越大,就会越容易被收录

慕课网关键字和描述信息


其他

  1. 添加a标签的rel属性用于描述链接,增强页面内部相关性。如果是需要爬取的外部链接,写成nofollow
用于meta元标签:<meta name="robots" content="nofollow" />
//告诉爬虫该页面上所有链接都无需追踪。

用于a标签:<a href="login.aspx" rel="nofollow">登录</a>
//告诉爬虫该页面无需追踪。
  1. 页面重要的部分放在前面。比如一个网站,布局为广告位位于左侧,正文位于右侧,html结果也最好把广告位放在下方,通过浮动设置到左侧
  2. 重要信息不要使用js输出
  3. 不使用iframe,爬虫获取不到其中的信息
  4. 爬虫会过滤样式为display:none的部分

其它Tips

  1. 重要内容放在前面
  2. 不要使用js输出重要内容
  3. 不使用iframe
  4. display:none属性会过滤

小结

网页布局优化代码优化是从前端开发的角度实现SEO。可以更加直观地这样理解 :我们的目的就是吸引这只“小蜘蛛”过来“吃东西”。

  • 首先,我们要放出它喜欢的食物,即原创内容
  • 其次,让它知道我们这里有许许多多相互关联的食物,让它呆的久一点,即内容具有相关性
  • 然后呢,还要考虑到它的用户体验,让它寻找食物的路更加顺利,这一步就是合理的页面排版和结构,以及它能够识别的信息
  • 最后,就是保证重要的信息让小蜘蛛能吃到,并且优先吃到,即考虑到元素设置的权重

对于一些推广需求强的商业性网站,前端工程师在开发的时候需要养成良好的开发习惯,把seo优化作为一种规范。这是整个站点搜索引擎优化的有力武器。

参考资料:
百度蜘蛛抓取规则

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,451评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,172评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,782评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,709评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,733评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,578评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,320评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,241评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,686评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,878评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,992评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,715评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,336评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,912评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,040评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,173评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,947评论 2 355