产品有了一部分内容,要开始考虑 seo 方面了。
对于搜索引擎来说,内容的质量最重要,不过这主要靠编辑或运营,技术层面可以做到的主要有以下几点:
URL
搜索引擎喜欢静态页面,最好同一个 path 就是同一份内容,避免通过参数改变。
简书的所有文章都是 /p/xxx 用户主页都是 /users/xxx 就是这个道理。
所以最好在开始能够将路径规划好,否则虽然也可以配置路由调整,搜索引擎基本也都支持改版功能,不过一来改版功能有时附有一些条件不容易满足,再者外部链接可能无法正常使用或者贡献权重,还是有一定的影响。
结构化数据
网页上总是有各种数据,如果能主动标记清楚各种信息分别是什么意思,搜索引擎就可以更好找到主题并且排版展示,对于搜索引擎判断内容质量应该会有帮助。
google 推荐使用 schema.org 的标记法,除此之外还有 microdata、json-ld 等其他标记法,各大搜索引擎几乎也都支持。
页面元信息
例如 title、description、keywords(虽然据说主流搜索引擎已经无视了)有助于搜索结果的匹配,所以几乎所有的站点都会在页面原标题前或后加上自己产品的名称。
简书就是使用 『标题 - 简书』这种形式。
canonical 有助于不同入口访问到该页面的蜘蛛去重。
sitemap
有些孤岛页面蜘蛛没法直接爬到于是无法收录,另外一些动态页面虽然蜘蛛也不同程度支持,毕竟不能完全信任。于是主动将期望收录的页面更新到 sitemap 里引导蜘蛛爬取会比较安全。
目前各大引擎除了自己解析外,基本都可以通过各自的站长平台主动提交,效果应该会更好。
内外链
链接数是页面权重的一个影响因素,内链不说了自己设计页面就好。
外链貌似一般会搞站群互刷,不过可能会被搜索引擎惩罚。于是能做的就是简化自己内容的分享操作,利用各种分享组件便于用户主动将内容分享到其他平台。
但是有部分平台(例如知乎)会给自己站点用户提交内容中 a 标签加上 rel="nofollow" 的属性以避免蜘蛛流出为目标站点贡献权重。
其他
- 尽量避免 404 错误,常见的失误是忘了放 favicon.ico,如果用户可以提交富文本内容的话,像上面说的给 a 标签加 nofollow 也是不错的选择。
- 主动向搜索引擎提交新页面,各搜索引擎的站长平台几乎都有这个接口,比起单纯被动等待蜘蛛要靠谱的多。
- 事实上 url 如果能更有意义的话效果更好,所以很多英文站点(例如 medium)直接将标题当 url 的 path,不过很遗憾中文涉及编码问题没法用这个方法。