神箭手平台擅自爬取微信公众号数据被起诉

大数据终于走向了平稳期,发展过程中的各种隐私、合规问题也终于开始暴露了出来,昨天网络尖刀犯罪情报团队监测到一个非常有代表性的民事裁判案件,深圳市腾讯科技有限公司诉杭州快忆科技有限公司,通过针对微信公众号开发爬虫工具提供爬取结果数据包的行为,干扰了微信公众平台的正常运行,涉嫌构成不正当竞争。

近日,杭州铁路运输法院就腾讯公司提出的申请作出裁定,认为杭州快忆科技有限公司违反《微信公众平台服务协议》,开发出多款用于爬取微信公众平台各类数据的产品并以此牟利的行为,构成不正当竞争的可能性大,杭州快忆需立即停止被诉侵权行为,目前,该网站涉案的相关产品及服务已下架。

image
image
image
image
image
image

提取一下整体的案件情况,我们收集了一系列相关的内容,做了一次完整的事件分析,来对这次案件做一次腾讯侧的“还原”。

神箭手违反了哪些法律?

虽然腾讯诉讼的是以民事诉讼其反不正当竞争,但是实际上神箭手通过爬虫大规模拉取腾讯数据这件事儿上,爬取来的内容其实是在侵犯“微信公众号平台作者”的著作权,属于知识产权范畴;

设定规则模拟人的方式通过爬虫的去请求微信公众号数据,这种行为其实也是一种“资源消耗型攻击”,如果请求量足够大的线层足够多的前提下,说其向腾讯发起CC流量攻击其实也是合情合理的,所以这一点属于网络法范畴;

神箭手在其平台上提供了“微信公众号文章信息API”、“微信订阅号和最新文章API”、“微信热搜榜”、“订阅热词API”等针微信数据爬取的服务,这一点才是属于反不正当竞争范畴;

为什么选择告其反不正当竞争?

说句实话爬取微信公众号平台内容的应该会有很多,包括之前某些媒体平台也提供了将微信公众号内容爬取下来同步到自身平台的工具,当然市场上还有一些图文同步的工具,也可以做很多内容分发,但是这个性质与目前神箭手的性质完全不一样。

之前的这些“同步工具”其实都是给媒体作者用的工具,虽然爬取的方式严格来讲不合法,但是实际上在知识产权的角度来讲,这些工具都是在原作者同意的前提下,为内容创业者为提供方便的工具,并没有严重的侵犯商业权益,并且从爬取的请求角度来讲,只是部分作者用了这种工具,而且不是集中性的任务,其实对微信公众号来说确实也没有造成太大的数据压力;

神箭手不一样,神箭手是一个经营性的爬虫平台,提供爬取微信公众号爬取规则的,并通过卖节点的方式进行商业变现,所有使用神箭手平台的人,其实基本都没有获取到原作者的授权,单纯的就是在神箭手平台上定制爬虫规则、节点进行数据抓取,而且是持续高频。

新增一个爬虫节点就多一台服务器在这里进行非法“攻击请求”,这一点对微信公众号平台确实造成了实际的资源损耗和数据压力;

不懂法规的就不要上来喷腾讯乱告,腾讯告其反不正当竞争其实已经算是蛮保守的了。

爬虫涉及哪些相关法律问题?

目前国内还没有真正意义针对爬虫技术有法律或者相关规范,从技术角度爬虫存在是为了高效的收集信息,本身是没有违法违规之处,界定违规其实在于爬虫的用途,常见的爬虫是遵守中国互联网协会《互联网搜索引擎服务自律公约》中robots协议,但此内容不具备实际的法律约束,反倒是属于商业道德范畴;

目前无视robots协议抓取网站内容的行为,大部分都会以涉嫌构成《反不正当竞争法》的第二条,即违反诚实信用原则和商业道德的不正当竞争行为原则进行诉讼。

当然这也要取决于爬虫爬取的内容到底是什么,比如爬取文章可能侵犯的是原作者的“著作权”;爬取别人公司的商业数据,侵犯的即是商业秘密;爬取微博、微信、Facebook、Twitter甚至其他平台的用户(姓名、手机、邮箱)等敏感信息,侵犯的则是个人用户隐私;

维护民营企业市场竞争秩序,这样的民事诉讼一般都会依照《民法通则》、《反不正当竞争法》、《民事诉讼法》进行延展。

但侵犯公民用户隐私则可以依照《网络安全法》44条非法获取个人信息的角度进行处理,如果抓取了这些数据不但自己用还往外面卖,那么就可以参考《刑法》修正案253条侵犯公民个人信息罪进行处理。

谨慎考虑使用爬虫的风险

不是所有的爬虫都一棒子敲死,存在就都是危害别人利益的,比如像百度、谷歌、360、搜狗这些搜索引擎,其实本身都在使用爬虫技术,但是其索引抓取网页内容的方式,应用到业务里实际上是为被爬取方带来利益的,所以不但我们不希望禁止他们的爬虫,还期望更多的迎接他们的爬虫的到来,当然如果不想着爬虫抓取我的内容,我也可以直接通过搜索引擎爬虫robots协议,对其进行禁止爬取的设定,这样搜索引擎就不会抓你,自然就不会有风险。

但反之,我明令写了《许可协议》告知了不让你爬你还爬,我上了“反爬取措施”你就用非法手段绕过,高频请求对我运营平台造成了服务器高负荷的技术压力,影响我正常经营,还把爬取我的数据出去卖????

家里有矿吗?敢这样搞,不弄你弄谁啊?

写在最后

很多不良机构培训都打着大数据Python工程师培训的头衔,实际上都在引导很多不懂行业的无知小白去学习爬虫技术,这些人没有专业的法律法规科普,很容易在不明情况下走向了犯罪的道路,不是所有的公开数据都随意爬的,各位一定要有这样的认知。

还去培训机构学Python写爬虫吗,从入门到入狱的那种?


站外转载烦请注明来自公众号:网络尖刀,作者:曲子龙,公众号内容转载,可以直接在下面留言公众号ID,我在后台开放白名单。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345

推荐阅读更多精彩内容