大数据时代,除直接向用户采集数据之外,另一大数据来源就是使用网络爬虫采集公开信息。从技术中立角度而言,爬虫技术本身并无违法。但爬虫技术如果利用不当,有可能引发诉讼,还有可能被法院认定构成不正当竞争。
因认为杭州快忆科技有限公司(下称杭州快忆)针对微信产品开发爬虫工具和提供爬取结果数据包的行为,干扰了微信公众平台的正常运行,涉嫌构成不正当竞争,深圳市腾讯计算机系统有限公司、腾讯科技(深圳)有限公司(以下统称腾讯公司)将其起诉至杭州铁路运输法院。在诉讼过程中,腾讯公司申请行为保全。近日,杭州铁路运输法院就腾讯公司提出的申请作出裁定,认为杭州快忆违反《微信公众平台服务协议》,开发出多款用于爬取微信公众平台各类数据的产品并以此牟利的行为,构成不正当竞争的可能性大,杭州快忆需立即停止被诉侵权行为。目前,该网站涉案的相关产品及服务已下架。
腾讯公司起诉称,网络爬虫是一种按照一定的规则,自动地抓取互联网信息的程序或者脚本。大多数情况下,爬虫技术是通过代码模拟人工访问,并自动读取、收集公开网页信息。但正是由于通过代码模拟人工访问,有时爬虫可能访问到人工访问不会访问、或者无法访问的内容。杭州快忆是一家爬虫技术公司,其在官方简介中将爬虫技术概括为“大数据 +AI 的云 OS”,但事实上存在无视网站所有者的反爬虫协议,采用技术突破的手段爬取数据,并以此牟利。杭州快忆在网站中提供“微信公众号文章信息 API”“微信订阅号和最新文章 API”“微信热搜榜、订阅热词 API”等针微信数据爬取服务,该行为干扰了微信公众平台的正常运行,涉嫌构成不正当竞争。
在诉讼过程中,腾讯公司向法院提起行为保全申请。杭州铁路运输法院组织双方进行了听证。
杭州快忆辩称,首先,杭州铁路运输法院对该案没有管辖权,程序问题没有定论的情况下不应先作出行为保全裁定;其次,杭州铁路运输法院已经作出财产保全,公司已经无法开展正常经营行为,申请人再申请行为保全是重复加重被申请人负担;再次,申请人申请行为保全无事实、法律依据,被申请人收到起诉书后已经删除涉案被诉侵权产品和服务,也删除了相关涉案服务模块,行为保全的紧急性和必要性已无必要等。
杭州铁路运输法院经审理后认为,杭州快忆提供的爬取微信公众号数据的产品和服务,干扰微信公众平台正常运行,有较大破坏平台健康生态秩序的可能。数据爬取过程中还会占用微信网络平台的带宽,增加平台额外的运行成本。另外,数据爬取也可能对用户信息和数据安全造成危害,被诉行为构成不正当竞争的可能性较高。
据此,杭州铁路运输法院作出上述裁定。
公开资料显示,杭州快忆于 2015 年创立,对外宣称其源自谷歌的技术团队,公司推出的“神箭手”大数据开发平台,可提供一站式的数据获取、数据处理和数据输出的服务。(本报记者姜旭)