“爬虫”本无错,错在滥“取”之

2022-12-02 19:55:00
​爬虫技术的广泛应用,在为人们带来便利的同时,也引发了诸多纠纷。本文以多起不正当竞争案为例,简要分析我国司法实践对企业爬取其他企业公开数据的态度。

编辑 | viki

大数据时代,所有信息都能以数据形式体现,很多“贴心”服务的基础都是“爬虫”技术的运用。

那么什么是“爬虫”?通常认为“爬虫”是一种按照定的规则,自动地抓取万维网信息的程序或者脚本。简单来说,爬虫可以用来检索、搜集和提取数据。

公开数据虽好,获取手段需谨慎

近期审结的“丁香园”诉“医学界”不正当竞争案就是关于爬虫技术的运用。

“丁香园”可能对于非医药行业的你我来说还比较陌生,但其旗下为普罗大众做医疗科普的“丁香医生”就可谓“大名鼎鼎”了。但我们今天讨论的不是它商誉的事,而是它辛辛苦苦整合的药品说明书被“爬”了的事。按常理说,药品说明书是公开的信息,普通人在网上也能搜到这些数据,爬取这些数据会有问题吗?

其实这也是本案的一个核心问题,公开数据是否可以随意爬取。单从本案来看,药品说明书的确是公开数据,但“丁香园”被爬取的是其耗费人力物力形成的,又免费向公众提供查询的药品说明书数据库。据了解,“丁香园”是将本是零散的药品说明书,通过向网友征集和自我汇集、分门别类整理,才创造形成了数据库。当然即使如此,数据库也不是法定保护对象,它既不属于汇编作品也不是商业秘密,在我国现行法律中无法受到保护。不过也并非没有权益救济途径,本案中就是以《反不正当竞争法》第二条为基础展开的。

“丁香园”辛苦创建的数据库,“医学界”直接“拿来主义”,利用爬虫数据通通拿走并用在自家软件中。诉讼中,“医学界”辩称其数据也是自行整理,但苦于无法解释为何自家数据库中药品说明书上编号与“丁香园”随机生成编号一致,也无法拿出证据自家短时间就能收集整理并形成偌大数据库的过程,被法院“无情”地不予采信了。

本案中,法院综合考量认为,“丁香园”投入人力、物力积累形成了药品说明书数据库并免费供公众进行查询,虽然药品说明书为公开的数据,但其经过“丁香园”人工收集、整合、编辑,具有一定的商业价值和竞争优势。“医学界”爬取数据库后用于经营竞争使用,行为具有不当性,而这样的行为虽在短期内有利于用户,但从长远来看会损害消费者利益。最后法院判决,“医学界”爬取“丁香园”药品说明书数据库的行为构成不正当竞争,判赔25万元。

竞争案例丨“丁香园”诉“医学界”爬取其药品说明书数据库,法院认定构成不正当竞争(点击蓝字查看该案详情)

典型案例

在“丁香园”案前,国内法院针对爬取数据引发的不正当竞争纠纷,已经作出了一些裁断。本文按照裁决的时间先后,摘取三个典型案例,供读者参考。

1. “新浪微博”诉“脉脉”案

该案中,“脉脉”利用爬虫技术未经许可,获取新浪微博用户公开信息,并展示在其应用的人脉详情中。法院认为,“脉脉”的行为侵害了“新浪微博”的商业资源,不正当的获取了竞争优势,构成不正当竞争,判赔“新浪微博”200万元。

640?wx_fmt=png

(扫码查看该案详情)

2.“大众点评”诉“百度”案

该案中,“大众点评”付出大量资源获取的用户评论信息,被“百度”利用爬虫技术爬取后大量用在其百度地图和百度知道等产品中。法院认为,这些信息具有很高的经济价值,“百度”的行为损害了“大众点评”的利益,违反公认的商业道德,构成不正当竞争,判赔300万元。

640?wx_fmt=png

(扫码查看该案一审判决)

640?wx_fmt=png

(扫码查看该案二审判决,二审维持原判)

3. “酷米客”诉“车来了”案

该案中,“酷米客”的实时公交数据是经过人工收集、分析、编辑、整合并配合GPS精确定位后,作为公交信息查询软件的后台数据免费提供给公众查询的。“车来了”利用爬虫技术进入“酷米客”后台非法获取数据,从而提高己方“车来了”信息准确度。法院认为,“车来了”大量抓取并无偿使用“酷米客”数据的行为,有非法占用他人无形财产权益,破坏他人市场竞争优势,并为自己谋取竞争优势的主观故意,违反了诚实信用原则,扰乱了竞争秩序,构成不正当竞争行为,判赔50万元。

640?wx_fmt=png

(扫码查看该案详情)

技术无对错,诚实信用是竞争之根本

不难看出,这些典型的因滥用爬虫数据而引发的不正当竞争纠纷案件审理思路其实差不多,都是从这些公开数据是否具有商业价值,是否为企业带来竞争优势,企业在获取数据时所需的成本和经营中所付出的努力,爬取行为的正当性和获利情况以及消费者合法权益与社会公共利益等这些角度出发。

目前单就从裁判文书网中,以“爬虫”“不正当竞争”为关键词,以2012-2022为时间节点查询到的十二起典型案例判决来看,仅有2例为爬取方胜诉。在爬取方无法为自身爬取行为正当性拿出有效证据的情况下,被爬取方能以竞争优势减少而获得法院支持胜诉。

为了在市场中占有更多的优势,很多企业想“走捷径”,直接违背商业道德去“白嫖”别人已经付诸努力得到的数据,但这样的做法无疑是违背诚实信用原则的,一味的“抄近路”,却不想着加强自身技术与能力,终究会受到法律的制裁,被市场所淘汰。

总的来说,爬虫本身是科学技术进步的表现,技术本身并没有对错之分,但技术应用就会因使用者的意志、司法的综合考量因素而有不同结果。

企业利用爬虫技术,在不侵犯公民隐私信息以及其他法律规定不公开数据的前提下,可以更方便、快捷、高效的抓取数据进行分析并用于日常生产经营,这本是技术促进发展的好事,但若是利用爬虫技术,肆意爬取其他企业付出成本并辛苦经营、具有商业价值的公开数据,只想“不劳而获”,就有可能构成不正当竞争,并承担相应法律责任。

(图片来源 | 网络)

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
评论区

    下一篇

    截至2022年6月统计,我国有效注册商标4054.5万件,连续多年居世界首位。但成为“商标大国”的同时,商标注册难及注册商标闲置的问题也越来越突出。据2018年政协委员程静的陈述,全国商标闲置率达到30%,部分类别上的闲置甚至达到50%。在2022年的今天,相信注册商标闲置率只会有增无减。

    2022-12-01 16:50:00