据媒体报道,近日Facebook和Instagram的母公司Meta遭遇了诉讼挫折。【1】美国法院认定Bright Data公司抓取Meta公开数据的行为并未违反Meta的注册协议,驳回了其起诉,之后Meta直接放弃了诉讼。


该案显示了美国法院对于网络数据抓取的新动向。但本案如果发生在国内,大公司维权数据抓取公司,手段很多,胜率很高,说十拿九稳并不过分,今天就结合Meta案的判决书和我国相应的法律和大家一起探讨一下。

 

案情简介:Bright Data是一家专业抓取互联网信息的公司,Meta曾经向 Bright Data购买第三方电子商务网站的数据,以在其平台上建立品牌形象。但当Bright Data抓取Meta下属Facebook和Instagram的数据时,Meta起诉了Bright Data,认为抓取数据违反其注册协议。

 

在本案中,Meta向法庭提交的证据包括一个Bright Data抓取到并出售的包含 6.15 亿条 Instagram 数据记录的庞大数据集,售价为 86 万美元。该数据集包括用户姓名、ID、国家/地区、帖子计数、简历、主题标签、关注者、帖子、个人资料图片、业务类别、电子邮件等字段。


但法院认为,这些数据都是公开信息,并不包含登录后才能获得的信息,Meta也不能证明Bright Data使用自己的Facebook和Instagram账户进行抓取,因此不能因Meta的注册协议而追究其责任。

 

对于Bright Data对网站数据的抓取行为,中美两国法律上有多种诉讼方法可以维权,下面我们就介绍一下。

 

一、以违约为诉由起诉


本案中,Meta向法院起诉的案由是违约,也就是Bright Data违反了其注册Meta的用户协议,但问题是法院调查的结果是:Bright Data虽然在Meta上有一个注册账号,但并没有通过注册账号抓取Meta的信息。


加州北区法院的判决书认定Meta未能证明Bright Data违反了合同,因为Bright Data仅在未登录状态下抓取了公开数据,而Meta的条款并未明确禁止这种行为。法院还指出,即使Meta、Facebook和Instagram的注册协议被解释为禁止用户在未登录状态下抓取公开数据,这种禁止在Bright Data注销其Meta账户后也不适用。

 

简单介绍下抓取登录前网页上的公开信息和登录后信息的区别:登录前用户作为访客通常只能访问公开的、非个性化的数据。例如,他们可以看到公开的帖子、页面和用户资料,但这些内容通常是对所有人可见的。登录后,用户可以访问更多个性化的数据,包括他们的个人时间线、好友的动态、私人消息、个人账户设置等。这些数据通常不对外公开,只有登录用户才能查看。美国法院之前在Linkedin案中将阻止抓取公开信息视为损害公共利益。

 

美国公司阻止数据抓取的诉讼,因为案情不同,所以诉讼时依据也各不相同。廿多年前,eBay在曾经通过诉讼阻止了Bidder’s Edge违反robots协议抓取其数据,【2】法律依据是《计算机欺诈和滥用法》(CFAA)


几年前Linkedin维权数据分析公司hiQ Labs抓取其数据的诉讼过程一波三折,【3】其依据《计算机欺诈和滥用法》的起诉先被第九巡回法院驳回,该院认定Linkedin的阻止行为损害公共利益,故无权阻止hiQ Labs抓取其数据,案件打到美国最高院被发回重审,加州北区法院再判定hiQ Labs违反Linkedin用户协议,最后双方和解。可能Meta就是根据该案,起诉时选择了违反用户协议作为案由,但诉请却没被法院支持。

 

二、以不正当竞争为诉由进行起诉


国内起诉批量抓取网站信息通常以《反不正当竞争法》第二条,经营者应当遵循公认商业道德和诚实信用原则为诉由。比如著名的大众点评诉百度抓取其点评信息并在百度地图中展示的案件中,【4】法院认为:

 

大众点评网的用户点评信息是汉涛公司的核心竞争资源之一,能给汉涛公司带来竞争优势,具有商业价值。汉涛公司为运营大众点评网付出了巨大的成本,通过法律维护点评信息使用市场的正当竞争秩序,有利于鼓励经营者创新业务模式,投入成本改善消费者福祉。百度公司大量、全文使用涉案点评信息,实质替代大众点评网向用户提供信息,对汉涛公司造成损害,其行为违反了公认的商业道德和诚实信用原则,具有不正当性,构成不正当竞争。

 

而在新浪微博诉脉脉案中,微博指控脉脉在合作期间及合作终止后非法抓取和使用新浪微博用户信息(如头像、名称、职业、教育信息等),以及通过脉脉用户手机通讯录非法获得和使用这些联系人与新浪微博用户的对应关系,影响公司声誉及运营收入,违反《反不正当竞争法》第二条,构成不正当竞争。

 

法院认为:脉脉软件非法抓取、使用新浪微博平台用户信息,以及通过脉脉用户手机通讯录中联系人手机号与新浪微博用户信息形成对应关系等行为构成不正当竞争行为。【5】该案和Meta起诉案件的主要区别在于,Bright Data并没有登录网站去抓取Meta的信息,而脉脉是登录微博后,通过应用程序接口抓取的微博用户信息,同时在和微博合作结束后未删除用户信息。

 

该案中,微博其实也能以违约进行起诉,其最终选择了以不正当竞争作为诉由,可能是考虑到以违约起诉技术上略复杂:一方面要证明合同条款是有效的,且没有构成排除对方主要合同权利的格式条款;另一方面微博还认为双方正式合作结束后,脉脉仍通过第三方应用程序接口抓取信息,这个第三方到底是哪个主体,在举证上有一定技术难度。还不如直接诉不正当竞争更简单。

 

三、以侵犯个人信息或著作权起诉或投诉


Meta起诉Bright Data的案件,Bright Data抓取的Instagram数据集包括用户姓名、ID、国家/地区、帖子计数、简历、主题标签、关注者、帖子、个人资料图片、业务类别、电子邮件等字段。这些字段包含的权利在法律上也可以做一些文章,因为其中包含了三种权利:个人信息、头像照片涉及肖像权和版权。

 

所以如果在国内诉讼的,被抓取信息的公司如果可以联系到被抓取信息的用户的,比如公司员工同时也是公司用户的,就可以利用这些权利对抓取信息者维权。涉及版权的,可以让员工将版权授权给公司,进行维权。


比如大众点评诉爱帮网抓取其点评信息的案件,被抓取的点评信息中部分由大众点评员工所创作,大众点评就让员工将点评内容的版权授权给自己,然后维权爱帮网。【6】同理,Meta被抓取了用户头像信息,也可以通过用户维权头像图片的著作权侵权。

 

涉及到个人信息和肖像权的,因为这些权利的人身属性较强,不能转让,故可以以员工个人的名义起诉信息抓取者,要求其停止侵犯个人信息和肖像权。或者直接向个人信息监管部门举报,要求停止违法抓取行为。

 

可能有朋友会问:个人信息和肖像照片发布在公开的网站,其他人就不能抓取吗?根据《个人信息保护法》,取得个人同意才能处理个人信息。Facebook或者Instagram发布用户的个人信息,是有用户授权的。


Bright Data抓取信息后,无论是自己使用还是转给第三方做市场研究、营销、广告技术、人工智能训练或者做其他用途的,均属于处理个人信息,都应当再次取得用户的同意,否则就涉嫌侵权个人信息,法律责任很重。肖像权的道理也是一样,根据《民法典》,使用他人肖像也应当取得授权。

 

最后,我国是成文法国家,法律确定性比较强,在处理商业竞争的案件中,这种确定性相对而言对大公司比较友好。而美国是判例法国家,文化又偏重自由,而抓取网站数据涉及信息自由流动,所以哪怕是大公司,也会面临诉讼结果的不确定性。【7】

 

本文作者:游云庭,上海大邦律师事务所高级合伙人,知识产权律师。电话:8621-52134900,Email: [email protected],本文仅代表作者观点。

 

【1】https://techcrunch.com/2024/02/26/meta-drops-lawsuit-against-web-scraping-firm-bright-data-that-sold-millions-of-instagram-records/ 

【2】https://en.wikipedia.org/wiki/EBay_v._Bidder%27s_Edge 

【3】https://en.wikipedia.org/wiki/HiQ_Labs_v._LinkedIn 

【4】https://www.thepaper.cn/newsDetail_forward_1474673 

【5】https://sciiip.gdufs.edu.cn/info/1028/1083.htm 

【6】大众点评的著作权侵权诉请在该案中未被法院认可,法院只支持了不正当竞争的诉请。可能是因为其用户协议的用户创作的点评信息版权归大众点评所有的内容明显不合理。如果支持著作权侵权的诉请,等于变相认可了用户协议的不合理约定。

【7】https://www.secrss.com/articles/16209