随着数字经济的兴起和蓬勃发展,数据已然成为互联网时代下企业获取竞争优势的关键要素。近期风靡全球的ChatGPT等人工智能衍生产品,其开发和应用也离不开对大量历史数据的学习和训练。随着数据的 "频频出圈" ,互联网企业纷纷 "试水" 新的商业模式以进一步挖掘其经济价值,而由此引发的不正当竞争纠纷也频频发生。尽管目前我国在该领域的制度构建道路上仍在不断摸索前进,但随着相关案件纠纷的增长,司法实践中已经形成了一套广泛适用的审判模式,同时,在数据抓取行为的复杂化趋势下,越来越多的法院也开始尝试基于数据分类、行为分解展开对不正当竞争行为的认定。 本文分为上下两篇,从 普适规则总结 新型思路剖析两方展开,结合代表性案例,司法实践中的审判路径进行总结归纳,为企业主张维权和规避风险提供可能的指引或借鉴。

在上篇中,笔者基于典型案例对司法实践中较为普适的"多元权益衡量"审判模式进行了分析总结。在本下篇中,笔者将基于涉爬虫的数据侵权案件"微博诉蚁坊案",从实务视角对"数据分类+行为分解"的新型思路进行讨论。

二、 "数据分类+行为分解"的新型思路

代表案例:湖南蚁坊软件股份有限公司与北京微梦创科网络技术有限公司不正当竞争纠纷

(一)基本案情

原告微梦公司系新浪微博平台的运营方,并对微博平台中的相关数据享有知识产权权益。被告蚁坊公司为蚁坊软件网、网页版鹰击系统,以及安卓手机端鹰击应用的运营方,提供微博数据服务,具体包括获取、存储、展示和分析微博平台数据,并形成数据分析报告。微梦公司主张,蚁坊公司通过非法手段抓取、存储微博平台后端数据,在鹰击系统中展示这些数据并基于此加工整理形成数据分析报告的四项行为构成不正当竞争。

案件焦点

1.主体资格的讨论——竞争关系的认定

法院认为,对于不正当竞争纠纷诉讼主体之间的竞争关系不应作狭义的理解和限制,现代市场中的竞争关系不仅包括同业竞争,也包括不同经营者对同一经营资源或交易机会进行争夺的情形。本案中,虽然原被告经营领域不同,但二者重要的经营资源均包含新浪微博数据,而该数据显然可以带来直接或间接的经济利益、提供竞争优势。由于在案证据显示,微梦公司就上述新浪微博数据的商业化利用与外部企业展开合作,而该合作的经营模式及领域与蚁坊公司高度趋同。因此,若蚁坊公司利用新浪微博数据以提供商业化舆情监测服务的行为,在提高自身竞争优势的同时,会直接减弱微梦公司商业化利用的交易机会与交易空间,二者存在现实的"此消彼长"之关系,应当认定具有竞争关系。

2.行为的性质认定

①数据类型区分

在本案中,法院将将涉案微博平台数据分为 "公开数据" "非公开数据"。法院认为,尽管数据是平台的重要经营资源,但互联网数据的可集成、可交互的特点赋予了平台经营者一定的容忍义务,即允许他人合法收集或利用其平台中已公开的数据,否则可能有违互联网互联互通之精神。因此,无论是用户浏览还是网络爬虫等技术手段, 合法途径下对公开数据的访问和抓取都属于合理范畴,不应被区别对待。 下述分析主要围绕对非公开数据的抓取展开。

②蚁坊公司抓取、存储、使用涉案数据的行为性质

A.数据抓取。由于在案证据显示蚁坊公司抓取的数据与正常的访问情形不符,法院认定蚁坊公司抓取的数据包括已设置权限的非公开数据。鉴于原被告双方不存在合作关系,显然蚁坊公司利用技术手段破坏或绕开了微梦公司所设定的访问权限,而此种行为显然具有 不当性

B.数据存储。鹰击系统提供的数据内容和形式表明蚁坊公司在抓取微博平台数据后进行了存储,显然该行为具有不正当性。首先,非公开数据往往包含与用户个人隐私相关的信息,蚁坊公司的存储行为可能导致信息泄露,危害微博平台的数据安全,侵害用户对其个人隐私等信息所享有的合法权益。另外,蚁坊公司的存储行为会使数据脱离用户和微梦公司的控制,减损其处理数据的权利,破坏用户协议的履行。

C.数据使用。因蚁坊公司的抓取、存储行为存在不正当性,故 后续使用行为也因数据来源不合法而不具有正当性之基础。此外,微博平台中对这些数据设定了特定的展示规则,蚁坊公司改变该种规则而在鹰击系统中更改该部分数据的呈现方式,亦具有不正当性。

3.原告权益是否受到损害

首先,微梦公司负担着保护数据安全等义务,而被诉行为大大增加了数据安全风险,影响了用户协议关于数据处理和安全等条款的履行;其次,蚁坊公司破坏或绕开相关保护措施而抓取非公开数据,改变了新浪微博的数据展示形式,破坏了数据的访问和展示规则,容易使微博平台的运营陷入混乱;再次,蚁坊公司实时抓取大量数据的行为,也会给微博服务器的正常运行造成额外负担,增加微梦公司的运营成本;最后,微梦公司已就微博平台数据与案外人开展合作并提供同类服务,而被诉行为必然会影响微梦公司的对外授权和相关收益。

基于此,法院认定蚁坊公司的行为构成不正当竞争。

(三)小结

微博诉蚁坊案是爬虫类数据抓取案件的典型代表。在该案中,法院对数据类型进行了分析,并进一步将平台的数据处理行为拆解为数据抓取、数据存储和数据适用进行深入讨论。相比宏观的多元权益衡量,这种细化的论证逻辑具有更强的合理性。例如,针对非公开数据的保密性,法院通常对获取手段进行更严格的审查。同时,在没有充分证据证明争议双方存在合作关系且抓取技术手段具有正当性时,法院可以合理推定抓取方通过技术手段突破了访问权限。而基于数据来源的不正当性,后续存储、使用、展示等行为往往均会被认定构成不正当竞争行为。

(四)审判模式

尽管上篇中提到的多元权益衡量的审判思路具有普遍适用的优点,但同时也需要法官更多地发挥主观能动性,从而增加了个案判断中的任意性因素。随着实践中案件情节、行为方式趋于复杂,这种审判模式的权威性和可靠性也受到了挑战。因此,部分法院已经开始尝试从细化数据类型和分解行为方式入手,立足原告/经营者利益损害(而往往非多元利益分析)进行重点分析,如是否破坏了原告平台的管理秩序、损害了原告的经营自主权、影响了原告收益、破坏了原告的用户粘性、增加了运营成本、提升了安全风险等。

值得注意的是,竞争优势的此消彼长是市场竞争中的常态,因此损害经营者利益并不意味着被诉行为必然具有不正当性和可责性。因此法院需要对行为的不正当性进行评判,在许多案例中法院往往中不会完整地提起市场竞争秩序、消费者权益和社会公共利益等,而是简单通过被告行为手段具有"搭便车"嫌疑、窃取原告劳动果实等论述简要说明不正当性。在上述前沿案件中,对不正当性的论证则建立在数据分类的基础上,首先明晰公开/非公开数据的特点,进而在拆解后的每一个行为中循序渐进地进行评估。

1411980a.jpg

三、结语

经统计,就数据抓取类案件而言,近年来法院支持原告诉求的比例已超过9成。尽管司法实践中法院已经开始尝试通过数据分类分级、场景化分析等方式增强论证的合理性,但始终对数据保护和数据流通/竞争的矛盾浅尝辄止。

随着数据产业的发展在互联网技术革新的加持下日新月异,大量的数据分析类创新型企业也随之涌现。由于大部分数据公司并没有源数据,司法实践中对数据获取手段的合法性评价与公司运营成本息息相关。同时,数据创新产业的巨大商业潜力以及天然的数据资源优势,进一步强化了互联网巨头实施数据垄断的经济动因。

事实上,我国的互联网产业长期处于寡头垄断的状态,在互联网相关领域内绝大部分的市场份额都被金字塔顶端的少量企业掌控。同时,越来越多的互联网企业正寻求利用自身的数据优势实现跨领域、跨行业发展,从而构建互联互通的商业生态网络,不断扩大竞争优势。显而易见,在具有较强垄断倾向的互联网经济行业中,数据权益保护的司法倾向可能会加剧"数据专享"的趋势,从而为新型数据产业的发展戴上枷锁。随着相关行业和立法趋于完善和成熟,或许可以期待未来在制度设计和司法审判中体现更多促进数据高效流通和充分竞争的价值取向。

The content of this article is intended to provide a general guide to the subject matter. Specialist advice should be sought about your specific circumstances.