财新传媒
  1. 0

数据产权如何界分会更有效率

2017年10月10日 15:38 来源于 沙龙365登入
可以听文章啦!
  1. 发表评论
  2. 分享到微信朋友圈
  3. 腾讯转发
  4. 新浪转发
由平台拥有数据会比让产生数据的个人拥有数据更有效率。通过合理的产权保护方式,可以较好地解决由平台拥有数据产权所带来的问题

  【沙龙365登入】(专栏作家 陈永伟)大数据时代到来之后,数据成为一种颇受关注的财产。现在,是很重要的生产资源,企业通过挖掘数据可以获得很多有用信息,帮助做出决策、产生价值。一旦数据有了重要价值,其产权问题就变得重要起来。数据到底归谁?是属于平台,还是归产生数据的个人?大数据公司有没有权利使用平台搜集的数据?现实中相关问题的案例已经越来越多。尽管目前在法律层面,对数据产权问题已经有了一些规定,但总体上来说,模糊地带仍比较多。同时,作为新兴事物,现有法规对于数据产权的规范也未必合理、有效率,改进的空间仍然很大。所以,从根本上对数据产权问题进行全面、理论性的思考就变得相当有必要。

  那么,应该如何思考数据产权问题呢?对此,经济学和法学的思维有较大不同。对于法学家而言,思考的出发点往往是权利。具体到数据产权问题,法学家通常会考虑产权划分对于隐私权的影响,或者可能的数据垄断对于自由竞争的干扰。法学家们关心的问题其实是数据产权界定所可能产生的社会成本,却较少关心这一过程中可能带来的社会收益。如果要进行全面的经济学思考,就必须比较不同的产权分配结果之间的成本和收益,并且选择社会净收益最大的产权划分方案。

  不妨在一个具体的情景之下来考虑这一问题。试想,当我们使用一个平台,例如在购物网站,注册信息、消费行为都会变成数据,并被平台获得。在这一背景下,产生的数据究竟是应该归平台,还是归产生数据的个体?为了回答这一问题,需要比较把产权划给平台,以及把产权划给个体这两种产权分配方案之间的成本收益状况。

  先看划给平台的情况。这会产生两个重要的收益——“范围经济”(economics of scope)和“规模经济”(economics of scope)。一般来说,我们每个人拥有的个人数据不仅在数量上很少,而且在维度上也不多。例如,大家网络购物,只知道自己的名字、住址、电话等这些信息,记忆好的人可能还能记住自己曾经买过什么、什么时候买的。这些信息对我们有用吗?我想,即使用,作用也不大——或许对于在座的男士,只有当您的太太要查找你有没有乱花私房钱时,这些数据才能派得上用处。但如果这些数据由平台拥有,情况就完全不同了。因为平台不仅拥有你的信息,还拥有别人的信息;不仅拥有你的基本信息,还可以通过观察你的购物模式构建出很多维度的信息。换言之,他们手里的数据不仅数量多,维度也大,有了这些数据,就可以借助统计方法来分析人的购物模式,并根据你的具体行为做出预测推断。这些预测和推断都是能产生巨大的沙龙365登入价值的。

  而在成本方面,着重需要关注的是两个方面。一是侵权风险。当平台获得了你过多的信息,就难免不侵犯你的隐私。另一方面是对数据垄断的忧虑。既然数据可以提供这么多的信息,那么垄断了数据的企业本身就获得了巨大的竞争优势,可以利用这些优势来更多地获取消费者剩余。例如,现在欧洲已经有案例说电商平台利用数据对消费者进行价格歧视,对不同的消费者收取不同的价格。在经济学上,这种对不同人要求不同价格的价格歧视被称为“第一类价格歧视”,过去只存在于理论上,但现在借助大数据,已经成功成为现实。显然,从消费者角度看,这是很值得忧虑的。如果我们认为消费者的权益是更为重要的,那么这种可能的数据垄断危害就构成了一种社会成本。

  如果我们把数据的产权划分给了个人,那么上面的这些收益和成本将都不存在。因此,要比较把数据产权划分给平台好还是划分给个人好,本质上就是要在这些成本和收益之间进行权衡。

  当然,这种权衡很大程度上是概念性的,到底从数量上看,实际的收益有多大、成本有多大,用计量方法衡量,是比较困难的。不过,如果换个角度思考,进行一个思想实验,问题可能会简单很多。

  经济学有个著名的“科斯定理”。根据科斯定理,当交易成本为零时,对物品初始产权的划分其实并不重要,物品最终将被对其评价更高的人获得。举例来说,假设张三和李四正为某物品展开争夺,张三认为物品值200块,李四认为值100元。无论将物品初始产权安排给谁,张三最终都将持有这件商品:因为若将初始产权给了李四,张三会以某个高于100而低于200的价格向李四购买这件商品,双方都能从交易中获益;若将产权安排给张三,李四却不会以高于100元的价格购得商品。假设有一个交易成本足够低的数据交易市场,那么按照科斯定理,经过人们的自愿交易,数据最终也会落到对其评价最高的人手里,从而达到最优的配置。

  当然,我们知道现实中交易成本肯定是存在的,而且很高。因此数据产权的初始配置当然会影响其最终归属。不过,依然可以把零交易成本的情况作为一种假象的情形来作为讨论的出发点,用其考察理想的数据产权配置。

  零交易成本的数据交易市场会是怎么样呢?微软首席经济学家苏珊·艾瑟(Susan Athey)曾做过一个实验。实验中,她要求被试表达了自己对于私人信息的重视程度,然后设计了一些流程,去诱导这些人有偿透露自己的相关信息。结果发现,即使那些宣称自己十分重视私人信息的人,在实验中也会以非常低廉的价格出售自己的信息。实验透露出一个信息,那就是人们其实并没有自己想象的那样重视自己的信息。如果大家联想一下自己的生活实际,应该也不容易理解这点。在很多时候,我们出卖自己的信息,其实都是有偿的。例如上次我在三里屯吃饭,店家以赠送一晚蛋汤的代价,让我填了包含很多个人信息的注册信息表。当我把这个事情告诉周边的朋友后,他们也对此优惠非常感兴趣。或许,我们平时宣称为很珍贵的个人数据,在实际操作时,价钱未必会比一碗蛋汤高。相比之下,这些信息对于那些平台企业的价值当然不止于此。因此,从效率角度看,由企业获得数据产权应该是更为合适的。

  可能马上就会有人对我的观点提出质疑。是的,如果由平台拥有数据的产权,那么它确实可以做很多事,但是其风险也会很大,对于这些风险,又该如何应对?在我看来,所谓的风险或许并没有我们想象的大。

  由企业拥有数据产权的第一个潜在风险是侵权风险。如果平台拥有了关于个人的大量数据,就很容易对人们的隐私进行窥探,导致很大的侵权风险。不能否认这种可能的存在,但对此也可以做出一点说明:隐私权概念本身就是一个历史的概念,其形成和发展,是由划定隐私权的成本和收益权衡决定的。在古时候,人与人之间的关系很密切,距离感很小,并不存在隐私权。这是因为,当时个人应对自然和社会的各种风险的力量相对较小,需要相互抱团。在这种情况下,大家放弃隐私权,换取更大的合作,从经济上看就是更为合意的。随着生产力的进步,个人应对各类风险的能力上升,人与人之间的合作变得相对不那么重要,隐私对人带来的收益压过了成本,隐私权这个概念才被提了出来。从这个角度看,如果在某一阶段,放弃一些隐私权换来的收益又能大过由此带来的损失,那么少一些隐私或许也不是不可以的。事实上,在大数据时代,如果自动放弃一些隐私,就能换来更多、更便利、更为个性化的服务,从个人的角度看,未必是不利的。

  另一个潜在风险是对于数据垄断问题的担忧。虽然经常提“数据垄断”,其实有时候概念并不清楚。在一些语境下,它指的是平台对于数据资源的垄断;另一些语境下,它指的是平台依靠掌握的数据,增加了其在产品市场上的垄断力,从而可以更好地实施垄断行为。不可否认,这两方面问题都是可能存在的,但是恐怕未必需要过于担忧。

  先看平台对数据资源的垄断问题。平台企业到底能不能垄断数据资源,这其实是有争议的。和所有其他的商品一样,一个企业能否垄断数据资源,主要取决于这些数据的可替代性。如果这些数据是难以被替代的,那么它就可能被垄断;而如果这些数据不容易被替代,那么它就难以被垄断。在现实中,数据资源的可替代程度究竟如何?目前已经有了一些研究,例如Lambrecht and Tucker(2015);Tucker and Wellford(2015)等。这些研究都表明,数据的可替代程度其实是比较强的。事实上,很容易理解,在大数据环境下,很多数据其实可以通过别的维度的数据推断出来。例如,我可能不知道一个人住在哪儿,但是可以通过观察他每天的行动轨迹来判断他的住处。从这个意义上讲,即使有企业独家拥有了关于住处的信息,也无法形成垄断。

  再看对平台依赖数据来强化其垄断行为的忧虑。必须承认,这种可能是存在的。事实上,现在欧洲和美国已经有了通过数据挖掘来实施价格歧视的案例。但在我看来,这种行为其实和一般的垄断行为并没有多大的区别,拥有数据其实只是强化了企业推行垄断行为的能力,并没有改变问题的本质。对于这些问题,我们应该用传统的反垄断方法去加以应对,而不应该由于这些问题而影响了对数据产权问题的思考。

  其实,我们对于数据归于平台的担忧,很大程度上可以通过合理安排产权的保护形式来解决。

  产权到底划分给谁,这很重要,但同时产权究竟应该通过什么方式来进行保护,也很重要。法律经济学大师圭多·卡拉布雷西(Guido Calabresi)曾经提出过产权保护的三种规则:财产规则、责任规则和不可转让性。所谓财产规则,指的是除非产权持有人自愿转让,否则不得强制转让产权,并且转让的价格由交易双方协商决定。所谓责任规则,指的是非产权持有者可以不经过产权持有者的同意,先使用物品,然后支付其一个由第三方认可的公平的价格。而所谓不可转让性,指的则是即使拥有产权,也不能对物品随意转让。在其经典论文中,卡拉布雷西曾对三种原则的适用进行过深入的讨论。在他看来,如果市场上的交易成本很低,那么财产规则是更有效率的,通过自愿谈判,交易的各方都会更加满意。而如果市场上的交易成本很高,那么财产规则就可能没有效率,而责任规则相比之下则更好。当然,无论是财产规则还是责任规则,都是针对在交易中不产生很大外部性的物品而言的。如果交易会产生很大的外部性,那么即使对于产权所有者,也没有权利进行交易,此时产权应该满足不可转让性。举例来说,一个人的身体是自己的,但卖淫是不合法的,这就是不可转让性提出的要求。

  卡拉布雷西的这三个原则在现实中很有用处,尤其是在知识产权领域有很多应用。不妨用这三个原则来对数据产权问题进行一些思考。假设已经按照效率的标准把数据的产权划分给平台企业,如前所述,侵权的风险和对垄断的担忧就是这种界定方法所带来的成本。但这些问题完全可以用产权保护原则来进行克服。

  为什么担忧隐私问题?从经济学角度看,原因是一些隐私数据的交易会产生很多的外部性。根据卡拉布雷西的理论,在这种情况下应该对数据用“不可转让性”进行保护。也就是说,尽管数据的产权属于平台,但是对于那些十分敏感隐私,可能造成重大负面影响的数据,平台除了自行使用它们进行研究外,没有权利将它们转给其他人。刚才于立老师提到了一个copyleft的概念,这是很有启发的。对于这些敏感数据,平台企业拥有的不应该是一般的right,而应该是left。

  再看可能的数据垄断问题,主要针对数据资源的垄断。为什么担心平台垄断数据?一个原因就在于怕这些平台独霸数据,不把它们开放给其他更需要的使用者。从理论上讲,使用者可以向平台申请,从而获得数据的使用权,但现实中,这样的交易成本会很高——由于交易双方对于数据价值的判断不同,所以谈判可能会非常艰难。在这种情况下,自愿的交易就很可能达不到有效率的配置。如果根据责任规则,允许数据使用者先使用数据,然后再根据第三方的估价让数据使用者向平台支付价格,那就可能会更有效率。说到这里,最近Linkedin正在和一家数据公司hiQ打官司,这个案子的判决结果应该会对未来数据产权的保护方式产生很大的影响,因此大家可以对此案多给予一些关注。

  最后,总结一下我的观点:(1)数据产权归谁,应该根据各种产权划分的成本收益状况来决定。(2)由平台拥有数据会比让产生数据的个人拥有数据更有效率。(3)有平台拥有数据产权可能会带来一些问题,但是这些问题未必会像大家想象的那么严重。(4)通过合理的产权保护方式,可以较好地解决由平台拥有数据产权所带来的问题。

  本文根据作者在2017年9月28日“竞争政策与反垄断法执法如何促进和规范数字经济的创新发展”研讨会上的发言整理而成

责任编辑:张帆 | 版面编辑:李丽莎
  1. 分享到腾讯微博
  2. 分享到新浪微博
  3. 分享到微信朋友圈
财新传媒版权所有。如需刊登转载请点击右侧按钮,提交相关信息。经确认即可刊登转载。
  1.  陈永伟(作者)
  2.  大数据时代
全选
新闻订阅:订阅后,一旦沙龙365登入更新相关内容,我们会第一时间通过发邮件通知您。
  1. 收藏
  2. 打印
  3. 放大
  4. 缩小
  5. 苹果客户端
  6. 安卓客户端
  1. 发送邮件
  2. 腾讯转发
  3. 新浪转发
    1. QQ空间
    2. 开心网
    3. 网易博客
    4. 豆瓣
    5. 鲜果网
    6. 搜狐微博
    7. 百度搜藏
    8. 谷歌书签
财新微信
沙龙365登入