黄卓 | 从大数据到大数据要素市场,中国面临多重挑战

题记:2023年3月28日晚,北大国发院【朗润•格政】第161期在承泽园及线上同步举行。本期活动由北大国发院和北大数字金融研究中心主办,特邀北大国发院特约研究员许宪春,北大国发院经济学教授、教育部长江青年学者李力行,北大国发院助理院长、长聘副教授、数字金融研究中心副主任黄卓,北大国发院长聘副教授张俊妮等多位学者共同研讨数字经济的新征程。本文根据北大国发院助理院长、长聘副教授、数字金融研究中心副主任黄卓的主旨演讲整理。

目前,数字经济已成为我国经济里一个非常重要的形态,而且是经济增长中最具创新动能的部分之一。

数字经济与人工智能需要配套的数据要素市场
 

二十大报告提出要“加快发展数字经济,促进数字经济和实体经济深度融合”。早期的数字经济更多是数字产业化,即通过数字技术来提供产品和服务,以及相关产业。下一阶段更重要的是用数字技术更好地赋能传统产业,帮助更一般性的产业转型升级、降本增效。

在数字产业化过程中,如何使不断产生的天量数据发挥出生产要素的价值,是一个重要问题。很简单的例子是产业数字金融。中国在消费数字金融和金融科技领域的发展处于世界领先地位,在消费端堪称颠覆性作用,比如在移动支付、个人借贷、消费金融等领域给我们提供了很大便利。但还有一个更大的领域——产业数字金融,也就是为数字化转型升级过程中的传统企业提供帮助,满足他们的融资需求。这给数字金融带来更广阔的空间。其中有代表性的是数字供应链金融。传统产业在数字化的过程中会产生大量数据,如何利用这些数据来降低信息不对称,改善风控,从而更有效地提供金融服务,是非常重要的问题。

数字经济里一个很重要的部分是人工智能。最近由于ChatGPT的出现,大家对人工智能的热情进入到非常狂热的阶段。比尔•盖茨说,ChatGPT可能是他这辈子看到的第二个重大创新。英伟达创始人黄仁勋说,ChatGPT出现的意义相当于手机领域的iPhone时刻。

ChatGPT也意味着人工智能(AI)进入到新时代。

第一,它标志着生成式AI时代的到来,AI能够根据已有数据生成新内容,创造新数据,背后是拥有海量数据和庞大数量参数的大模型。

第二,它是通用型人工智能,和以前聚焦于某个特定细分领域的AI不同,比如围棋领域的AlphaGo。

人工智能技术的背后总结下来就是三点:算力、算法、数据。这就对数据和数据要素交易市场提出了非常大的需求。

在需求方面,由于海量的参数和训练数据量是ChatGPT性能提升和不断进化的核心要素,ChatGPT等产品的出现使数据交易市场需求大增。根据OpenAI公布的数据,ChatGPT-3的参数量达1750亿,训练数据量已经达到45TB,ChatGPT-4参数量预测达到100万亿。供给方面,生成式AI在迅猛发展过程中会产生大量合成数据,会增加数据交易市场的供给。根据Cognilytica的数据,合成数据市场规模在2021年约为1.1亿美元,到2027年将达到11.5亿美元。

数据交易市场建设的挑战
 

下面分享数据要素交易市场目前面临的挑战。

第一个挑战,数据交易市场的法律法规仍不健全。

“数据二十条”和国家数据局是关于整个数据市场建设的顶层设计。数据立法方面有《网络安全法》《数据安全法》《个人信息保护法》等,这些法律仅聚焦数据的规范利用和安全隐私保护,但对于数据的流通交易过程以及准入、运行、监管等都尚未给出清晰的法律界定。例如,《数据安全法》对于数据交易双方和中介服务机构的权利和义务都未进一步阐明。

在这方面,建议借鉴传统要素市场的经验,健全数据交易市场的法律法规。因为传统要素市场的建设过程中有《土地管理法》《劳动法》《证券法》《促进科技成果转化法》等一系列相对成熟的法律,能够保证市场交易秩序,促进市场健康发展。

和传统生产要素相比,数据要素具有虚拟性、低成本复制性、主体多元性等特点,所以数据交易市场不能完全照搬传统要素市场的模式。但是我们还是可以在交易环节借鉴传统要素市场在交易法律方面的做法。比如在数据交易市场的运行机制方面,可以参考《证券法》,对数据交易市场主体的市场准入、业务范围、行为规范、法律责任、争端解决等内容给出清晰的法律界定。

第二个挑战,数据要素的收益分配机制不完善。

随着国家数据局的成立,数据交易市场的监督管理机制应该会更加明确。问题在于收益到底向谁分配,以及怎么分。

“向谁分”的难点主要由于数据要素与传统要素不同,确权比较难,很难界定数据的所有权归谁,导致收益分配的主体不清晰。“怎么分”的难点在于,在数据交易市场还没有充分建立时,我们很难对数据要素进行合理定价,这个世界性难题导致收益分配不够有效或不够公平。

在政策层面,“数据二十条”给出了一些指引,要“建立体现效率、促进公平的数据要素收益分配制度”。

关于“向谁分”的确权问题,“数据二十条”提出“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”。在“怎么分”的分配问题上,“数据二十条”提出要“完善数据要素市场化分配机制,扩大数据要素市场化配置的范围和按价值贡献参与分配的渠道。完善数据要素收益的再分配的调节机制,让全体人民更好共享数字经济发展成果。”

相应的建议是:

  1. 1.  在初次分配时构建公平高效有序的“三步走”制度。初次分配引导交易数据要素市场的有效配置,过程中能够帮助我们完善价格发现的过程,所以初次分配的市场构建至关重要。
     

  2. 2.  健全监管与激励机制相融合的二次分配制度。以数字税为代表的二次分配也很重要,因为数据的使用,尤其是公共数据的使用,天然具有外部性。在这个过程中,数字税能够发挥很大作用。对于不同性质的数据,征税是不同的。比如,有些数据是资源型,比如人的个人特征是不需要自己花费努力就能拥有的数据;还有一些数据是通过个人努力或投入才能产生的数据。另外,也可以根据数据外部性的程度来调整税率,有的数据对社会的正外部性更大,有的数据则外部性更小。
     

  3. 3.  建立激励社会主体参与的三次分配制度。
     

第三个挑战,数据交易市场的参与者不足。

数据交易市场的参与者包括数据提供者、数据需求者、数据交易平台、数据商,以及第三方专业服务机构。我国数据交易市场刚刚起步,场内交易不足,场外交易缺乏秩序。

“数据二十条”提出,要借鉴证券市场的交易所与券商相分离的经验,建立数据交易所与数据商分离的市场运行机制。但目前来看,我们的数据商和第三方专业服务机构的数量明显不足。北京、深圳、上海、贵州的交易所在陆续开展业务,但是目前引入的数据交易参与主体仍然较少。

针对这一问题,很重要的一步就是要结合多层次的数据交易场所建设规划,加快培育具备一定资质的数据商和第三方专业服务机构。在国家层面,要培育大型综合类数据商和第三方专业服务机构,主要服务国家级数据交易场所,能够在国内外各个地区和各个行业开展服务;在区域层面,要培育区域类数据商和第三方专业服务机构,主要服务区域性数据交易所,在一些特定区域以及特定行业里提供服务;在行业层面,则要培育行业类数据商和第三方专业服务机构。

第四个挑战,数据安全流通的交易技术不成熟。

数据本身的低成本复制性导致其容易发生泄露,出现数据安全问题。目前我国数据安全流通交易技术体系尚未成熟,还不能完全满足在实际场景下落地应用的需求。隐私计算技术等一些关键技术能够解决数据要素流通难题,最近几年发展迅猛,但是目前在落地方面还存在很大挑战。

应对建议有两点:一是推动多元前沿技术的融合互补,因为目前看来单一技术很难解决所有问题,需要各项不同技术进行同步探索,比如将隐私计算技术与区块链技术相结合。二是持续攻关核心技术。

在实践方面,今年国内数据交易所也开始做流通交易方面的尝试,特别是把技术、数据与场景及应用结合起来的一些尝试,非常令人鼓舞。例如,今年3月,上海数据交易所和大数据流通与交易技术国家工程实验室启动了国内首个数据交易链建设项目。这属于数据流通领域的基础设施建设。另一个例子是不久前深圳数据交易所与四川长虹集团、深圳数新科技以及中国信通院联合完成了国内首笔基于数据空间技术的场内数据业务合作,打造了我国首个智能制造领域的数据空间的应用案例。

这些新的实践为数据要素交易体系建设做出了非常好的探索。希望能够在今年或不久后看到更多类似的创新不断涌现。

整理:白尧 | 编辑:王贤青