以服务于中国广大创业者为己任,立志于做最好的创业网站。

标签云创业博客联系我们

导航菜单

在山上挖到水晶矿 挖石头视频

您可以点击收听本次讲座的录音:未来财富:大数据交易,探索数据变金之路,掘金财富新世界

亲爱的兄弟姐妹们,谈谈科技前沿。我是容晖。

首先感谢大家对上节课《未来财富:卖碳翁,发家致富碳交易》的喜爱。您的互动帮助更多喜欢深入分析前沿趋势的用户有机会看到。

今天,我们继续未来财富系列。

本期,我想和大家分享的是大数据交易,这将是一个开拓新财富的伟大创举,将载入史册!

以下内容,我们将围绕以下四点一起讨论:

1.大数据事务在做什么?

2.重新认识“数据”——数据从普通字符串变成闪闪发光的商品的原因和方式。

3.我们如何在数据点变金的道路上淘金?

4.如何构建大数据交易系统?

阅读建议

这篇干货是一篇近13000字的长文。为了便于阅读:

1.如果你只是想知道如何

么从大数据交易中赚到钱,仅需阅读第一和第三节。


2、如果你好奇心比较强,想了解点底层原理,补充阅读第二节。相信你看完后,拿这点东西就能唬住一堆菜鸟。


3、如果你是专业人士(参与数据交易所的建设和运营),第四节一定要看,专业不专业,就看你能掰出多少干货。


现在,让我们开启探索之旅吧。


01


大数据交易都在交易什么


正式开讲前,先做个调查。


你是不是收到过陌生的房产中介、银行贷款的骚扰电话?


是不是——你一定收到过。


他们是如何神通广大地搞到你的个人信息?有的陌生电话,甚至连你的姓名、生日都报得准确无误。


有太阳的地方,总有阴影。在我们所不知道的暗市里,有条数据黑产,黑客们会以各种高科技手段(比如入侵、欺骗等)窃取我们在各大网站上注册的个人信息,然后打包,在黑市非法买卖。


这种黑市交易是毒瘤,需要严厉打击。不过,它也向我们展示了,在大数据交易合法之前,数据交易的最初始形态——原始数据打包交易。


合法的大数据交易,在我国有两个阶段,不同阶段交易的商品有所差别


第一波,从2014年开始,以贵阳大数据交易所为代表的1.0版本。


贵阳很厉害,如此偏远之地,却能在时代趋势中抢得先机,硬生生的把犄角旮旯变成全国大数据的圣地,佩服之至。


交易,意味着市场化;市场化,意味着必须遵循经济规律。


经济的基础规律是供需关系。


当时大数据技术刚刚在国内兴起,大数据基础设施才开始搭建,可交易的数据非常少,市场的需求也不旺盛,整体供需处于萎靡状态。


这股大数据交易热潮没多久就退了,很多交易所处于荒废状态。即使连贵阳,从14年到19年累计交易额撑死了也才4亿。


4亿,是个什么概念?给你一个对照数据。


2015年4月,上海证券交易所一天的交易量就突破一万亿。5年4个亿,连上交所15年时的一天流水零头都不到,塞牙缝都不够。


当时,交易的数据商品五花八门,有原始数据包、大数据工具、人工智能算法模型、大数据解决方案、大数据分析报告等。


你不用去记这些名词,你只需要知道:当时,他们把整个大数据产业都搬到交易中心去交易。可即使这样,也没雄起。


时机未到,再正确、再努力也是枉然。


除了几家目前还勉强撑着运营外,大部分都成了先烈,倒在点石成金的路上。


第二波,刚刚兴起。从2020年4月,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》开始。


这次,大数据市场经过多年的培育逐渐成熟。


政务领域:政府对政务信息化建设非常重视,数字中国写入政府工作报告,国家十四五规划独立章节要求推动数据要素市场建设。


消费互联网:阿里、腾讯、美团、头条、小米等巨头的商业帝国不断扩张,从一线城市深耕下沉到四五线,连五环外的广大群众都被圈到移动互联网上。


产业互联网:海尔、格力三一重工等通过物联网、5G、边缘云计算,将整个产业链进行了数字化。


大数据产业异常蓬勃,水已经烧开,米可以下锅啦。


动作最快的是北京,今年4月初成立北京国际大数据交易所。名字里有“国际”两个字,规格和逼次那是杠杠得高,不愧是帝都。


我猜,上海肯定不服,上海市政府必然会有一翻新动作,阿拉作为超一线的国际金融中心,怎么可能在大数据交易上输了气势,交易所是金融中心最最重要的标志。


这一次,大家会交易什么?


这一波,交易集中在数据资产和数据资本


数据资产,就是把原始数据经过采集、存储、加工、确权、定价,形成最终可交易的数据商品。


打个比方,我要卖水果。


原始数据,就是挂在树上的水果。


采集,就是把水果从树上摘下来。


存储,就是丢到仓库里。


加工,就是把水果清洗、包装、装箱、打包。


确权,就是证明这个水果是我家的,拍个我家果园的照片,录个现场采摘的视频。


定价,就是这一箱水果我打算卖多少钱。


从枝头水果,到线上商铺里的商品,这就是数据从原始数据到数据资产的过程。


最终,数据资产会像商城里的商品一样,挂牌销售。


听到这里,你应当会问,如果数据资产是这样的,那在第一波的贵阳交易所里不是也在卖?


是的,没错,确实有这种数据资产的雏形在交易,但本轮最大的差异是在于数据的范围。这次,政府把政务公共数据拿出来交易,企业可以买这些原来基本上买不到的政务数据。


什么是政务公共数据?


比如,不动产数据(我们最常见的房产产权证)、水电煤数据、个人和企业的征信数据、医疗大数据、五险一金大数据、交通大数据、各厅局的开放数据。


银行、保险等金融机构对这些数据可是口水滴滴哒哦。


政务数据能拿出来交易,这在国际上也是少见的,所以,国家在推动大数据产业的发展上真的很给力,要大大的点赞。


大家也许会关心,这些数据的交易是否会导致个人隐私泄露?


请大家放心,这一轮交易机制是以数据安全为前提的。随着安全技术的发展,已经能够确保我们在保护数据私密性的前提下安全使用,不仅仅是传统的脱敏、脱密这种初级阶段技术,详细机制我在第四节中会专门介绍。


数据资本,是指用金融化工具把数据资产进行包装,变成数据金融商品。比如数据抵押、数据信贷、数据期权期货等。


这是非常具有创新性的,未来会成为数据交易的主要市场。


怎么理解?


假设你有一家企业,你需要找银行贷款,银行要求你提供担保物。


最开始的时候,银行要求必须是实物资产,比如房产、设备。


后来,无形资产也可以,比如知识产权、专利、合同等。


未来,你可以拿企业的经营数据充当抵押物,银行根据这些数据,进行评估,授予贷款额度。


这是不是很神奇?


其实,现在阿里、京东已经在这么做,只不过,他们只能基于自己平台上的数据,为自己的商家提供无担保小额贷款。


但,数据金融商品可以让你突破平台的限制,实现在交易所挂牌后,所有商业银行和互联网金融企业为你提供服务,这是金融科技的一大创新,想象空间无限。


无论是实物资产、无形资产,还是数据资产,能够用来抵押贷款,本质上是你用这些资产给自己做了增信,让金融机构对你的信用有很清晰的界定,可以用金融公式计算出风险值。


金融的本质是风险,只要风险可量化,那对于金融机构来说,数据资产与实物资产又有何差别,甚至比实物资产还更方便管理。


一个商品无论多么平凡,只要经过金融之手的点金,就会变成魔幻宝物。就如灰姑娘,只要穿上水晶鞋,立马摇身一变,成为高贵的公主。


小结一下:


新型的大数据交易所,主要交易数据资产和数据资本。


数据资产是基础性的商品,数据资本是创新的数据金融商品,想象空间巨大,会成为未来交易的主要市场。


02


重新认知“数据”


前面我们讲了数据资产、数据资本,我们继续往下挖一挖,看看能挖出啥宝贝。


大家有没有想过,为什么数据可以拿来交易?数据如何从普普通通的字符串,变成金光闪闪的商品?这般魔幻的操作是如何点石成金的?


要看懂一个事物,必须回溯到源头,考察它诞生的背景和成长历程。


①数据简史


在回答这些问题前,让我们先从结绳记事聊起。


上古无文字,结绳以记事。


结绳记事最早起源于“结绳记路”。


远古社会以采集狩猎为生,在茂密的原始森林里,先祖们为了避免打到猎后找不到回家的路,就在岔路口的树枝拴上一条绳子,在地上摆一条,做标记,打完猎后,顺着这些绳子记号回家。


后来,人们学会了织网,打到的猎物越来越多,无法一次性吃完。当时没有食品保藏技术,全部杀了会坏掉,于是就圈养起来。养的动物多了,就需要计数,几头猪几只羊,怎么算呢?


“结绳记路”就发展成“结绳记数”。


用绳结打成猪的形状来表示猪(象形文字),羊就打成羊形的绳结。再垂下一条绳子,在其上也打结,一个小结代表一只,一个大结表示一群。只要规定好一群是几只,就可以通过结绳,知道你家几头猪,我家几只羊。


先祖们发现这个方法挺好用的,就把它扩展到记事、日历上,再结合一些简单的抽像图形,“结绳记事”就逐渐成为一种成熟的记录工具,用于记录部落的神话传说、风俗习惯、重大事件、契约合同等。


图:16世纪被西班牙人所覆灭时,印加帝国仍在使用的结绳记事系统


结绳记事,能记录的信息很少,也麻烦,还容易忘记,有时随意打个结,过些天再来看就不知道代表啥意思。


后来,为了满足复杂交流和记事的需要,人们就把象形的绳结刻在石头、陶器、龟甲上面,就成为象形文字的雏形。


随着象形文字逐渐成形,文字就被创造出来。


神话传说是这么记载文字发明:“昔者苍颉作书,而天雨粟,鬼夜哭”,当文字被创造出来的时候,天降下粟米,鬼在夜间哭泣。这是多么震撼的历史场面。天因文字的发明而降下粟米以赐表彰,鬼则因惧怕人们学会文字后,作疏文弹劾它们,在夜间哭泣。


真乃人神鬼三界共鸣也。


文字作为信息的载体,让信息的记录、传承、传播效率得到飞速提升,开启了人类文明的发展之路。


从上面的历史演进,我们可以看出,无论是结绳记事,还是文字,都只是信息的不同载体罢。


人类社会文明的发展史其实就是一部信息史。


自古以来,人们一直在收集、存储、传递、分析信息,并依此决策。


战场上,孙子说:“知己知彼,百战百胜”,这是收集和分析敌我双方的信息。


庙堂上,作为秦始皇相父的吕不韦讲:“奇货可居”,这是从信息中洞见精准而独到的投资机会。


生产上,三百六十行,行行有祖师爷,这是知识的传承。


商场中,南货北卖、低买高卖,这是利用信息的不对称。


生活里,偏方、妙招、小技巧、鸿雁传书、风花雪月,这是信息的总结和传递。


信息无处不在,无时不在。


信息学中,信息分成四种类型:零次信息、一次信息、二次信息、三次信息。


如何理解?


有一个知识金字塔模型,能够帮助我们直观理解。


最底层是真实世界;第二层是原始数据(零次信息),是对这个世界的抽象记录;第三层是信息(一次信息),是经过分析处理的数据;第四层是知识(二次信息),是有条理、有逻辑的信息;最上一层是智慧(三次信息),是实践的真知。


图:知识金字塔


通过这个知识金字塔模型,我们很清晰直观地看到无论是信息、知识,还是智慧,其实本质上都是“数据”,只不过数据加工的程度从粗到细,从形象到抽象。


“数据”是信息的基因。


“数据”,翻译于英文的“data”。据说,“data”这个单词最早出现在17世纪40年代,不过,它当时的意思并非今天我们讲的“数据”,而是“给予”之意。


直到1946年,世界上第一台计算机诞生后,“data”才变为“数据”,用于表示“可传输或储存的计算机信息”。


我们日常刷抖音看的短视频,李佳琦的直播,喜马拉雅的音频,微信朋友圈的文章、表情和图片等等都是数据。


今天讲的是大数据交易,前面讲了数据,那这个“大”又是怎么来的?


“大数据”这个概念,最早出现在1980年,由著名的未来学家托夫勒在其所著的《第三次浪潮》中提出,他非常热情地将“大数据”称颂为 “第三次浪潮的华彩乐章”。


然而程序员们普遍认可的大数据技术是起源于谷歌的“三驾马车”:GFS(谷歌文件系统)、MapReduce和 BigTable。这三篇论文分别发表于 2003年、2004年和 2007年。


2011年5月,全球知名咨询公司麦肯锡旗下的肯锡全球研究院(MGI)发布了一份报告——《大数据:创新、竞争和生产力的下一个新领域》,这是专业机构第一次全方面的介绍和展望大数据。


2012年1月份,在瑞士达沃斯召开的世界经济论坛上,发布了《大数据,大影响》(Big Data, Big Impact) 报告,宣称:数据已经成为一种新的经济资产类别,就像货币或黄金一样。——划个重点,大数据交易的源头就是从这里开始的。


两个月后,奥巴马政府在白宫网站发布了《大数据研究和发展倡议》,紧接着又宣布将向大数据领域投资2亿美元——这是大数据技术从商业行为上升到国家科技战略的分水岭。


2012年3月23日,美国将数据定义为“未来的新石油”,大数据技术领域的竞争事关国家安全和未来。


咱们国家较早研究大数据的是百度,毕竟百度和谷歌是同类型的企业,但百度起个大早,却赶了晚集,在大数据市场,永远落后于阿里。


政府层面则是2014年,“大数据”首次出现在《政府工作报告》中。2015年,国务正式印发《促进大数据发展行动纲要》,明确推动大数据发展和应用。


当前,大数据在应用层面,主要还是集中在知识层次,未来,大数据和人工智能的化学反应,会以智慧形式爆发出无限能量。


回溯历史,能让我们知晓它从何而来,走向何方。


从结绳记事到大数据,以数据为视角,人类历史可以划分成四个阶段:


第一阶段:结绳时代天地鸿蒙初开,万物未有名。人类在山河湖海林草间与自然万物搏斗求生存,为万物定性赋名,结绳以记之。懵懵懂懂,灵光初开。


第二阶段:文字时代。苍颉造字,天雨粟,鬼夜哭。文字是人类最伟大的发明之一,文明构建在文字之上。


第三阶段:数字时代。20世纪40年代,克劳德·香农和阿兰·图灵天才般地创想,将数据编码于“数字原子”中——今天我们称为“比特”。自此,数据可以被数字化,数字时代正式开启。今天,网络已经成为空气般的存在。我们结网而生,无网络,不生活,特别是对于00后网络原住民来说。


第四阶段:智能时代。随着大数据、人工智能、物联网、区块链、VR/AR等新型技术的跨越式发展,一个万物互联的智能时代即将到来。我们将迎来由我们自己创造的新物种——机器人,正如我们迎来我们的孩子一样,我们将与机器共生存。另外,我们也将迎来Metaverse,中文翻译为元宇宙,这是个真实的虚拟世界,在那里你分不清真实与虚幻。我们会与两千年前的庄子共鸣:到底是庄周梦蝶,还是蝶梦庄周?


数据,在数字时代和智能时代,都是基础元素。


没有数据,生活将黯淡无光。


②从数据走向数据要素


恭喜你,看到这里,数据为何可以拿来交易的答案呼之欲出啦。


我们已经了解了数据的前世、今生和未来,我们也知道了数据是数字时代和智能时代的基础元素。


交易,属于经济学的范畴。


基础元素,翻译成经济学的术语,就是要素。


要素,意味着什么?


我们熟知的土地、人才、技术就是生产要素。


大家对土地财政都知道吧,简简单单的土地拍卖就可以赚到以亿为单位的财政收入,更别提在土地之上开发的房产。现在的房子,你买得起吗?


数据,在数字时代和智能时代,已经成为一种新型的生产要素。


数据交易的底层密码,就在于数据的要素化。


数据从普普通通的字符串,变成了数据要素,基于数据要素,我们可以开发出各种各样的创新型数据商品。


原始数据交易,就像土地拍卖。


数据资产,就是基于土地开发的房产。


数据资本,就是房产金融产品,比如抵押贷、次级贷、租金收益权ABS、信托REITS等。


数据要素还可以和其他要素叠加,产生化学反应,创造出更多新的商业模式。


③数据的点石成金之路


前面,我们已经回答了数据为何可以拿来交易,也弄明白了数据是如何从普普通通的字符串变成商品,接下来,我们来解密,数据是如何点石成金的。


数据的点石成金之路,就是数据价值化之路。


价值化分四步走:原始数据——数据资源——数据资产——数据资本。


怎么理解?


这四个概念,只有数据资源是新的,其他三个前面我都讲过了。


数据资源,是指将原始数据进行采集、存储、加工治理,形成可识别的数据。如果数据在多个系统中,还要进行数据血缘分析,以确定一数一源。


我们还是用前面提到的卖水果例子再走一遍。


原始数据,就是挂在树上的水果。


数据资源,包含采集、存储和加工。采集就是把水果从树上摘下来;存储就是丢到仓库里;加工就是把水果清洗、包装、装箱、打包。为了卖出高价,我们会对水果进行溯源,比如阿克苏苹果、新疆香梨。这个溯源就是要确定一数一源。


数据资产,包含确权和定价。确权就是证明这个水果是我家的,拍个我家果园的照片,录个现场采摘的视频;定价,就是这一箱水果我打算卖多少钱。


数据资本,就是用金融化工具,变着花样卖水果。比如,礼券、预售、团购等等。


这四步走,看起来简单,但有很多细节,比如数据的权属到底归谁,如何合理定价促进市场繁荣。由于太专业,我把这些技术问题留在最后一小节专门探讨。


Bingo,我们已经破解了数据交易的核心密码,接下来,要进入激动人心的彩蛋时刻。


在数据点石成金的路上,我们如何淘金?


相信,你不会错过,快来砸金蛋吧。


03


淘金大数据交易


当前的大数据交易所,如贵阳、北京、上海,都是个交易撮合平台,这一点和淘宝天猫的买家卖家撮合形式是一样的。


个人和企业都可以参与交易,由于数据商品使用的特性,买家一般是企业。


如何从大数据交易中赚到钱,盈利模式应当很多,我把我想到的五种列一下,抛砖引玉。


第一种,数据经纪人


只要大家买卖和租过房,对房产经纪人一定不陌生。他们对房价波动、周边房源情况、买家卖家心理,都非常了解,能快速促成交易。


数据经纪人,类似于房产经纪人。


我们一直说大数据行业,这里是有两层含义:第一,大数据本身是一个新的行业,和房地产一样;第二,大数据服务于传统行业,比如大数据服务于房地产行业。


所以,严格来说,应当叫做某某行业数据经纪人。


这要求数据经纪人,不但要懂得大数据领域的相关知识和市场动态,还需要对传统行业业务非常熟悉,这样,你才能服务好行业客户。


比如,金融市场的数据经纪人。如果你没有这个行业的背景,你怎么可能知道个人征信、五险一金缴纳数据、天气预报、突发事件、政策波动、行政处罚等等都是他们需要。


没有金刚钻就不要揽瓷器活,要成为数据经纪人,就要新旧行业通吃。


第二种:中间商,赚差价


有一句广告大家一定都听过——没有中间商赚差价。


我必须告诉你的真相是:只要市场存在,中间商就必然存在。


不要以为现在互联网发达了,大家靠百度就能找到想要的信息。


当你在海量信息中寻找时,你确信只靠百度就OK啦?这就好比,给你一艘独木舟,让你在茫茫大海里找沉船宝藏,你是什么感觉?


简单粗暴的靠原始信息的不对称赚钱模式,早就过时了。


新一代的中间商,在海量数据之前,会使用人工智能技术,对信息进行萃取提炼,变成智慧决策。


股神巴菲特,年化收益20%持续了50年,膜拜吧。


但,我告诉你,世界上最赚钱的股票投资公司是文艺复兴科技,从1988年到2018年30年的年平均增长率高达66%。


这是家量化基金公司,他们家的看家本领是利用大数据+人工智能,搜集和分析海量信息,找到那个不对称间隙,进行高频交易。


我们买个股,卖个股,最快也要一两分钟吧,文艺复兴科技的高频能做到在6400万分之一秒内交易一次。


我的天啦,咱们眨下眼睛,抖一下手,人家已经交易了几亿次。细思极恐。


大话西游》曾说:“妖,就要有妖样”。做中间商,就要有中间商的样,不能简单粗暴地倒买倒卖,一定要加工,找到黄金信息的不对称间隙,提供增值服务。


第三种,数据处理者


最近,关于IT是新生代农民工的身份,终于由国家人社部官方实锤了。


想想也对,修电脑的和修水管的会有多大差别,都是技术活;码农和菜农又有多大不同,现在种菜、养猪哪一行不是高科技。


以后,过年讨薪的时候,可以用“不要拖欠农民工工资”这个强有力的理由要求老板发薪水啦。


数据处理者就是IT工作者,妥妥的新生代农民工。


他需要参与到数据的采集、加工治理过程,这虽然有那么一点点技术含量,但确实是苦力活,靠人力堆积,以时间换收入。


要成为数据处理者,不但要懂数据库技术,会用数据治理工具,还要对行业业务有一定了解。这样,才能按客户要求把数据治理好。


这个工作,现在业内基本都是外包。所以,如果你感兴趣,可以在交易所接单。


第四种,数据服务供应


这种模式高端,对技术要求高,不是一般人能接得住的,所以是个高价值、高利润的行当。


比如,算法模型服务。你在人工智能领域有很深的造诣,你有自己的算法模型专利和产品,那你可以拿到交易所来卖服务。


现在的数据交易所,都会提供应用运行环境。买家可以在交易所里买到数据,然后再买你的算法模型,在运行平台里跑出结果,把结果拿回去。


目前已知的服务有:算法模型、算力服务、云资源服务、安全服务、可视化服务、统计分析报告等。


第五种,数据金融产品买卖


由于政策法规尚未对数据金融产品的交易制定明细规则,所以,这一块还处于探索阶段。


比如,国家允许交易哪些数据金融产品?交易机制是什么?是放在大数据交易所,还是在期货交易所?所有这些,都要先做好顶层设计,并平衡好各方利益。


这实在太新了,但正因为是新大陆,所以才会遍地是黄金。低垂的果实,随手摘。


我一直很看好这块。只有把数据金融化了,才能放大它的价值。


没有金融化的数据,虽然已经从蛋里孵出来了,但充其量只是丑小鸭。数据金融才是真正的天鹅。


高手都在民间。如果你有新的盈利模式,欢迎在评论区留言,咱们大家一起交流碰撞下。我很想知道到底能头脑风暴出多少种来。


04


如何构建数据交易体系


在读这一节之前,友情提醒,非专业人士勿轻易翻看,专业术语和技术会让你晕头转向。


如果以下内容,你能坚持住五分钟,将打败全国80%的专业读者。


大数据交易体系的构建,和我上一讲《未来财富:卖碳翁,发家致富碳交易》中碳交易所的构建有很多相同之处,两篇可结合着看。上一讲讲过的内容,这里不会再重复讲。这次,我们换一种新方式。


如果让你设计一个全新的大数据交易所,你会怎么做?


我会先看看业内已有的交易所,把它们拆解,结构化地思考一下,都包含哪些组件,怎么组装的。然后,再考虑一下,我们新在哪里?


对标+抄作业+微创新,永远是最正确的捷径。


通过对标研究贵阳大数据交易所、上海证券交易所和上海期货交易所,大致上,建设一个大数据交易所可总结为“1134工程”,即一场所,一模式、三条链,四体系。


一场所,即大数据交易所。


你得有一个高大尚的大楼,毕竟这是数字时代和智能时代财富的象征地。


交易所的定位非常关键,比如贵阳定位大数据市场撮合、北京定位于打造国内领先的数据交易基础设施和国际重要的数据跨境流通枢纽、上海定位区域数据流通生态的平台型企业。


交易所职能,除了要考虑类似上海证券交易所那样的标配,如交易中心、登记结算中心、资产评估中心、交易监管中心之外,还必须考虑到大数据的特性,配置相应中心,比如数据加工中心、数据应用服务中心、创新中心。


前面讲过,本轮建设的新型大数据交易所与传统的大数据交易所最大差别:1、数据资产的范围将政务公共数据涵盖进来;2、积极探索数据金融化。


由于这两个新特征,所以,新型大数据交易所不能简简单单做数据撮合生意,必然要求衍生到整个数据链条,特别是交易后的应用。


政务公共数据,除非明确规定可以自由下载,否则绝大部分是不允许外流的。交易后,只能在场内使用。这样,也有利于数据监管,防止在流通过程中对个人、社会和国家产生的安全影响。


然后,还要考虑交易规则。包括,交易主体、交易商品类型、交易时间、交易模式、收费模式、是否会员制、争议仲裁、登记结算、交割等一系列的运作机制和管理办法。


一模式,即商业模式。


商业模式,就是要构建一个让各参与方都能共赢的交易结构。通过商业模式创新,促进整个大数据产业更安全、更健康、更快速发展。


三条链,即数据链、资金链、人才链。


数据链,是以数据为维度的价值化链条,即采集——存储——加工——确权——赋权——定价——登记——交易——应用。


如何理解?在第一节里,我举了卖水果作为例子。如果整体概念还没建立,可以复习下前面内容。


资金链,除了建设和运营交易所的资金结构,更重要的是维持大数据产业生态健康运行的资金链条。比如科研专项基金、知识产权基金、协同创新基金。这一点,上海大数据交易中心有配套提供产业基金,理念比较先进,不愧是专业搞金融的。


人才链,主要是指大数据从业者的培养,包括了数据提供者、数据使用者、数据开发和服务者、数据经纪人、数据资产管理者、数据平台运维者、数据安全运营者等等。这个需要校企合作,并且国家从职业认证层面予以支持。


四体系,即政策法规体系、安全保障体系、运营运维体系、技术体系。


政策法规体系,主要是指政策和法律层面对大数据交易的支持。最主要的三个是《网络安全法》、《数据安全法》,以及8月20号刚刚正式颁布的《个人信息保护法》。还有的就是数据交易平台建设标准,比如《信息技术 数据交易服务平台 通用功能要求》。


安全保障体系,是以数据为中心,提供数据全生命周期的安全保障,同时,还要考虑交易过程中的风控管理,做到事前防范、事中控制、事后监管。


运营运维体系,运营就是如何采用创新的营销模式和管理方法推动整个大数据交易所的交易繁荣,运维主要是对软件平台的日常运维,确保实时在线和正常交易。


技术体系,就是整个交易链条上各环节需要用软件平台来支撑。


标配:交易平台、登记结算平台、资产评估平台、交易监管平台、数据应用运行平台。


选配:根据交易所定位、职能和经营范围,数据链上其他环节所对应的平台,也可以纳入考虑,比如确权管理、采集工具等。


以上就是整个大数据交易所的宏观架构。


下面,我详细讲讲与传统交易所差异最大的三个关键点:数据安全、数据确权和数据定价。


第一,数据安全


数据安全不仅仅只是个人隐私问题,更是关系到国家安全。


前一段时间,滴滴趁着七一建党舆论盲区的时候,静悄悄地偷偷跑到纳斯达克上市,结果国家网信办直接对滴滴启动国家安全审查程序,后来更是下架了滴滴App。


为什么一家互联网企业在美国上市,国家会有这么严重的惩治?当时阿里巴巴在纳斯达克上市,可是即敲锣又打鼓,还大肆宣传,也没见国家啥动作。


这主要是因为,滴滴经营的数据确实涉及到国家安全。


你打个车,怎么就涉及国家安全啦?


一个人打车确实最多就关乎个人隐私,但如果全国5.5亿乘客,每天的轨迹、每天十万量级的路况事件信息、对全国道路及周边建筑物的准确率高达95%的地图信息采集,这些数据,不就可以在虚拟世界中把中国实时地真实构建出来。


什么地方有什么单位,多少人在这里上班,大概几点是高峰期,这些人住在哪里,经常去哪些地方。滴滴可以通过人工智能技术分析出来。


滴滴在15年的时候,就曾出过一份国家各部委的出行规律分析报告,大家可以网上搜搜,神秘的部委在滴滴面前被透视得精精光。


《孙子兵法》说:“知彼知己者,百战不殆”,知彼知的是什么?路网、核心机构和单位的分布点、人员流动情况、车辆运输轨迹等等,你看看,拿到滴滴数据是不是就搞定了这部分情报。


要在纳斯达克上市,必须接受美国证监会SEC的审计底稿。这就意味着,人家说我要审你的原始数据,你就必须乖乖地端出来给人家审。


交通运输部一直要求对接滴滴的出行数据,但滴滴藏着掖着,至今都还未给出完整的运营数据,而上个市,美国可能全拿到了。资本的力量确实是无穷大的。


现在,你能理解为什么数据安全,涉及国家安全了吧。


在大数据交易中,对数据安全的重要性提高到什么层度都不为过,这也是我把数据安全放在最开始讲的原因。


技术上,传统的脱敏、脱密已经无法满足当前数据安全的监管要求,现在最新技术主要有两种方案:数据可用不可见、数据可算不可识。


数据可用不可见


通俗点讲,就是隔壁老王找你借包盐,大家都知道隔壁老王是要严防的,所以你没让他进房间,让他在门外等着,你自己从厨房拿包盐,在门口给隔壁老王,给了他之后,立马关门。隔壁老王只能拿到他要借的盐,别想以借盐为借口进入你家,进来之后那可真是防不胜防啊,所以,不让他进来。


技术方案主要有安全多方计算、联邦学习、可信执行环境、数据沙箱等。阿里最近一直在推的蚂蚁链摩斯多方安全计算平台就是数据可用不可见,在金融大数据领域有实质性的落地应用案例。


数据可算不可识


打个比方,这次隔壁老王找你借个纸箱,你家的纸箱是当初网购时的包装盒,太大了,你实在没办法自己拿出去,那让老王进来吧。不过,在隔壁老王把纸箱拿走之前,你把纸箱上贴的物流单据给撕掉了,这样,纸箱就没有你的特征信息,别人不会从这个纸箱识别出你。 用专业术语讲,就是数据可证去标识。


数据可用不可见是最新的技术,因为用到密码学、区块链技术,所以性能上会比可算不可识慢,如果需要大数据高频计算,建议用可算不可识,毕竟直接对数据操作的性能优势摆在那。


另外,随着8月20日正式颁布《个人信息保护法》,在数据交易过程中,涉及到个人信息相关的数据,必须严格准守这个最新的法律。


第二,数据确权


什么是确权?


《圣经》中有个故事: 两妇女为一个孩子的归属发生争执, 都说自己是孩子的亲妈。争执不下, 就请所罗门国王判决。所罗门国王说: “既然双方都想要这个孩子, 那就将孩子劈开, 一人一半”, 一个女人苦苦哀求不要砍,另一个女人同意。 这时,所罗门国王说, 那个苦苦哀求的女人才是孩子的亲妈。


判定亲妈,这就是确权,确定权益/权利归属谁。


数据有哪些权益/权利,到目前为止法律界都还没有明确的界定。


想想看,如果数据里包含个人信息,那能不能拿来交易?交易收益归谁所有?


前面,我们讲数据安全的时候,提到不仅仅关乎个人隐私,也关系到国家安全。


那么,数权(一个新名词,法学界用来定义数据权益/权利)与人权、国家主权是什么关系?


数据,有两个本质特征:非竞争性和不可分离性。


非竞争性就是说,数据可复制多份,你用你的那份,我用我的这份,大家互不影响。不像物品,只有一件,卖给你了,我就没了。


不可分离性是讲,你拿我的数据去用,可能会对我产生影响。啥意思,我把车借给你,你闯红灯,我被罚钱扣分。


数据交易后,你虽然买走了我的数据,但我这还有副本,那我能用吗?我要付钱给你吗?你用的过程,如果对我产生影响了,要赔偿我吗?我能怎么办?


一切的一切都还没有答案,数权实在太新了,新到现在的法学界一直吵个不停,没定论。


那难道我们就束缚于此,无法前行?


既然数据确权在法律上难以推进,那还不如先推动数据交易,用数据交易市场的繁荣反过来推动确权。


只有数据价值实现了,数据确权才有意义。


经济学泰斗、诺贝尔经济学奖获得者科斯告诉我们,只要一件物品的产权得到清晰界定,就可以进入市场流通交易。


产权是指合法财产的所有权,这种所有权表现为对财产的占有、使用、收益、处分。


那么,在数据交易市场,我们只要把数据所有权和使用权界定清楚,就可以先交易起来,其他的权益/权利慢慢等待法律明晰。


数据所有权和数据使用权的交易,是数据交易的底层逻辑。


如果我买走的是所有权,那么一旦被我买走,对不起,即使你有副本,你再使用数据用于盈利,就是违法。


如果我买走的只是使用权,那你想货卖三家,我也管不着,只要我这份能用就可以。


所以,从法律难易程度来说,买卖数据使用权是最现实的大数据交易形式。


第三,数据定价


提问:数据按斤怎么卖?


传统的资产价值评估理论主要包括市场法、收益法、成本法、专家评估法。


但这些理论用在数据资产上,有点不大好用,因为数据资产同时具备无形化和虚拟化双重特性。


数据到底该怎么卖,卖多少,现在,大家都是摸着石头过河,有待学界提出估值模型。


我相信谁的模型能成为主流,那他绝对可以拿诺贝尔经济学奖。


我们前面讲过大数据交易的主要商品是数据资产和数据资本,其实这只是表面形态,本质上,数据交易的是权益,主要是所有权和使用权。


权益为何可以拿来交易,请大家看我上一讲《未来财富:卖碳翁,发家致富碳交易》中对碳权的分析,这里我就不再重复。


大家只要知道,本质上,数据交易和大宗商品的金融衍生品/资产证券化交易没什么两样,只不过标的物一个是数据资产,一个是实物资产或无形资产。


基于我们在金融领域的实践经验,可借鉴的定价机制有五种:第三方平台预定价、协议定价、拍卖定价、按次计价(VIP会员制)及实时定价。前三种定价适用于所有权,后两者常用于使用权定价。


现在,大家再来琢磨琢磨,数据按斤怎么卖!


05


总结一下


总结一下,今天,我们长文干货讲解了大数据交易,精华如下:


1、大数据交易的商品主要是数据资产和数据资本。


2、数据之所以可以拿来交易,底层逻辑是数据从普普通通的字符串,变成了金光闪闪的数据要素。


3、人类文明史可以划分成四个阶段:结绳记事时代、文字时代、数字时代和智能时代。数据是数字时代和智能时代的基础元素。


4、基础元素,用经济学术语来表述就是要素。数据元素就是数据要素,与土地、人才、技术一样,是推动市场经济发展的新型生产要素。


5、数据的点石成金之路就是数据的价值化之路,四步走:原始数据——数据资源——数据资产——数据资本。


6、数据金融化,才是数据要素市场的终极形态。


7、个人或企业参与大数据交易的主要模式有五种:数据经纪人、数据中间商、数据处理者、数据服务供应、数据金融产品买卖。这是抛砖引玉,高手在民间,你的模式是什么?


8、构建大数据交易体系即“1134”工程。一场所(交易所)、一模式(创新的商业模式)、三条链(数据链、资金链、人才链)、四体系(政策法规体系、安全保障体系、运营运维体系、技术体系)。


9、数据安全是交易的前提,不仅仅关乎个人隐私,还关系国家安全。在技术层面,目前主要采用“数据可用不可见”和“数据可算不可识”技术方案。


10、数据确权,目前法律界正在积极探索。从交易层面,主要是所有权和使用权的界定。


11、数据定价,实操层面有五种模式:第三方平台预定价、协议定价、拍卖定价、按次计价(VIP会员制)及实时定价。前三种定价适用于所有权,后两者常用于使用权定价。


最后,终于到最后了,能坚持到最后的,都非常人,给你点个赞!


最后,祝大家在数据点石成金的路上,挖到金矿,财源滚滚,财富翻翻。


下期预告:数字黄金——比特币和区块链技术。


谢谢收听收看,下期再见!