
曩昔数据职业像是一座座孤岛,不同类型或来历的数据之间难以打通交融。那么,该怎么树立它们之间的桥梁呢?
马云曾在一次讲演中说道:“人类正从 IT 年代进入 DT 年代”。
在数据年代里,咱们的衣食住行,乃至一举一动都会发生很多数据,而数据代表着价值。当时,各大公司纷繁布局数据工业,数据的价值遭到社会各界史无前例的注重。那么,数据职业存在着哪些机会和应战呢?
从事数据职业十余年的榕树网络基金会主席龙凯表明,数据职业正处于大变革时期,曩昔数据职业像是一座座孤岛,不同类型或来历的数据之间难以打通交融。职业里有以银联为代表的消费类数据,还有三大运营商为代表的方位轨道数据、上网行为数据,以及各互联网巨子和超级 APP 为代表记载海量用户线上行为的数据等,这些不同超级数据源之间互相相关,但又彼此独立。
为了打破数据职业之间的固有隔膜,就需求一个定位独立、易于信赖的中心第三方来做数据交融,进步数据利用率,发掘更大的价值。致力于打造数据价值链网络的
榕树网络
,扮演的便是中心衔接方的人物,其经过对数据的衔接、办理、交融为用户供给数据服务。做数据交融的“后厨”
据龙凯介绍,榕树网络期望打造一个依据大数据的人工智能工业链渠道,一个让一切数据参加方能够深度交融和协作的生态共同体。而完结这个生态共同体需求三个进程:数据链接,数据办理和数据交融。
数据衔接是榕树网络的根底,担任将各种数据源接入到榕树网络中。与一般的单一数据源衔接不同,榕树网络经过衔接不同数据源,然后针对个别能够收集交融其在多个场景发生的数据,如运营商数据、金融机构数据、电商渠道数据、移动互联网数据等,然后得到更为全面立体的数据。
数据办理也叫数据加工,经过对杂乱数据的清洗、收拾、标签化等到达数据精简化、标准化的意图。如运营商非结构化的网上阅读日志,电商半结构化的用户点击行为等,都能够经过数据办理清洗成结构化数据,然后愈加容易地将数据标签化。
数据交融是经过对加工后的数据进行交融与建模,并得到全新定论的进程。如某个别是同享单车 APP 重度用户,近期忽然开端重视婴幼儿用品,经过数据建模,或许计算出该个别购买轿车的志愿。
数据服务是将上述三步所得到的数据,规划成数据产品,对外供给服务。例如供给用户兴趣爱好查询服务,特定人群圈定服务等。龙凯描述这个进程就像是一个“中心厨房”的概念:“本来的数据职业就像是紊乱的后厨,散乱的数据便是散乱的原材料,很难炒成一盘好菜。咱们就像是厨师,担任不同来历的菜品梳理好,洗好择好,再做出不同口味的菜品放到前台,咱们各取所需。”

大数据与区块链的磕碰
数据职业为何多年来一向处于分裂状况?归根到底仍是由于各个把握数据源的企业之间的不信赖,关于数据之间的真实性和是否对等性存有质疑,以及数据交换之间尚无清晰规矩。即便呈现像榕树网络这样第三方做数据交融作业,仍不能确保彻底信赖。直到区块链技能的呈现,让榕树团队找到了处理方案,区块链的一致机制和不行篡改性完美地契合了这一痛点。
榕树网络经过契约联系构成智能合约或智能财物,区块链成为数据价值链中的一个全能账本。链上记载确保任何数据无法被非合规仿制、截流、沉积或修正,数据价值不存在被盗用及弱化危险,然后极大降低了数据源对榕树网络的信赖本钱。另一个优势便是打破打破地缘和时刻约束,进步各参加方的透明性、延展性和功率,促进发生更大的数据流动性和更高的数据价值。

在数据衔接层面,为确保让各大数据源的接入方和运用方定心的运用源头数据,榕树网络将构建数据源点评系统,并将进入点评系统内的数据源评分成果实时上链。数据署理方或数据的运用企业能够实时检查各类数据源的评分等级并据此挑选接入的数据源,数据源也能够依据自己的评分不断的去优化完善本身的数据精准度。

在数据办理层面,榕树网络经过社区达到一致的数据办理标准,来发布和运营数据办理众包渠道。数据方能够将待处理的数据包发布到渠道上,经过众包的方式发布使命,由社区参加办理。数据源方付出数字财物给众包办理参加者。渠道会将数据办理的成果保存到区块链上,确保各方利益。“相当于咱们把巨大的数据整理使命分拆成一个个很小的使命分发给社区成员来做,完结之后会有奖赏。”龙凯解释道。
在数据交融层面,榕树网络则树立联盟链予以处理。不同于榕树网络公链,联盟链具有部分去中心化、可控性强、交互速度快等特征。榕树联盟链为成员共有,各节点散布在各成员中,易达到一致,有利于区块链的高效运转和更新迭代。联盟链中心数据限于成员及其用户按权限设置可见,能够满意特定场景的隐私性需求。
数据安全与隐私维护
谈及数据,总绕不开数据安全和隐私维护问题。龙凯告知动点科技,在授权办理方面,榕树网络开发了互信通的服务,用户上链之后,自己的信息被整合运用或许被查询调用的时分都会收到告诉,经过自己答应之后,信息才能够被运用。关于隐私维护,榕树网络运用一种特别“脱敏”技能。原始数据中含有个人隐私信息的,比方手机号、身份证号等,会经过单向加密算法它变成一个不行破解的 ID ,在这种情况下,隐私信息便不会被泄露了。不仅如此,为了契合 GDPR 的要求,榕树网络还需求确保公民的“被忘记权”不被侵略。
数据安全也是榕树网络一向以来非常注重的方面,在打造过国有控股子公司的龙凯及其团队以为树立完好严厉的标准准则是确保数据安全的护城河。技能领域也会有专门的技能团队做严厉把控,不同等级的人和不同层面的流程都具有相应的规章准则。
据了解,榕树网络现在已完结了据衔接渠道的树立,现已逐渐接入了优质的超级源,并依据数据的不同特点和标签划分为“黑曜石”、“蓝曜石”等系列产品。
龙凯泄漏,接下来榕树网络作业重心将放在第二层数据办理环节。社区众包渠道正在树立中,初始版别将很快在国内上线。而社区的树立在于用户能否达到一致,并自觉的完结分发使命,龙凯坦言这也是榕树网络现在要点研讨和亟待处理的课题。
近期,国内方针关于通证相关的监管日趋严厉,谈到怎么躲避方针危险,龙凯表明:“榕树网络的事务都是能够落地的事务,从数据衔接、数据办理到交融分发都是能够去实践处理数据职业中真实的商业问题,所以咱们对此彻底有决心。”
据悉,榕树网络基金会在新加坡于 2018 年 3 月建立,项目则是在本年 1 月份上线。CEO David Zhou 为加拿大籍,结业于滑铁卢大学,一起也是高维本钱外部合伙人。龙凯为该公司的我国区担任人,结业于北京大学和斯坦福大学,也曾是 Oracle 中心件首席工程师、银联智惠创始人。此外,榕树网络现在正与国内的轿车、稳妥、银行等客户探究协作,产品已在客户端进行测验和打磨,八月份正式上线。