拉斯维加斯9888

  • ?北大主页
  • |
  • 一带一路书院
  • |
  • 用户登录
    • 教人员登录
    • 学生登录
    • 拉斯维加斯9888邮箱
  • |
  • 教怨匦聘
  • |
  • 捐赠
  • 中国·9888拉斯维加斯(股份)有限公司-官方网站
  • |
  • English
思想拉斯维加斯9888

王汉生:数据治理——数据安全与价值的造度保险

2018-03-26

2018年3月16日,中国银监会颁布了《银行业金融机构数据治理指引(征求定见稿)》,就有关数据治理问题,向全社会公开征求定见,至此银行业金融机构全面数据治理的大幕拉开 。而在大洋彼岸,关于Cambridge Analytica滥用Facebook 5000万用户数据的丑闻正闹得沸沸扬扬,并持续发酵 。这所有都注明,数据治理已经成了一个极其沉要、亟待解决的沉大社会问题 。一个科学合理的数据治理规范,是数据安全与价值的造度保险,是数据产业健全发展,甚至是国度人为智能战术执行不成或缺的前提前提 。本文尝试凭据自己的有限相识,提出一个数据治理的或许理论框架,但愿可能为有关工作提供一些思路参考 。

在我看来,所谓数据治理,就是对数据资产的治理,属于公司治理的领域,是对数据资产所有有关方利益的协调与规范 。具体内容蕴含但不局限于:(1)数据资源资产化;(2)数据确权与合规;以及(3)价值创造与人才造就 。

第一、数据资源资产化 。数据不蹬宗数据资产,数据就是电子化纪录,仅此而已 。数据并不天生具备资产属性 。资产必要可能给企业带来预期收益 。因而,只有满足一系列必要前提的数据资源,才可能成为数据资产 。

第二、数据确权与合规 。隐衷;の侍庠嚼丛绞芷鞒 。所谓隐衷;ぞ褪嵌砸衷数据的; 。最梦想的情况是,可能在产权层面,确立有关幼我作为隐衷数据的合法的唯一占有者 。这就必要一个司法基 。憾允莶ǎㄔ毯痪窒抻谝衷数据)简直定,也就是数据确权 。若是临时做不到数据确权,那么至少要做到,对数据现实节造者的行为严加牵造,做到合法合规 。

第三、价值创造与人才造就 。对价值创造而言,数据治理不应该关注太过具体的业务问题,由于业务状态千变万化,拥有极强的不确定性,不成能通过至死不变的规章造度去治理 。相反,数据治理当该关注人才团队的成立与造就,这才是价值创造的沃土 。只有精通数据思想的人才沃土在,就肯定会开出鲜艳的花朵,结出丰硕的果实 。

一、布景介绍

2018年3月16日,中国银监会颁布了《银行业金融机构数据治理指引(征求定见稿)》,就有关数据治理问题,向全社会公开征求定见 。至此银行业金融机构全面数据治理的大幕拉开 。该指引要求银行业金融机构将数据治理纳入公司治理领域,并凭据数据治理情况,评价公司治理水平,甚至与监管评级挂钩 。该指引还激励银行业金融机构发展造度性索求,并设立专业岗位,为人才团队的造就建设提供了造度保险 。

这是一个非;⑶页烈氖挛,对数据产业(不仅限于银行业金融机构)的健全发展拥有沉大意思 。它带来两个沉要启迪 。

第一、从产业政策层面,作为银行业金融机构的主管机构,中国银监会对数据治理的器沉与推动,必将对数据产业产生沉大并且积极的影响 。其影响也许不仅仅局限于银行业金融机构,还蕴含其他数据有关的产业 。

第二、从理论层面,该指引的颁布,驱动学术界从理论上思虑:数据治理的内涵到底是什么?它和公司治理之间的关系到底怎么?数据治理的怪异之处何在?必要一个相对统一的理论框架,便于发展理论钻研,并形成同产业实际的优良互动 。

为此,我尝试凭据自己的有限相识,提出一个数据治理的或许理论框架,但愿可能为有关工作提供一些思路参考 。更沉要的是,但愿可能起到抛砖引玉的作用,吸引更多确当局、产业、学术专家,一路来关注这个沉大问题 。一个科学合理的数据治理规范,是数据产业健全发展,甚至是国度人为智能战术执行不成或缺的造度保险 。

接下来,将从几个方面进行会商 。第一、银监会的指引里明确指出,数据治理当该纳入公司治理的领域 。为此,必要首先对公司治理有根基的相识 。第二、数据作为一种新兴资产,它的治理工作,有哪些怪异、沉要,且具体的内容?第三、数据资产价值的创造离不开专业的人才 。因而,人才团队的成立与造就也至关沉要 。

二、公司治理与数据治理

中国银监会《银行业金融机构数据治理指引(征求定见稿)》第四条(数据治理总体要求)明确指出:“银行业金融机构该当将数据治理纳入公司治理领域” 。为此,必要先单一相识一下:什么是公司治理(Corporate Governance)?

为了注明这个问题,虚构一个“老王卖耗子药”的搞笑案例 。如果老王开了一个幼公司,叫做“老王科技”,专业售卖耗子药 。老王科技就一个员工,那就是老王自己 。老王既是唯一股东、董事长、CEO,又是市场总监、销售骨干、前台欢迎,全都是老王一幼我干 。那么,老王科技的业绩曲直,就看老王自己的经营能力是否够强 。无论老王科技的业绩是好还是坏,都只跟老王一幼我有关,跟其他人无关 。因而,这是一个纯正的经营问题,跟公司治理无关 。为什么?由于:“老王科技」剽个资产(即:公司)的所有者(老王,唯一股东兼董事长),以及现实经营者(还是老王自己,兼任CEO、市场总监、销售骨干、前台欢迎等多多职务),是100%统一幼我 。因而,现实经营者(老王,CEO、市场总监、销售骨干、兼前台欢迎),在他的能力领域内,肯定会100%尽全力为股东(还是老王,唯一股东兼董事长)致力奋斗,不必要任何造度敦促 。若是经营不善,老王自己负全责,没法自怨自艾 。这样的公司,只有经营问题,没有治理问题 。

但是,老王科技发展的太好了,以至于必须开分店!一不幼心,在北京城里开了100家分店,请问:老王自己一幼我还忙得过来吗?显然忙不外来了 。怎么办?老王必须为每个分店,请店长,请员工 。为了协调这100家分店的市场行为,还在总店礼聘了市场总监 。为了协调100家分店的货物配送问题,还在总店铺排了物流主管 。这么多员工,他们的招聘、去职、五险一金,也是一个不幼的事件,婆宗无奈,老王还礼聘了一个HRD 。好家伙,这么七七八八算下来,总店的员工人数也不少了,太费神了 。搞得老王连搓麻将、玩德扑、打电游的功夫都没了 。这可严沉影响了老王的生涯质量 。因而,老王又沉金礼聘了一个海归MBA来当CEO(Michael) 。

不知不觉中,老王科技的员工数量,已经从原来老王1人,造成300人了 。这时辰,新的问题就来了 。作为“老王科技”的唯一股东,老王心心想想但愿老王科技的利益(也就是自己的股东利益)越来越好 。但是,员工的心理可不一样 。无论是高管CEO、中层各类总监、还是最下面的店长店员,每幼我的利益跟老王都有交集(终于老王科技做得好,各人才有工资奖金),但是又不尽一样(终于老王科技业绩,跟员工幼我利益,并不是齐全确定性关系) 。因而,每个员工,自觉或者不自觉地,都有一点自己的幼心眼儿 。这不是一个好景象,也不是一个坏景象,这是一个太正常不外的中性景象 。对于这个景象,若是利用切当,能够成为公司发展的巨大动力 。但是,若是治理失控,就会极大地影响公司业绩,影响公司所有有关方的权利 。这时辰,公司治理就变得极其沉要了 。

由此可见,所谓公司治理,在一个相对狭义的层面,就是要解决公司实际中,资产所有者(股东老王)和现实经营者(CEO Michael,中层大张,店长幼赵,N多店员)的分离所产生的矛盾 。若是没有优良的治理造度保险,公司资产(例如:老王科技的分店)的现实经营者(店长+店员),极有可能做出中伤公司利益的行为(例如:利用老王科技的分店,暗里兜销老李科技的产品) 。这就是公司治理中经典的委托代理问题,也是现代金融学钻研的主题内容之一 。

若是老王科技有融资上市打算,公司治理问题会变得越发严沉 。以前老王科技就老王一个股东,他对公司中所有事物有绝对的生杀大权 。但是,此刻为了企业高速发展,老王科技经历了A到Z无限轮融资,最后终于在海表上市 。比及上市的那一天,老王在公司股权中的占比,已经不到10%,而其他的股权散落在各个投资机构,甚至散户手中 。只管通过双层的股权结构设置,老王依然占有在董事会的绝对节造权 。但是,此时老王的影响力,注定不如以前了 。以CEO Michael为首的治理团队(公司资产的现实经营者),具备了很强的挑战老王的能力,散户就更别提了 。治理团队具备了更大的用公司资产为自己谋私利的可能 。此时,若是没有科学合理的造度设计,老王科技的前途堪忧 。

目前为止,老王科技的治理问题只牵扯到两方利益,即:股东方(资产所有者)利益与治理方(现实经营者)利益 。若是有第三方染指,老王科技的治理问题会变得越发复杂 。例如,老王科技的急剧发展,带来一个严沉后果:环境传染 。为了出产剧毒耗子药,老王科技的出产造作过程,不成预防的涉及到大量有毒有害的化学原料以及拔除物,对环境产生了很大的中伤 。本地当局、居民,以及环保主义者都对此暗示强烈的不满 。为相识决该问题,老王科技同本地当局、居民,以及环保主义者,成立了优良的沟通机造,积极选取最新的低排放出产工艺,找到了各方都中意的解决步骤 。此时,老王科技协调规范的不仅仅是股东、治理层之间的利益,还蕴含表部第三方(本地当局、居民、环保主义者) 。从一个越发广义的领域看,这也能够被看作是公司治理的内容 。

因而,从一个越发广义的角度看,公司治理就是要对公司(作为一个资产)的所有有关者(不仅仅局限于股东和治理层,还蕴含第三方)利益的协调与规范 。

F172C78A8AAF86DBB0AE2722B07_D0B5C61A_43154

回到数据治理问题的会商,请问:数据治理,治理什么?治理的对象是什么?是数据吗?答:不是 。数据作为一种电子化纪录,无处不在,大无数情况下都无关企业沉大利益,并没有治理的必要 。因而,数据治理的对象必须是沉要的数据资源,是关乎企业沉大商衣符益的数据资源 。这样的数据资源能够称其为“数据资产” 。关于数据资产越发具体的会商将鄙人一节进行 。这里不难获得一个结论:所谓数据治理,不是对数据的治理,是对可能为企业带来商衣符益的数据资产的治理 。数据资产显然是公司资产的一部门 。因而,无论是从狭义的角度还是广义的角度看,数据治理当该属于公司治理的领域 。所有关于公司治理的典型问题,都可能在数据资产上出现 。公司资产会出现所有者与现实经营者分离的问题,数据资产更会出现 。数据资产的所有者,跟现实使用经营者,险些从来就不是统一幼我,或者至少极具争议 。公司资产的现实经营者(例如CEO),有可能用公司资产谋取私利;数据资产的现实节造者(例如数据库治理员),更有便捷的前提,通过倒卖数据,谋取私利 。公司的利益有可能同表部第三方(例如环保主义者)产生矛盾;这个问题对数据资产而言越发凸起 。以电商平台为例,除了股东、治理层以表,有关数据资产有一个天生的第三方——消费者 。股东治理层对数据的利益诉求,极容易同消费者这个第三方矛盾 。作为矛盾的焦点,数据确权与隐衷;な椎逼涑 。

总结一下,所谓“数据治理”,不是对“数据”的治理,而是对“数据资产”的治理,是对数据资产所有有关方利益的协调与规范 。

三、数据资源资产化

数据治理是关于数据资产的治理,那么数据资产又是什么?行业中有一个宽泛流传的误会,好多伴侣不假思考地以为:“数据就是资产!” 错!数据不蹬宗数据资产 。所谓数据就是电子化纪录,电子化纪录就是数据 。但并不是任何数据都能够被称为资产,由于数据资产的要求更高,只罕见据具备了资产属性后,能力够被称为数据资产 。那么,基础管帐学中,对资产的界说是什么?其对数据资产的界说能有什么启发?

新《企业管帐准则-根基准则》第20条划定:“资产是指企业从前的买卖或者事项形成的、由企业占有或者节造的、预期会给企业带来经济利益的资源 。”若是照猫画虎批改一下,不难获得一个关于数据资产的界说:“数据资产是指企业从前的买卖或者事项形成的,由企业占有或者节造的,预期会给企业带来经济利益的数据资源 。”由此可见,数据要成为数据资产,至少要满足3个主题必要前提:(1)数据资产应该是企业从前的买卖或者事项形成的;(2)企业占有或者节造;(3)预期会给企业带来经济利益 。

其中(1)似乎不是问题 。企业数据资源的获得无表乎两种蹊径 。第一种蹊径,是自己从前正常经营的一个天然堆集与产出,或者由于业务执行的必要而被现实节造 。例如,对电商网站而言,网络浏览日志数据、消费采办数据天然而然就产生了;为了给消费者快递商品,消费者的姓名、银行卡、手机号、地址等数据也被纪录了下来,被电商网站现实节造 。第二种蹊径,就是资源互换 。可能是A企业通过钱币(或者等价物)采办了B企业的数据,也可能是A企业的数据同B企业的数据做了等价置换 。如果有关操作合法合规,那么这种蹊径获得的数据资源也切合数据资产界说的前提(1) 。

但是,(2)似乎是一个很大的问题 。凭据主题前提(2),数据要成为资产,要么被企业合法合规地占有,要么被企业合法合规地节造 。对于通常资产而言,这似乎不是一个很大的问题,由于通常资产的产权极度了了 。但是对数据资产而言,产权极度不容易界定 ;故且缘缟掏疚,网站积攒大量的关于消费者的消费纪录数据 。这些数据的现实节造者是电商网站,但是其合法的产权方是谁?这不是一个容易回覆的问题 。对于该数据的出产,电商网站提供了软硬件设备,似乎贡献巨大 。但是,这些数据的内容,却由消费者出产,并且关乎消费者隐衷,消费者也有无可争议的权利 。这其中的矛盾矛盾,若何通过科学合理的造杜阻以规范协调,这是一个极具挑战,必要大智慧的问题 。关于数据确权与合规这个沉要问题,后面一节还会进一步会商 。

最后,(3)似乎也不是一个容易解决的问题 。数据要成为资产,就必要可能给企业带来可预期的经济收益,不然就不是资产 。因而,那些被大量存储,产生可观存储成本,但是却不能给企业带来可预期经济收益的数据资源,也不能被称为数据资产 。只有那些可能给企业带来可预期经济收益的数据资源,才可能被称为数据资产 。什么样的数据资源才可能产生可预期的经济收益?这必要一些必要前提 。

第一、纪录电子化 。电子化的纪录才是数据,不然连数据都不算,怎么能产生可预期的经济收益,又怎么能从数据资源造成数据资产?请不要忽视纪录电子化这个低微的工作,其意思极其沉大 。由于有关行业中,大量的汗青纪录都没有被电子化,而这些纪录中蕴藏着海量的贵重信息 。最典型的例子莫过于:病历!固然此刻的医院大量选取电子化病历,但是从前几十年里可都选取的是纸质病历 。这些病历上写满了只有医生护士才看得懂的天书 。这样的纸质病历,一个大型三甲医院,就有上亿份之多!里面蕴藏了无比宝贵的临床数据 。不把这些纪录电子化,就成不了数据,支持不了科学钻研,支持不了规;,产生不了可预期的经济价值,因而不是数据资产 。

第二、数据聚合 。统一的数据聚合平台,是数据资产化的优质前提 。若是没有统一的数据聚合平台,每次分歧的业务需要,城市产生不一样的数据提取、整合、算帐需要 。这些需要时时必要和分歧的业务部门沟通,在分歧的数据库上直接操作 。这必要高昂的沟通成本,以及不平庸的数据库操作技术,而这些技术往往是数据需要方(例如:业务方)不具备的 。最后只能拜托技术团队去实现,而技术团队的功夫成本也极度高昂 。过高的数据提取整顿成本,会抵消数据资源正本应该产生的经济收益,成为数据资源资产化的巨大阻碍 。而要解除该阻碍,一个统一规范的数据聚合平台不成或缺 。

第三、质量保障 。数据分析中有一句名言,叫做:“垃圾进去,垃圾出来 (Garbage in, garbage out)” 。它讲的路理是,若是数据自身质量很差,如同垃圾一样,还用做模型输入,那么无论模型有多宏伟上,最后出来的了局依然是垃圾,没有任何价值 ?杉葜柿康某烈 。数据质量重要表此刻以下几个方面:(1)真实性 。虚伪数据是没有任何意思的;真实的数据,时时分散在各个职能部门中 。若是没有合理且强力的造度保险,正常情况下,没有任何人愿意自动贡献自己的真实数据,他的利益何在?因而,合理并且强力的造度设计极度沉要 。(2)齐全性 。该网络整齐的数据要尽量网络整齐 。一套数据对被纪录对象的所有有关指标的齐全水平越高,有关模型的预测精度就会越好,数据资源就越有价值 。相反,过多的缺失数据会极大地中伤有关模型的预测精度,进而限度数据的利用能力 。(3)精准性 。有三层寓意:第一层寓意是数据的逻辑要合理 。例如:对于大气数据而言,由于PM2.5是PM10的一部门,因而,有关数据必须满足PM10的数值要大于PM2.5,不然就不合逻辑,是谬误数据 。第二层寓意是数据的详细水平 。同样的数据,分歧的采集方式,分歧的存储方式,带来的数据详细水平是不一样的 。以车联网数据为例,数据采集应该详细到每秒?还是每15秒?在不思考成本的情况下,显然越详细越好 。第三层寓意是数据的精确水平 。以定位数据为例,应该精确到10米以内?还是1米以内?在不思考成本的情况下,显然数据精度越高,对于业务的支持能力越强 。

四、数据确权与合规

3FAF894AECDBCBBD87410DC106D_247D1FCE_32769

随着社会的发展,隐衷;の侍庠嚼丛绞芷鞒 。所谓隐衷;ぞ褪且;す睾醺霰鹨衷的数据 。幼我隐衷数据之所以应该受到;,就是由于这些数据的滥用有可能对幼我造成巨大的财富甚至人身中伤 。所谓隐衷;,其实就是对隐衷数据的; 。一个最梦想的情况是,可能在产权层面,确立有关幼我作为隐衷数据的合法的唯一占有者 。这就必要一个司法基 。憾允莶ǎㄔ毯痪窒抻谝衷数据)简直定,也就是数据确权 。若是临时做不到数据确权,那么至少要做到,对隐衷数据现实节造者的行为要严加牵造,做到合法合规 。要预防,由于数据资产的谬误使用,给任何有关方造成不用要的损失 。因而,有关的数据治理规定极度沉要,重要关注几个方面 。

第一、数据确权 。数据一旦成为资产,就肯定有产权方,或者现实节造人,能够把他们统称为主人 。请问:数据资产的主人到底是谁?如同实物资产一样,若是一不幼心,错用了别人的资产,可能会产生严沉的司法后果 。对于实物资产,确权似乎不是一个问题 。由于,无论是桌椅板凳,还是电脑打印机,它们在产权层面是极度了了的 。造作商独立造作了这些产品,整个造作过程跟消费者无关,造作商独享产权 。造作实现后,消费者通过付费,获得了这些实物资产的产权 。但是,数据的出产过程太不一样了 。以电商为例,大量的消费者数据被电商平台所掌控(例如:消费者的幼我信息、购物信息等),电商平台事实上在时时使用这些数据为自己的业务服务(例如:支持电商平台自己的个性化推荐) 。甚至,不掌管任的电商可能通过各类灰色买卖将数据售卖给了莫名其妙的第三方 。但是,这些数据资产的出产过程,可不是电商平台自己可能实现的 。电商平台提供了“平台”,在这个平台上,消费者通过注册、浏览、订阅、采办、评论等一系列行为出产了有关的数据 。因而,整个数据资产的出产过程,寂仔电商平台的贡献(在线场景、软硬件环境),也有消费者的贡献(注册、浏览、订阅、采办、评论) 。这样的数据资产,其产权归属若何确定,其节造权应该若何治理?主人到底是谁?这是一个极具挑战性,而又极度沉要的问题 。

第二、数据采集 。大量的数据采集来自业求实际,但相应的数据采集过程是否合法合规?有几个根基的准则可供参考 。第一个准则是“合法正当准则” 。显然,犯法采集的数据,通过不正当蹊径获得的数据,是不能选取的 。第二个准则是“知情赞成准则” 。数据作为一种电子化纪录,大量纪录了关乎幼我隐衷(例如:姓名、手机号、身份证)或者贸易机密(股权结构)的信息,因而极度敏感 。采集如此敏感的信息,被采集方充分的知情、赞成,并且授权,是必不成少的先决前提 。第三个准则是“必要性准则” 。由于数据可能涉及幼我隐衷或者贸易机密等敏感信息,因而,数据采集应该遵循越少越好的准则 。例如,一个电商平台的APP,采集用户的姓名、银行卡、手机号、地址等信息,极度必要 。不然,无法实现在线支付、线下快递等必要业务 。但是,若是该APP同时采集你的社交圈信息,还要看你的电话簿纪录,这似乎就违背了数据采集的必要性准则 。

第三、使用场景 。即便企业对数据占有100%的产权,或者合法合规的现实节造权,也不能对数据不分场景地肆意使用 。这个路理其实好懂 。如果你占有100个鸡蛋,你对这100个鸡蛋占有100%的产权 。这是否代表你能够对鸡蛋做肆意措置?不成以!任何措置方式,都必须满足一个根基前提:不合他人造成不用要的中伤 。例如,你能够把这100个鸡蛋造成:煮鸡蛋、煎鸡蛋、蒸鸡蛋 。但是,你不能拿鸡蛋去大马路上抛汽车的挡风玻璃 。这可就太危险了,容易引起交通变乱,给他人造成中伤 。由于数据纪录了大量关乎机构或者幼我的敏感信息,因而数据资产的使用场景,要慎之又慎!坊间传闻,腾讯内部对QQ和微信的谈天纪录(数据)赐与最高的保密级别,称为“高压线”,禁绝任何人碰这部门数据 。原因何在?这部门数据涉及到太多的用户隐衷 。这是一个掌管任企业自我约束的好例子 。因而,数据治理的一个沉要工作就是界说数据的使用场景 。什么样的数据,能够利用于什么场景?支持什么产品?谁来使用?使用的前提前提?都必要当真思虑,必要必要的规章造度 。

第四、使用伎俩 。接下来应该关注的是数据的使用伎俩 。即便企业对于数据占有了100%的产权,也确定了一个合法合规的使用场景,也要对数据的使用伎俩极度审慎 。由于数据纪录了敏感信息,因而对数据的每次加工使用,都有泄密的风险 。为此,要对数据的使用伎俩做出必要的合规要求 。这里持续沿用上面的例子 。你对这100个鸡蛋占有100%的产权,并且有一个合规的使用场景:餐厅 。餐厅售卖各类加工后的鸡蛋,例如:煮鸡蛋、煎鸡蛋、蒸鸡蛋 。了局某吃货发现,你给他提供的单面煎鸡蛋里面竟然有三个蛋黄,这是一个极少见的“三黄蛋”!没想到,该吃货是鸡蛋大数据的高手,经过他的大数据分析,最后判断,世上可能产三黄蛋的老母鸡只能是隔壁家老李鸡场的78号老母鸡 。该吃货把这个新闻在微博微信上大举张扬,后果是老李鸡场78号老母鸡的隐衷没了 。其他老母鸡都知路78号下三黄蛋,感触十吩戽葩,超等鄙夷,讨论纷纷 。78号老母鸡因而患上了严沉的抑郁症,失去了产蛋能力,最后被主人老李炖成了一锅鲜美的鸡汤,下场好惨!这个例子注明,纰漏大意的数据使用伎俩,容易产生隐衷泄露的风险 。因而,必要的隐衷;ぃɑ蛘呒用埽┘际,应该被积极选取 。例如,当初厨房的鸡蛋治理造度划定:不许加工单面煎鸡蛋(能看出三个蛋黄来),而是要求蛋黄蛋清必须打碎搅和均匀后能力做进一步加工(例如:蒸鸡蛋、炒鸡蛋)蛋,这并不会对鸡蛋的美味产生太大的影响,但是却可能极幼化三黄蛋(一个敏感信息)被识此外可能性,因而78号老母鸡的隐衷也被;ち 。

第五、数据安全 。由于大量数据关乎幼我隐衷、贸易机密,因而数据安满是一个极度沉要的问题 。现实生涯中的数据泄露触目皆是 。我自己的经验是,只有孩子参与了一个课表培训班(例如:英语),其他同业培训机构就会跟上来 。曾几何时,有租房经验的伴侣也知路,只有在职何一个房地产中介留下过租房信息,很快就有更多的中介找上门来 。拉斯维加斯9888幼我手机号码,如此沉要的幼我数据,是若何泄露的?数据安满是整个数据产业在面对的沉大问题!数据安全的保险必要必要的软件和硬件 。但是,最必要的是一个合理的数据治理造度 。该造杜爪该对数据从产生、使用、到消亡的整个链条进行严格治理 。具体内容蕴含但不局限于:存储安全治理、用户匿名化、接见权限治理等 。

五、价值创造与人才造就

数据资产作为一种资产的必要前提是产生可预期的经济收益,或者贸易价值 。但是,若何能力让数据资产创造出最大的贸易价值,相应的造度保险又是什么?

孤立而纯正的数据没有价值,哪怕是聚合在统一的数据平台上的数据资产也没有价值 。数据价值的彰显必须依赖于具体的、带有不确定性的业务场景 。为此,企业必要:(1)寻找带有不确定性的业务场景,由于只佑装不确定性」剽个浊世,才有成就“价值」剽个英雄的机遇;(2)将该业务问题转化成为一个,关于Y(因变量)和X(自变量)的数据可分析问题 。从此,抽象的业务问题,造成了具体的数据分析技术问题 。这是数据资产价值创造的根基套路 。为此,企业的经营治理团队,从上到下,都必要罕见据思想的能力,尤其必要有回归分析的思想 。若是业务团队不够数据思想能力,就无法把盘根错节的业务问题,转换成为技术团队善于的数据可分析问题;若是技术团队不够数据思想能力,就无法正确理解业务需要,无法设计正确的数据产品;若是企业中层不够数据思想能力,朴素的数据价值观就无法在企业内部设置,回归分析尺度的Y X说话就难以遍及;若是企业高层不够数据思想能力,就无法从战术的高度,理解数据资产的贸易价值,将失去启发优质数据业务战术新方向的能力,并造成企业价值在本钱市场的低估 。

由此可见,数据资产价值创造,不是一幼我两幼我的事件,是企业全员团队的事件 。必要企业各个岗位的员工、治理者都深谙数据贸易价值之路,并在各自的业求实际中,自觉(甚至不自觉地)寻找能够彰显数据价值的业务机遇 。为此,企业必要全员的,以回归分析思想为主题的数据思想能力 。由此可见,价值创造的过程,性质上是一个数据思想造就的过程,是一个全员人才造就的过程 。为此,一方面必要对现有人员的数据思想能力做全面的造就提升,另一方面能够思考在各个主题骨干的业务部门设立专门的岗位 。该岗位人员的重要职责不是业务,不是数据,更不是技术,而是应该承担链接业务与数据的桥梁作用 。为此,有关人员必要对业务、数据、技术都有足够的相识 。对专业深度要求低一些,但是专业广度要求更高,而这样的人才就是贸易分析人才 。

由此可见,对数据资产的价值创造而言,数据治理当该关注的不是太过具体的业务问题 。真实的贸易环境千变万化,带有极强的不确定性,不成能通过至死不变的规章造度去治理 。以银行业金融机构为例,站在职何一个功夫点,都无法绝对正确预测,将来的贸易状态会怎么?业务内容会怎么?相应的数据分析会怎么?因而,作为一个纲领性的造度设计,数据治理不应该过度关注具体业务问题 。相反,应该关注人才团队的成立与造就,这才是价值创造的沃土 。由于贸易环境的变迁,业务状态的变动,数据价值的多样性,人们对于这片沃土上会结出什么花朵,什么果实,并不确定 。但是,只有精通数据思想的人才沃土在,就肯定会开出鲜艳的花朵,结出丰硕的果实 。因而,造就人才,造就具备数据思想能力的人才,造就企业从上到下精通回归分析思想的人才,并为此提供科学的造度保险,这才是数据资产治理在价值创造这方面应该关注的沉点 。

六、会商与总结

就在本文形成的过程中,大洋彼岸传来一个令人震惊的新闻 。据媒体报路,一家叫做剑桥分析(Cambridge Analytica)的数据公司,违规使用了5000万Facebook用户数据 。通过对这些数据分析,预测每幼我的政治偏差,而后动用生理学伎俩,形成过问的内容,最后通过Facebook的告白信息,将过问内容推送到用户刻下,也许能达到不知不觉中扭转一幼我政治偏差的主张 。作为一个通常的读者,我们无法判断这样做的现实成效 。但是,能够确认的一点是,Facebook的数据治理有沉大缺点 。Facebook用户数据由Facebook现实节造着,并将该数据利用于其告白系统,为Facebook带来可观收益 。对于这样的数据资源确权若是太难题,那么至少要做到合法合规 。为此,Facebook应该对数据的使用场景(例如:政治宣传或过问),以及使用伎俩(例如:通过告白系统推送个性化信息),成立越发严格的规章造度,加强数据治理 。最后,想用Facebook首创人马克扎克伯格就Cambridge Analytica数据违规使用问题的部门申明作为结尾,同关切数据产业健全发展的同业们共勉:

I started Facebook, and at the end of the day I'm responsible for what happens on our platform. I'm serious about doing what it takes to protect our community. While this specific issue involving Cambridge Analytica should no longer happen with new apps today, that doesn't change what happened in the past. We will learn from this experience to secure our platform further and make our community safer for everyone going forward.

王汉生,拉斯维加斯9888商务统计与经济计量系教授、系主任 。国际统计协会会员(International Statistical Institute),美国统计学会(American Statistical Association),美国数理统计钻研员(Institute of Mathematical Statistics),英国皇家统计协会(Royal Statistical Society),以及泛华统计学会(International Chinese Statistical Association)会员 。

他颁发英文学术论文五十余篇,中文论文近二十篇 。合著英文专著1本,独立实现中文教材2本 。先后担任多个学术刊物副主编(Associate Editor) 。这些刊物蕴含:The Annals of Statistics (2008—2009),Computational Statistics & Data Analysis (2008—2011),Statistics and its Interface (2010至今),Journal of the American Statistical Association (2011至今), 以及Statistica Sinica (2011至今) 。现重要理论钻研兴致为:高维数据分析、变量选择、数据降维、极致讽论、以及半参数模型 。重要利用钻研兴致为:搜索引擎营销、社会关系网络 。

6F3809566966FB98F7019E133BA_69B5D8BC_FDC3




分享
【网站地图】