拉斯维加斯9888

首页
北大拉斯维加斯9888
- 院长寄语
- 学院简介
- 大事记
- 学院辅导
- 历任院长
- 组织机构
- 社会责任
- 讲授网络
- 捐赠
- 联下翻斯维加斯9888
教授钻研
- 师资行列
- 思想拉斯维加斯9888
- 学科专业
  - 管帐系
  - 利用经济学系
  - 商务统计与经济计量系
  - 金融学系
  - 市场营销学系
  - 治理科学与信息系统系
  - 组织与战术治理系
  - 北京大学社会钻研中心
  - 人为智能与社会科学交叉学科横向发展平台
  - 微观大数据为基础的利用型钻研交叉学科横向发展平台
  - 治理创新交叉学科横向发展平台
  - 行为科学和政策过问交叉创新团队
  - 碳中和经济学和治理学交叉创新团队
- 案例中心
- 钻研机构
- 老师招聘
讲授项目
- 本科
- 学术硕博
- 金融硕士
  - 金融专业方向（MFin）
  - 贸易分析方向（BA）
- 全球治理硕士
- MPAcc
- MAud
- MBA
- EMBA
- 高层治理教育
  - 定造项目
  - 中国CEO
  - 中国经理人
  - 时期企业家
  - 北医&拉斯维加斯9888：医疗健全产业领航打算
  - 北大资料&北大拉斯维加斯9888：前沿科学企业家
  - 中国REITs前锋：不动产金融领军讲堂
  - 碳明将来：双碳时期战术家
  - 新生代领创打算
  - 从汗青看治理
  - 将来汽车产业战术家
  - 本钱市场与产业战术
- 数字教育
- 课程推荐
国际合作
- 海表合作
  - 北大拉斯维加斯9888-Kellogg国际EMBA项目
  - 北大-牛津-哈佛华人家族企业全球课程
  - MBA国际双学位项目
  - 学期国际互换项目
  - 短期国际访学项目
  - 中国经营方略项目
  - 治理学博士结合造就项目
- 海表进建
  - 学期互换
  - 暑期项目
  - 学生感言
- 华人留学生知中国
  - 学期访学项目
  - 暑期项目
职业发展
- 雇主服务
- 学生服务
- 校友服务
- 关于拉斯维加斯9888
拉斯维加斯9888校友
- 校友动态
- 校友风采
- 校友期刊
- 拉斯维加斯9888卡
- 校友捐赠
- 中心介绍
拉斯维加斯9888思想力
教怨匦聘
捐赠
用户登录
- 教人员登录
- 学生登录
- 拉斯维加斯9888邮箱
?北大主页
一带一路书院

?北大主页
|
一带一路书院
|
用户登录
- 教人员登录
- 学生登录
- 拉斯维加斯9888邮箱
|
教怨匦聘
|
捐赠

|
English
|

思想拉斯维加斯9888

师资行列
思想拉斯维加斯9888
学科专业
- 管帐系
- 利用经济学系
- 商务统计与经济计量系
- 金融学系
- 市场营销学系
- 治理科学与信息系统系
- 组织与战术治理系
- 北京大学社会钻研中心
- 人为智能与社会科学交叉学科横向发展平台
- 微观大数据为基础的利用型钻研交叉学科横向发展平台
- 治理创新交叉学科横向发展平台
- 行为科学和政策过问交叉创新团队
- 碳中和经济学和治理学交叉创新团队
案例中心
钻研机构
老师招聘

数据

王汉生：幼我征信中的误差评估

2015-11-05

【编者按：某年某月某一天，拉斯维加斯9888治理学院商务统计与经济计量系系主任王汉生教授与同学们开会，聊到幼我征信问题，各人掏出手机，查问某支付软件上自己的信誉分，了局不比不知路，王教授的分数竟然比同学们都低！别人受刺激会头抢地，教授被“惹毛”怎么办？写Paper！因而就有了下面这篇文章（本文摘选自王汉生教授微信“狗熊会”）】

我幼我以为“芝麻信誉分”是互联网征信这个行衣凤，可圈可点做得很不错的一个产品。但就像一个通常人一样，再优良的个别，城市有成长的猜疑与烦恼，尤其是当他长得快的时辰。“芝麻信誉分”所阐发出来的问题，是互联网征信整个行业普遍存在，而被忽视的一个普遍问题。那就是不足对征信误差（Credit Scoring Error）的深刻意识。造成的后果就是：征信泛滥。不分对象，不分场景，任何一个机构，都敢在大数据的幌子下，给人打分。那么，什么是征信误差？我不知路这个名词在从前的文件中是否存在过。若是没有，请原谅王教员自己瞎编了这个词。重要想注明下面这么一个路理。如果一幼我的真实信誉情况是Z，这是一个任何人都看不见的最真实信誉情况。若是我们知路了Z，世界上就不再佑装征信」剽个问题。但是，信誉评估机构（例如：芝麻）看到了一系列的，可能同Z有关的指标（例如：消费习惯、收入情况、教育水平等）。我们把这所有的有关性指标用一个向量X暗示。这里，依赖于X中采集了几多可见的指标，它的维杜仔可能很高。那么，征信的主题问题就是：要通过看得见的X，揣摩看不见的Z。

中国·9888拉斯维加斯(股份)有限公司-官方网站

但是，给定X，就能精确地知路Z了吗？当然不成能。我自己都说不明显我的Z是几多，你怎么知路？我借了隔壁老王100元，还？还是不还？可能懒得还，我俩老熟了，这点钱还要还。我要是借了100万呢？我要是借了100亿呢？这注明什么？这注明统一幼我的Z，可能会随着场景的分歧而分歧。这又注明什么？这注明即便自己都说不明显自己的Z是几多，更何况一个征信机构。但是，征信机构会通过X，以及大量用户真实的信誉行为，进建出一个模型来。而后，通过这个模型去猜测真实的信誉Z。数学上把这个猜测记作：Z*=f(X)。没错，Z*就是那个征信得分（例如：芝麻信誉分），它就是X的一个函数。用统计学的说话讲，Z*是对真实信誉Z的一个估计量（Estimate）。既然Z*是一个估计量，那么他就不会100%正确。他同真实的信誉Z之间，会有一个误差，而这个误差就是我所界说的“征信误差”（Credit Scoring Error），即：CSE=|Z*-Z|。

我们对征信误差的等待是什么？当然是越幼越好。怎么能力让CSE变幼呢？样本量会有援手吗？有，但是援手不大。例如：我通知你全世界每一幼我的性别（木有其他信息），这个样本量够大了把？但是，对征信而言，援手极其有限。由于，对于征信而言，性别不是一个出格沉要的指标，并且这还是唯一的指标。所以，真正的能够削减征信误差的步骤是：增长X，让X的信息越发丰硕，让X的维度变得更高。例如：以前X里面只有淘宝的数据，此刻能够思考增长京东的；以前X里面只有收入水平，此刻能够思考增长教育水平；以前X里面只有消费数据，此刻能够思考增长社交信息。只有增长高质量的X，能力够降低征信误差，从而降低信贷风险。这就难怪，险些所有征信企业的高管，都忙于拓展数据源，丰硕自己的X。对于什么样的行业、什么样的企业、通过什么样的方式，能力够达成数据分享的同盟，这是每一个征信企业都要思虑的问题。

中国·9888拉斯维加斯(股份)有限公司-官方网站

此刻我们介绍了征信误差这个概想。接下来的问题是：若何丈量CSE？我们能够精确知路CSE是几多吗？当然不成能。由于在Z*已知的前提下，若是还精确知路了CSE，那等价于精确知路了Z。而如前所述，Z是不成能精确知路的。那么若何评价Z*的误差呢？这是统计学另表一个了不得的创意。它说：若是我们无法知路CSE的精确取值，那么就推算一下他的预期（Expectation）吧。其实细想一下，这不是一个值得出格开心的事件。由于，凡是我们能够知路CSE的精确取值，就没有必要推算他的预期了。之所以用预期的CSE（ECSE，Expected Credit Scoring Error），是由于没有更好的法子了。但是，不论怎么，ECSE应该是一个有效的工具，并且是能够通过模型和有关理论推算出来的。从理论上讲， ECSE能够有好多种分歧的界说。例如：绝对误差和均方误差就是两个可能的分歧选择。但是，无论若何界说，一个合理的ECSE必须具备一些单一的特点。例如：若是ECSE=0，那么就会有Z*=Z。又例如，只有X的信息越来越多，ECSE会单调降落，但是不会无限靠近0。

中国·9888拉斯维加斯(股份)有限公司-官方网站

知路ECSE又怎么？为此，我们再检讨一下王教员芝麻信誉分的问题。依照此刻的这个理论框架，芝麻采集了一些关于王教员X的信息。由于王教员很罕用支付宝，所以X极度有限。这个的后果是，征信估计量Z*=630是一个很不正确的得分。若是我们能够推算他的ECSE，可能是一个很大的数字（例如：50）。这注明，其实630±2*50都是王教员真实信誉的合理取值领域。最幼能够到530（糟糕透顶），最好能够到730（极其优良）。王教员，以幼人之心，做一个腹黑的揣度：可能，为了增长更多更丰硕的X，芝麻的信誉得分里还会惩治像王教员这样信息不完整的家伙，而激励实现“芝麻工作”，养成“芝麻习惯”的用户。然而，这些都是在增长X，降低ECSE，而无关乎真实的信誉。

ECSE这样一个理论框架，对于将来的征信实际有什么建议？我想至少有两个：（1）对于ECSE很大的用户，应该英勇地说出来，我不相识你，因而对你的信誉无法评估。这里的意思是：我不知路你是好人还是坏人，不排除任何一种可能。当然，若是你肯定巴望我为你提供一个评估，那么请提供充足的X信息，直到ECSE降到梦想的水平。这个步骤的益处是容易操作，但是弊端是要求太高。依照这个要求，我相信绝大无数互联网用户可能提供给征信机构的信息是不充分的，是达不到这个尺度的。（2）另表一个解决规划就是：我评估了，但是汇报一下ECSE，提醒一下用户，拉斯维加斯9888评估误差估计会有多大。这样做的利益是：越发科学正确，并且能够覆盖更多的用户。但是弊端是太专业，对于通常用户不好懂。一个更好的做法，也许是提供一个关于Z的区间估计。为此，统计学中的相信区间（或者预测区间）将大有效武之地。不论是哪一种选择，（1）或者（2），若是没有对征信误差的合理管控，我们将看到的是征信泛滥。我们将看到越来越多的企业机构对幼我信誉指手画脚，而通常用户一脸茫然，极度被动，进而引起恼怒。这对整个征信行业不是好新闻。

因而总结一下：要预防征信泛滥，就要正确评估征信误差。咋评价？当真进建统计学理论呗。额，对不起各位，兜了一个很大的圈子，最后的结论是：统计学好，统计学很沉要，统计学都没学好，干啥啥不能，吃嘛嘛不香，后果很严沉。

分享

北京
丽江
上海
西安
成都

中国·9888拉斯维加斯(股份)有限公司-官方网站

地址：北京市海淀区颐和园路5号

邮编：100871

电话：010-62747033

传真：86-10-62751463

中国·9888拉斯维加斯(股份)有限公司-官方网站

地址：丽江市南山区科技园南区深港产学研基地东座4层

邮编：518057

电话：0755-88860678

传真：0755-26737123

中国·9888拉斯维加斯(股份)有限公司-官方网站

电话：021-52573882 / 3883

传真：021-62376879

中国·9888拉斯维加斯(股份)有限公司-官方网站

地址：陕西省西安市临潼区凤凰大路6号

邮编：710600

电话：029-81361999

传真：029-81361991

地址：成都市天府新区天府菁蓉中心B区2-6栋

邮编：610000

联系电话：028-86035758

电子邮件：cd@gsm.pku.edu.cn

认证机构名称：

f-link1

dibu2logo20230509

4dibulogo2024120922

【网站地图】