​tabulate(tabulate area)

tabulate(tabulate area)

1 WOE和IV怎么计算?

2 如何对变量做分箱?

本文介绍woe分箱包-woeBinning,利用该包实现自动分箱和计算变量的IV值。

woeBinning包介绍

woeBinning包使数字变量和因子相对于二元目标变量的分箱过程自动化。 此外,它可视化已实现的分箱解决方案,可以表格化和部署应用到新的数据集。所有函数都可以与单个变量或整个数据框一起使用。

woeBinning函数

woe.binning对数值变量或者因子变量生成一个受监督的细分和粗分类。

woe.tree.binning对数值变量和因子变量生成监督树状分割。

woe.binning.plot对woe.binning或者woe.tree.binning的分箱解决方案进行数据可视化。

woe.binning.table对woe.binning或woe.tree.binning的分箱解决方案的结果进行表格化保存。

woe.binning.deploy将把woe.binning或woe.tree.binning生成并保存的分箱解决方案部署和应用到(新)数据中。

woe和IV计算逻辑

woe 计算IV计算woe-iv计算例子

思考:上述表里面的值是如何计算的?

woeBining包应用举例

# 加载woeBinning包,若是没有安装,请先安装

library(woeBinning)

# 加载dplyr包

library(dplyr)

# 使用包自带的数据集germancredit

data( "germancredit")

# 数据集检视

print(dim(germancredit))

print(head(germancredit))

# 数据集部分变量数据获取

# 定性变量和定量变量

df <- germancredit[, c( 'creditability', 'credit.amount', 'duration.in.month', 'savings.account.and.bonds', 'purpose')]

print(head(df))

# 自动分箱操作

binning <- woe.binning(df, 'creditability', df)

# 自动分箱后结果可视化

woe.binning.plot(binning)

变量集的woe值分布情况可视化

变量集的IV值分布情况可视化

结论:

变量duration.in.month的IV值最高,为0.254

基于iv值应用的经验法则,总结如下:

1) < 0.02 非常弱 不纳入到模型变量候选集

2)[0.02, 0.1) 很弱 针对实际情况决定是否纳入模型变量候选集

3)[0.1, 0.3) 一般 纳入模型变量候选集

4)[0.3, 0.5) 强 纳入模型变量候选集

5)>= 0.5 很强,具有可疑性,要进一步调查

# 分箱解决方案表格化存储

tabulate.binning <- woe.binning.table(binning)

tabulate.binning

# 分箱解决方案部署和应用到新的数据集

df. with.binned.vars.added <- woe.binning.deploy(

df,

binning,

add.woe. or.dum.var = 'woe'

)

View(df. with.binned.vars.added)

woe.df <- df.="" with.binned.vars.added="">% dplyr::select(contains( "woe."))

View(head(woe.df))

完整代码#加载R包

library(woeBinning)

library(dplyr)

#加载数据集

data( "germancredit")

print(dim(germancredit))

print(head(germancredit))

# 部分变量数据获取

# 定性变量和定量变量

df <- germancredit[, c( 'creditability', 'credit.amount', 'duration.in.month',

'savings.account.and.bonds', 'purpose')]

print(head(df))

# 自动分箱操作

binning <- woe.binning(df, 'creditability', df)

# 自动分箱后结果可视化

woe.binning.plot(binning)

tabulate.binning <- woe.binning.table(binning)

View(tabulate.binning)

df. with.binned.vars.added <- woe.binning.deploy(

df,

binning,

add.woe. or.dum.var = 'woe'

)

View(df. with.binned.vars.added)

woe.df <- df.="" with.binned.vars.added="">% dplyr::select(contains( "woe."))

View(head(woe.df))

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

我们努力坚持做原创,聚合和分享优质的省时的数据知识!

数据工作

我们公司大数据风控中心部门诚招:

1 风险分析和建模工程师(信用评分模型,反欺诈模型,额度模型|熟练常用ML算法|熟练使用R或者Python)

2 数据开发工程师(大数据平台开发,数据采集,数据预处理)

3 爬虫工程师(掌握爬虫技术,掌握反爬策略)

4 数据分析或者建模实习生(研究生学历|统计学,数学,计算机专业|熟悉R或者Python|有金融数据项目可以加分)

工作地点:深圳大冲商务中心

薪资待遇:面议

感兴趣者,请加小编微信。

tabulate

相关推荐

​cdn加速下载(加速cdn免费)

​cdn加速下载(加速cdn免费)

134

cdn加速下载(加速cdn免费) 网站为什么需要CDN进行加速?有什么好处? 将源站内容分发至全球各地最接近用户的节点(用户可私人定制需求节点),缩短用户到节点的物理距离,使用...

​造梦西游3爆率(造梦西游3爆率大全)

​造梦西游3爆率(造梦西游3爆率大全)

67

造梦西游3爆率(造梦西游3爆率大全) 今天给各位分享造梦西游3爆率的知识,其中也会对造梦西游3爆率大全进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始...

​奥术水晶哪里多(奥术水晶的概率)

​奥术水晶哪里多(奥术水晶的概率)

73

奥术水晶哪里多(奥术水晶的概率) 今天给各位分享奥术水晶哪里多的知识,其中也会对奥术水晶的概率进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!...

​五代是哪五代(隋唐五代是哪五代)

​五代是哪五代(隋唐五代是哪五代)

55

五代是哪五代(隋唐五代是哪五代) 今天给各位分享五代是哪五代的知识,其中也会对隋唐五代是哪五代进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!...

​建业探案任务(建业探案任务奖励)

​建业探案任务(建业探案任务奖励)

148

建业探案任务(建业探案任务奖励) 梦幻西游建邺城探案攻略 梦幻西游建邺城探案任务攻略 1、建业探案任务流程,点一个人2W经验,10分钟100w经验。 2、建业赵捕头开始任务:建业县...

​鼓浪屿旅游攻略(广州到鼓浪屿旅游攻略)

​鼓浪屿旅游攻略(广州到鼓浪屿旅游攻略)

186

鼓浪屿旅游攻略(广州到鼓浪屿旅游攻略) 今天给各位分享鼓浪屿旅游攻略的知识,其中也会对广州到鼓浪屿旅游攻略进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,...

​炫舞结婚怎么结(炫舞手游结婚怎么弄)

​炫舞结婚怎么结(炫舞手游结婚怎么弄)

67

炫舞结婚怎么结(炫舞手游结婚怎么弄) 今天给各位分享炫舞结婚怎么结的知识,其中也会对炫舞手游结婚怎么弄进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在...

​水月青钢武器(青钢影打的过武器吗)

​水月青钢武器(青钢影打的过武器吗)

170

水月青钢武器(青钢影打的过武器吗) 今天给各位分享水月青钢武器的知识,其中也会对青钢影打的过武器吗进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始...

​三月英语(二月英语)

​三月英语(二月英语)

139

三月英语(二月英语) 今天给各位分享三月英语的知识,其中也会对二月英语进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧! 三月用英语怎么说 三月用...

​qq账号免费申请(帐号申请免费官网)

​qq账号免费申请(帐号申请免费官网)

111

qq账号免费申请(帐号申请免费官网) 本篇文章给大家谈谈qq账号免费申请,以及帐号申请免费官网对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 免费申请qq号 请点击新...

​cf女神(cf女神杯冠军顾朵)

​cf女神(cf女神杯冠军顾朵)

175

cf女神(cf女神杯冠军顾朵) 本篇文章给大家谈谈cf女神,以及cf女神杯冠军顾朵对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 cf女生版哥还有吗 1、穿越火线路小北的哥...

​怎么去巨兽岛(巨兽岛世界boss多久刷新)

​怎么去巨兽岛(巨兽岛世界boss多久刷新)

70

怎么去巨兽岛(巨兽岛世界boss多久刷新) 今天给各位分享怎么去巨兽岛的知识,其中也会对巨兽岛世界boss多久刷新进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现...

​红腹食人鲳(红腹食人鲳鱼怎么养)

​红腹食人鲳(红腹食人鲳鱼怎么养)

164

红腹食人鲳(红腹食人鲳鱼怎么养) 红腹食人鲳的生活习性 红腹食人鲳的生活按属分是群居性和独居性,群居的时常几百条、上千条聚集在一起,最小6只也可成群,能同时用视觉、嗅...