分享

mapreduce实现决策树算法,求帮助

回帖奖励 7 云币      回复本帖可获得 1 云币奖励! 每人限 1 次
mapreduce实现决策树算法(C4.5),比如下场景: 1.jpg
前面的属性有的连续的 有的是间断的,最后参保几率照理来说是连续的,是0-100%,给出前面一些属性,求最后红框中的参保率,如果用mapreduce能否实现?
请大神给点意见,如果不行把最后参保率改成能否参保,可行么?如果有实现过的能否给小弟讲解一下,谢啦!
本人QQ 757661238   解决了打赏



已有(5)人评论

跳转到指定楼层
muyannian 发表于 2016-5-10 16:09:19

回帖奖励 +1 云币

做过的人不多,也没看明白楼主的意思。
如果是求最后的概率值,直接用计算机弄个计算式就行。跟决策似乎没有关系。
如果说根据里面的条件来判断是否可以参保,倒是可以用。
关键是里面的条件需要有个标准,具备哪些条件才能参保
回复

使用道具 举报

shenqianwen 发表于 2016-5-10 16:25:46
muyannian 发表于 2016-5-10 16:09
做过的人不多,也没看明白楼主的意思。
如果是求最后的概率值,直接用计算机弄个计算式就行。跟决策似乎没 ...

恩恩,决策树好像不适合最后求概率的场景。
非要给出标准么?    没有标准就训练不出决策树了么?
回复

使用道具 举报

szcountryboy 发表于 2016-5-13 18:05:58

回帖奖励 +1 云币

本帖最后由 szcountryboy 于 2016-5-13 18:17 编辑

自己随写的,仅供参考:
1>先根据年龄通过聚类算法(k-means),计算出中间年龄
2>然后根据年龄进行左右二叉树分解
3>自变量 婚姻状况
...
x>直到,就业情况计算出是否购买

线性回归,参考:
婚姻:已婚=0.1
           未婚=0.2
           离异=0.3
房产证,就业, 健康,户籍:  参考婚姻
        年龄值 x1 + 婚姻值 x2 + 收入值 x3   + 户籍值 x4 + 健康值 x5 + 房产证值 x6 + 就业值 x7 = 参加低保几率
行1   23x1 + 0.2x2 + 200 x3 + 0.1 x4 + 0.1 x5 + 0.1 x6 + 0.1 x7 = 0.01
...........................
尾行 42x1 + 0.3x2 + 5000x4 + 0.2x4+0.1x5 + 0.2x6 +0.2 x7 = ?

? 就是你要求得值,

先计算出 自变量(x1,x2,x3,x4,x5,x6,x7)的值
然后再根据上面计算出?的值



回复

使用道具 举报

shenqianwen 发表于 2016-5-24 14:23:44
szcountryboy 发表于 2016-5-13 18:05
自己随写的,仅供参考:
1>先根据年龄通过聚类算法(k-means),计算出中间年龄
2>然后根据年龄进行左右二叉 ...

哥们  如果最后推算不是参保机率   而是是否能参保?    有用hadoop实现过没呀
回复

使用道具 举报

xw2016 发表于 2016-6-5 13:46:24

回帖奖励 +1 云币

没看懂要做什么
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条