mapreduce实现决策树算法,求帮助

查看数: 7612 | 评论数: 5 | 收藏 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2016-5-10 15:47

正文摘要:

mapreduce实现决策树算法(C4.5),比如下场景: 前面的属性有的连续的 有的是间断的,最后参保几率照理来说是连续的,是0-100%,给出前面一些属性,求最后红框中的参保率,如果用mapreduce能否实现? 请大神给 ...

回复

xw2016 发表于 2016-6-5 13:46:24
没看懂要做什么
shenqianwen 发表于 2016-5-24 14:23:44
szcountryboy 发表于 2016-5-13 18:05
自己随写的,仅供参考:
1>先根据年龄通过聚类算法(k-means),计算出中间年龄
2>然后根据年龄进行左右二叉 ...

哥们  如果最后推算不是参保机率   而是是否能参保?    有用hadoop实现过没呀
szcountryboy 发表于 2016-5-13 18:05:58
本帖最后由 szcountryboy 于 2016-5-13 18:17 编辑

自己随写的,仅供参考:
1>先根据年龄通过聚类算法(k-means),计算出中间年龄
2>然后根据年龄进行左右二叉树分解
3>自变量 婚姻状况
...
x>直到,就业情况计算出是否购买

线性回归,参考:
婚姻:已婚=0.1
           未婚=0.2
           离异=0.3
房产证,就业, 健康,户籍:  参考婚姻
        年龄值 x1 + 婚姻值 x2 + 收入值 x3   + 户籍值 x4 + 健康值 x5 + 房产证值 x6 + 就业值 x7 = 参加低保几率
行1   23x1 + 0.2x2 + 200 x3 + 0.1 x4 + 0.1 x5 + 0.1 x6 + 0.1 x7 = 0.01
...........................
尾行 42x1 + 0.3x2 + 5000x4 + 0.2x4+0.1x5 + 0.2x6 +0.2 x7 = ?

? 就是你要求得值,

先计算出 自变量(x1,x2,x3,x4,x5,x6,x7)的值
然后再根据上面计算出?的值



shenqianwen 发表于 2016-5-10 16:25:46
muyannian 发表于 2016-5-10 16:09
做过的人不多,也没看明白楼主的意思。
如果是求最后的概率值,直接用计算机弄个计算式就行。跟决策似乎没 ...

恩恩,决策树好像不适合最后求概率的场景。
非要给出标准么?    没有标准就训练不出决策树了么?
muyannian 发表于 2016-5-10 16:09:19
做过的人不多,也没看明白楼主的意思。
如果是求最后的概率值,直接用计算机弄个计算式就行。跟决策似乎没有关系。
如果说根据里面的条件来判断是否可以参保,倒是可以用。
关键是里面的条件需要有个标准,具备哪些条件才能参保
关闭

推荐上一条 /2 下一条