北京大学生物信息平台论坛

 找回密码
 立即注册
搜索
热搜: 通知 活动

【网页】数据不平衡分类方法

[复制链接]
licheng 发表于 2016-3-31 17:36:04 | 显示全部楼层 |阅读模式
http://www.jianshu.com/p/3e8b9f2764c8
不平衡数据下的机器学习方法简介

http://developer.51cto.com/art/201510/494386.htm
8大策略让你对抗机器学习数据集里的不均衡数据

http://m.dzsc.com/data/html/2011-8-30/95760.html
分析样本大小对非平衡数据分类的影响

http://www.wtoutiao.com/p/111u544.html
令人讨厌的非平衡数据

http://www.docin.com/touch/detail.do?id=165162507
非平衡数据集分类问题研究进展

http://www.docin.com/touch/detail.do?id=1457071153
非平衡类数据分类概述

http://www.docin.com/touch/detail.do?id=1063800732
关于非平衡数据特征问题的研究


回复

使用道具 举报

 楼主| licheng 发表于 2016-4-6 12:27:43 | 显示全部楼层
【博强评论】非常经典的问题!一个极端情况是,某罕见疾病发病率万分之一,那么我全都预测没病,则模型正确率高达99.999% !所以要把不同尺度算出的true positive 和对应的false positive画成roc曲线,计算roc面积。
回复 支持 反对

使用道具 举报

北京大学生物信息平台论坛

GMT+8, 2017-9-20 06:36 , Processed in 0.043190 second(s), 25 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表