不重视这些,你构建的模型根本没用

发布时间:2016-12-27 11:50:44来源:本站原创 我要收藏 取消收藏
数据质量分析是数据挖掘中的重要一环,错误的假设和糟糕的数据问题都是导致数据挖掘结果产生偏差的重要原因。数据挖掘从业者常常会说“垃圾进,垃圾出”,装入的数据是垃圾,计算出来的结果也是垃圾。很多的时候我们过度重视重视算法,而忽略数据本身,算法固然重要,但是优质完整的数据却是要优于好的算法,假设如数据质量一样,数据特征选择合理,就算法的本身而言是不会有特别大的差异的。 那么,基于以上的认识,在做数据挖掘建模之前,往往先要做相关的数据准备,本文重点介绍一下数据质量分析。

评论已有 0

登录之后才能发表评论
公众号
返回
顶部
请关注“官方公众号”
Copyright © 2013-2017   广州泰迪智能科技有限公司   技术支持   粤ICP备14098620号