大数据分析建模方法
大数据分析建模总共要进行5个步骤:选择模型——训练模型——评估模型——英勇模型——优化模型结构,下面将分步介绍每个步骤:
第一步:选择模型/自定义模型 基于业务基础来决定选择模型的形态,比如,如果要预测产品销量,则可以选择数值预测模型。(可采用回归模型,时序预测)
第二步:训练模型 之所以叫模型,因为每个模型大致的模式是固定的,但其中还会有一些不确定的变量在里面,这样模型才会有通用性,而训练模型的意思就是找到最合适的参数,一旦找到最优参数,模型就基本可用了!
第三步:评估模型 也即是字面意思,但一个模型的好坏是需要放在其特定的业务场景下来评估的。 评价模型质量的常用指标有:平均误差率、判定系数R2 评估分类预测模型质量的常用指标(如下图所示):正确率、查全率、查准率、ROC曲线和AUC值等
第四步:应用模型 评估测量完成后,就要将此模型应用于业务基础的实践中去,用于解决工作中的业务问题的,比如预测客户行为,比如划分客户群。
第五步:优化模型,一般发生在两种情况下: 1.在评估模型中,如果发现模型欠拟合,或者过拟合,说明这个模型待优化; 2.在真实应用场景中,定期进行优化,或者当发现模型在真实的业务场景中效果不好时,也要启动优化;
多重随机标签