欢迎来到天天文库
浏览记录
ID:48714654
大小:7.25 MB
页数:43页
时间:2020-01-19
《基于机器学习对销量预测的研究.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、基于机器学习方法对销售预测的研究销售预测现状与痛点CONTENTS0102销售预测四大步骤03销售预测基本方法04销售预测效果评估方法与指标05某电商网站销售预测案例分享销售预测全景图供货链条送货时间、送货地点、是否包邮等物流市场营销促销方案商品减价、商品促销、组合销售等生成和采购合理安排生成和采购的时间节点,优化库存库存财务管理财务和会计实时反馈公司财务报表,监控公司资金流动管理销售预测的现状与痛点销售预测是完善客户需求管理、指导运营、以提高企业利润为最终目的商业问题。而预测的精确性是销售预测的核心痛点。销售预测的痛点商业环境因素众多,变化极快,难以及时把握和分析供应链
2、整体水平低,导致货物积压严重产品定价、商品服务的单一性,导致企业竞争力小变化模式预测的基本思想预测是通过历史数据或其他外部因素构建模型、学习其变化“模式”,利用该“模式”对未来事物进行预测的一个过程。特点:短期预测的精度要远远高于长期预测。业务理论数据量假设销售预测体系框架销售预测现状与痛点CONTENTS0102销售预测四大步骤03销售预测基本方法04销售预测效果评估方法与指标05某电商网站销售预测案例分享收集数据确定预测对象、预测目标和需求;预测周期:短、中和长期需求与预测精度的权衡准确性与可解释性的权衡预测目标收集数据、整理指标体系数据描述与数据探索数据
3、预处理评价指标算法的选择模型的训练与预测过拟合问题的处理建立建模RMSE、MAPE等定量评价指标AIC、BIC等模型评价指标需求探索开发完善预测的基本步骤预测目标预测对象:性质、结构、业务场景等预测时间:短期预测、中期预测和长期预测等精确性可解释性时间数据量少于5天大于4周或1个月短期预测长期预测中期预测介于两者之间业务目标:准确性和模型可解释性的匹配度数据探索对数据检查和理解:比如库存量为负值、星期数大于8等对结果变量的分析:包括分布、趋势性、周期性等对预测变量的分析:包括变量筛选、多重共线性、相关性数据预处理中心化和标准化缺失值处理:邻近插补、多重插补、线性
4、插补等数据转换:取对数、Box-Cox变换离群点处理数据降维和特征选择:PCA、AIC/BIC等收集数据或理解数据数据搜集目标数据(内部数据、外部数据)额外数据:天气、经纬度、节假日、CPI指数等时期变量2015-05-2310.02015-05-2410.0…2016-05-099.82016-05-109.8时期变量2015-05-23NA2015-05-2410.0…2016-05-099.82016-05-10NA处理之前处理之后收集数据或理解数据数据预处理的缺失值部分处理缺失值的两大类方法:(1)直接删除缺失的预测变量(2)利用不同的方法对预测变量的缺失值进行插
5、补,插补方法有:均值插补、多重插补、随机插补、K近邻插补、线性插补等。注意:一般对于带有时间戳的时序变量,考虑到变量的时效性和经济因素,通常采用邻近插补法或者线性插补。一个需要进行数据变换的原因是去除分布的偏度。一个无偏分布是大致对称的分布,这意味着随机变量落入分布均值两侧的概率大体一致。数据变换一般有两种方法:(1)对数据做变换,如取对数、平方根或倒数(2)Box-Cox变换收集数据或理解数据数据预处理的数据变换部分销售预测现状与痛点CONTENTS0102销售预测四大步骤03销售预测基本方法04销售预测效果评估方法与指标05某电商网站销售预测案例分享主观预测专家法时间
6、序列指数平滑法自回归移动模型销售预测的基本方法机器学习线性回归决策树随机森林xgboost神经网络支持向量回归时间销量销量时间根据过去经验专家法专家预测法:由专家根据他们的经验和判断能力对待定产品的未来销售进行判断和预测,通常有三种不同的形式:(1)个别专家意见汇集法(2)专家小组法(3)德尔菲法优点:简单、快速缺点:准确率低、受人的主观影响大指数平滑遵循“重近轻远”原则,对全部历史数据采用逐步衰减的不等加权办法进行数据处理的一种预测方法。基本公式:??+1=?∙??+(1−?)??−1其中,??是时间?的时间值;?是平滑常数,其取值范围为[0,1]。优点:简单、适合趋势
7、预测、模糊预测缺点:准确率不高、需要趋势性较好的数据指数平滑法ARIMA模型是指将非平稳时间序列转化为平稳时间序列,然后将结果变量做自回归(AR)和自平移(MA)。自回归移动模型(ARIMA)训练集测试集机器学习算法模型参数模型评估特征筛选预测Y’值真实Y值YX样本数据销售量影响销售量的因素机器学习的实现流程使用机器学习的有监督学习对进行销量变化进行建模,依据建模结果来预测未来销量值。其实现流程如下:(X,Y)(4)模型选择,如随机森林、LASSO等[模型输出]x3x4x2····x4x1x6x5x3x1x6x5特征筛选特征筛
此文档下载收益归作者所有