工业数据分析建模的实践与认识

工业数据分析建模的实践与认识

ID:43491138

大小:2.25 MB

页数:46页

时间:2019-10-08

工业数据分析建模的实践与认识_第1页
工业数据分析建模的实践与认识_第2页
工业数据分析建模的实践与认识_第3页
工业数据分析建模的实践与认识_第4页
工业数据分析建模的实践与认识_第5页
资源描述:

《工业数据分析建模的实践与认识》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、工业数据工业数据建模的实践与认识建模的实践与认识宝钢中央研究院郭朝晖2015.7.7引言:工业需要什么内内实践中的几个困惑容容简简数据建模的指导思想介介开展项目的步骤与方法总结工业数据应用:冰火两重天•1940年引入SPC技术•设备诊断,很久很久以前...•数据挖掘,20多年前...•工业大数据方兴未艾....理论很热,现实很冷•多数工作浅尝而止,难以深入•要做深入的研究可能耗费半生•我的一项工作,耗时整整12年期望是龙,得到是虫困难的本质要求落差大故而困难条件理解工业:理论知识和实践经验丰富新知识必须超越已有认识才有使用价值。有度难而无度易《韩非子.外储说左上》理解工业:对可靠性要求

2、高可靠性与使用价值是硬币的两面可靠性与使用价值是硬币的两面如果正确结论能带来巨大效益,如果正确结论能带来巨大效益,错误结论也可能带来巨大损失。错误结论也可能带来巨大损失。理论,是理想条件下的方法和原理;实用,是各种条件、约束和环境下的成功。理论,1%的成功是成功;实用,1%的失败是失败。正常的运行最容易想到,异常如何发生往往想不到的。可靠,常常是1行代码功能,10~100行防止异常。理想是如何变冷的......数据中有信息。信息中有知识。知识是有用的。欲得其利,先知其弊这些知识往往是:假的、错的、偏差大的局部、暂时的,且范围不确定正确却是已知、平庸的。似乎有道理却难以证实

3、。引言:工业需要什么内内实践中的几个困惑容容简简数据建模的指导思想介介开展项目的步骤与方法总结常见情况:分析结果不可重复Ys=300+200*C+80*Mn+..........Ys=230+800*C+40*Mn+..........没有共识的预测:可能是没用的靠不住结果很可能是海市蜃楼奇怪现象之一:相互矛盾局部与全局得到的结论,为何不吻合?最小二乘法的失灵yk(x)DxE(kˆ)kDxDE(kˆ)k扭曲的原理因变量范围自变量实际范围检测值变化范围极限情况是:自变量本身不变,信号变化都是误差。所谓成分测量值符合分形规律的说法,不靠谱。测量误差无法忽略:背后的原因在工作点

4、附近,在工作点附近,测量精度是控制精度的瓶颈测量精度是控制精度的瓶颈悲崔的结论•由高精度的模型是不存在的:精度有极限。•误差最小的模型并不能逼近正确–前场而至的原因:线性回归逼近最小误差。–各种以误差最小为优化目标的算法统统失效。•正确的模型误差较大–模型小是“错错得对”的结果•误差最小的模型可靠度低–外延性差、时间稳定性差:与误差分布有关。奇怪现象之二:新发现往往是错的技术原理可能发现背后原因厚度薄、强度高厚度越厚强度越高厚度厚伴随卷取温度降低粗轧温度无影响粗轧温度越高强度越高粗轧温度高是厚度薄所致粗轧温度终轧温度卷取温度轧制过程冷却段奇怪现象之二:新发现往往是错的工业生产系统是复杂

5、的系统人们根据知识设计前馈或反馈外在的相关关系往往与单纯物理关系不一致厚度生性能粗轧温度产过卷取温度程奇怪现象之三:总不收敛yf(x)希望fxy大数据背景理想:可拟合成光滑曲线现实:仍然很乱现象背后:被忽视的系统干扰初到宝钢的困惑:缺陷发生率不稳定有些因素不是直接影响因素。很难想到,却影响很大。•每年发生率不同。它或许不可知,却并不随机。–与钢种有关•固定钢种:–与精整有关指标变量•再固定精整:–与宽度有关输入对象1输出•再固定宽度:测量对象2实际–与检查人员相关。数值数值对象3•再固定检查人员:–与正反面相关。•........一个生活中的例子1.不堵时,分别耗时40、42

6、、36、49分钟,时间误差正负5%。2.周四、五,外环堵车43分钟。早高峰时翔殷路隧道堵车20分钟。国定路堵10分钟。堵车时间误差正负35%。可以走四条路1.自驾车。2.走外环隧道。3.礼拜一晚上。现实中的许多问题也不是概率问题但能固定条件后能转化为概率问题。平均40分钟,标准差5分钟。yf(x)yf(x,,r)因为不可见,将其看做随机因素未必依照某个概率分布发生概率分布:不确定性中的规律引言:工业需要什么内内实践中的几个困惑容容简简数据建模的指导思想介介开展项目的步骤与方法总结不是路到了尽头,不是路到了尽头,而是到了该转弯的时候而是到了该转弯的时候........数据分析:

7、指导思想用数据发现背后的规律:正确的模型反对用复杂化降低误差科学规律才是真正可靠的意识到误差最小与正确性的差异,不能盲目追求误差最小化。与科学理论和预见性相结合,才能最终确认结论的科学性。工业数据分析:因果才能可靠要排除各种假象,才能得到真实的结果;真实才能可靠。练太极拳的,身体差世界上有三种谎言:杀了公鸡,太阳照样升起谎言、弥天大谎和统计学数据建模的反思:只有两种类型结论结论数据分析数据数据假设条件展示数据本身正确性依赖于所呈现的现象先验的条

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。