基于欠采样随机森林的Stacking模型研究--以半导体良率预测为例

基于欠采样随机森林的Stacking模型研究--以半导体良率预测为例

ID:37106532

大小:1.46 MB

页数:51页

时间:2019-05-17

基于欠采样随机森林的Stacking模型研究--以半导体良率预测为例_第1页
基于欠采样随机森林的Stacking模型研究--以半导体良率预测为例_第2页
基于欠采样随机森林的Stacking模型研究--以半导体良率预测为例_第3页
基于欠采样随机森林的Stacking模型研究--以半导体良率预测为例_第4页
基于欠采样随机森林的Stacking模型研究--以半导体良率预测为例_第5页
资源描述:

《基于欠采样随机森林的Stacking模型研究--以半导体良率预测为例》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2018年度同等学力申请硕士学位论文分类号:学校代码:10269密级:学号:2013596基于欠采样随机森林的Stacking模型研究----以半导体良率预测为例院系:经济与管理学部统计学院专业:统计学研究方向:应用统计指导教师:李艳副教授学位申请人:尤芳芳2018年11月-1-2018TheSameEducationalLevelAppliedForMaster'sDegreeThesisUniversitycode:10269StudentID:2013596EastChinaNormalUniv

2、ersityTheRF-StackingModelwithUnder-sampling----PredictionforSemiconductorYieldDepartment:SchoolofStatistics,FacultyofEconomicsandManagementMajor:StatisticsResearchdirection:AppliedStatisticsSupervisor:AssociateProfessorLIYanCandidate:YOUFangfangNovember

3、,2018-2-√√华东师范大学硕士学位论文尤芳芳硕士学位论文答辩委员会成员名单姓名职称单位备注赵晓兵教授浙江财经大学主席吴贤毅教授华东师范大学吴述金副教授华东师范大学许忠好副教授华东师范大学贺思辉副教授华东师范大学IV华东师范大学硕士学位论文摘要当前,半导体芯片通过多层次物理测试来判别芯片的优良性能。半导体芯片测试产生了庞杂的数据,这些数据背后隐藏着大量芯片质量的信息。本文探讨的是将数据挖掘技术应用于半导体行业,以提升半导体产品良率,降低半导体制造业成本。芯片测试产生的数据呈现出高维和不平衡两个特性

4、。一般地,很多研究者分别对高维问题和不平衡问题进行了研究,提出了一系列成熟的算法,但是这些算法对半导体行业这种同时存在高维特性和不平衡特性的数据效果欠佳。本文首先对数据的高维特性和不平衡特性作了介绍,并阐述了当前针对这两个问题的处理方法,描述了数据挖掘的模型评价指标并定义了半导体行业评价指标。接着结合行业实际阐述了半导体良率预测问题的提出和应用场景以及半导体数据的预处理方法。然后分析了随机森林算法的优缺点,并在此基础上优化了随机森林算法,提出了基于欠采样随机森林的Stacking模型算法。最后用行业实

5、际数据进行了验证,证明了该算法的有效性。这为数据科学替代一部分传统芯片测试方案提供可行性基础,为半导体封装测试大幅降低成本提供可能。关键词:半导体测试,高维不平衡,随机森林,Stacking模型,芯片,良率预测V华东师范大学硕士学位论文ABSTRACTInSemiconductormanufacturing,wehavemultiplelevelsoftestingtotestthechipperformance.Thereishugedatafromtesting,whichindicatesthe

6、chipperformance.Thispapertriestoapplydataminingmethodsinsemiconductorindustry,toimprovetheproductyieldandreducethemanufacturingcost.Thesemiconductormanufacturingdataisunbalancedanditishigh-dimensional.Researchershavedevelopedaseriesofalgorithmsonunbalan

7、ceddataorhigh-dimensionaldataseparately.However,thosealgorithmscannotworkwellonunbalancedandhigh-dimensionaldatalikesemiconductormanufacturingdata.Thispaperfirstlyintroducesthegeneralsolutionsofthesetwoproblemsandproposesthegoodnessindicatorsformodeland

8、forappliedindustry.AndthenthispaperdescribestheactualproblemformSemiconductorindustrythatyieldproductionisahighpotentialofcostsavingproject.ItanalyzestheprosandconsofRandomForestalgorithm,andproposestheRF-Stackingmodelwithunder-s

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。