猿题库_邓澍军_在线教育领域的机器学习应用

猿题库_邓澍军_在线教育领域的机器学习应用

ID:43805277

大小:1.44 MB

页数:38页

时间:2019-10-14

猿题库_邓澍军_在线教育领域的机器学习应用_第1页
猿题库_邓澍军_在线教育领域的机器学习应用_第2页
猿题库_邓澍军_在线教育领域的机器学习应用_第3页
猿题库_邓澍军_在线教育领域的机器学习应用_第4页
猿题库_邓澍军_在线教育领域的机器学习应用_第5页
资源描述:

《猿题库_邓澍军_在线教育领域的机器学习应用》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、在线教育领域的机器学习应用邓澍军dengsj@yuantiku.com2015.04.25提纲小猿搜题猿题库猿辅导概述之之之总结拍照搜题能力预测老师推荐10年代DeepLearning90-00年代机器学习SVMBoosting随机森林70-80年代神经网络50-60年代感知机2012-移动互联网在线教育10年代在线教育互联网公司进军在线教育00年代传统教育转战线上90年代网校:远程教育机器学习邂逅在线教育机器学习在线教育应用之一:小猿搜题之拍照搜题小猿搜题之拍照搜题小猿搜题技术框架图片预处理切分插图CNN

2、识别匹配NLP纠错搜索返回题目图片类别图片特征图片内容多样预处理•语数英等10来个科目切分插图模糊图很多,占30%+CNN识别匹配•光照、扭曲、抖动等NLP纠错含有大量公式,数学占50%搜索•上下标、分式、根号等返回题目模糊图片图片预处理切分CNN识别插图匹配NLP纠错搜索返回题目公式图片图片预处理切分CNN识别插图匹配NLP纠错搜索返回题目图片预处理图片预处理切分CNN识别插图匹配NLP纠错搜索返回题目字符切分图片预处理切分CNN识别插图匹配NLP纠错搜索返回题目复杂公式切分图片预处理切分CNN识

3、别插图匹配NLP纠错搜索返回题目卷积神经网络模型图片Softmax预处理FullConnectionDropout切分ReLUCNN识别插图Convolutions匹配MaxPoolingNLP纠错Convolutions搜索MaxPoolingConvolutions返回题目MaxPoolingConvolutions自动生成标注数据标注数据自动生成图片场景融合预处理旋转、拉伸等切分插图CNN识别匹配NLP纠错搜索返回题目DeepLearning优化DeepLearning的优化算法多种图片多样,

4、模型最终的效果也不尽预处理相同切分小猿搜题中尝试了多种不同优化插图算法CNN识别匹配一般来说,先SGD再采用Gauss-NLP纠错Newton能够在更短时间内收敛搜索返回题目DeepLearning加速用GPUK40训练相比CPU模式图片速度能够提升5-6倍预处理GPUK40线上预测速度能够提切分升2-4倍插图CNN识别匹配NLP纠错搜索返回题目辅助策略——NLP纠错利用语言模型进行纠错图片平行回边形平行四边形预处理切分电灯炮电灯泡CNN识别插图入人匹配NLP纠错l1搜索返回题

5、目辅助策略——插图匹配如果题目中的插图匹配(SIFT图片等特征),则为加分项预处理切分CNN识别插图匹配NLP纠错搜索返回题目搜索搜索主要模块图片分词预处理倒排索引切分排序CNN识别插图匹配•LearningtoRank:GBRTNLP纠错搜索返回题目搜索示例搜索示例小结小猿搜题之拍照搜题ComputerVision•预处理•切分•训练数据自动生成DeepLearning•识别NLP•纠错LearningtoRank•排序应用之二:猿题库学生能力预测猿题库学生能力预测猿题库学生能力预测(

6、续)传统教育模型项目反应理论(IRT)最简单的IRT模型题目难度b•标注学生能力?•模型参数,优化得到机器学习模型机器学习模型Offlinemodel•LogisticRegressionOnlinemodel•Follow-the-Regularized-Leader特征所用特征用户相关特征•学校,地区,目标考试,……题目相关特征•知识点,关键词,难度,……时序特征•距离高考时间,……组合特征预测分评估1009080706050真实平均分40预测平均分3020100理数物理化学英语

7、生物2014年广东省理科高考小结传统教育模型项目反应理论(ItemResponseTheory)机器学习模型Offlinemodel•LR(LogisticRegression)Onlinemodel•FTRL(Follow-The-Regularized-Leader)应用之三:猿辅导老师推荐猿辅导老师推荐猿辅导老师推荐(续)推荐系统冷启动:Content-BasedItem-BasedCollaborativeFiltering机器学习LogisticFactorizationMac

8、hineExploitationandExploration(E&E)总结小猿搜题之拍照搜题DeepLearningComputerVisionLearningtoRank猿题库学生能力预测传统教育领域的项目反应理论(IRT)计算广告点击率预测模型LR、FTRL猿辅导老师推荐推荐系统LFM,E&E未来教育领域知识图谱学生的最优能力成长之路手写识别手写拍照搜题解答题自动判卷高考机

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。