欢迎来到天天文库
浏览记录
ID:45886516
大小:81.43 KB
页数:4页
时间:2019-11-19
《搜狗笔试题目范文》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、搜狗笔试题目范文 ①、机器学习 下列个不属于CRF模型对于HMM和MEMM模型的优势() A:特征灵活 B:速度快 C:可容纳较多上下文信息 D:全局最优 答案:B 解析:HMM模型是对转移概率和表现概率直接建模统计共现概率而MEMM模型是对转移概率和表现概率建立联合概率统计时统计的是条件概率CRF是在给定需要标记的观察序列的条件下计算整个标记序列的联合概率分布而不是在给定当前状态条件下定义下一个状态的状态分布MEMM容易陷入局部最优是因为MEMM只在局部做归一化CRF模型中统计了全局概率在做归一化时考虑了数据在全局
2、的分布而不是仅仅在局部归一化这样就解决了MEMM中的标记偏置的问题 CRF没有HMM那样严格的独立性假设条件因而可以容纳任意的上下文信息特征设计灵活CRF需要训练的参数更多与MEMM和HMM相比它存在训练代价大、复杂度高的缺点 ①、机器学习 下列个不属于CRF模型对于HMM和MEMM模型的优势() A:特征灵活 B:速度快 C:可容纳较多上下文信息 D:全局最优 答案:B 解析:HMM模型是对转移概率和表现概率直接建模统计共现概率而MEMM模型是对转移概率和表现概率建立联合概率统计时统计的是条件概率CRF是在给
3、定需要标记的观察序列的条件下计算整个标记序列的联合概率分布而不是在给定当前状态条件下定义下一个状态的状态分布MEMM容易陷入局部最优是因为MEMM只在局部做归一化CRF模型中统计了全局概率在做归一化时考虑了数据在全局的分布而不是仅仅在局部归一化这样就解决了MEMM中的标记偏置的问题 CRF没有HMM那样严格的独立性假设条件因而可以容纳任意的上下文信息特征设计灵活CRF需要训练的参数更多与MEMM和HMM相比它存在训练代价大、复杂度高的缺点 ②、概率 假设一个完整的扑克牌有52张牌2黑色(黑葵和梅花)和2红色(方块和红心)如果给你一副完整的牌和半副
4、牌(1红色和1黑色)则两种情况下抽两张牌都是红色的概率是多少() A:1/21/2 B:25/10212/50 C:50/5124/25 D:25/5112/25 答案:B 解析:一副牌第一张为红色的概率为26/52第二张为红色的概率为25/51两张都为红色的概率为:26/52*25/51=25/102 半副牌第一张为红色的概率为13/26第二张为红色的概率为12/25两张都为红色的概率为:13/26*12/25=12/50 ③、机器学习 下面关于ID3算法中说法错误的是() A:ID3算法要求特征必须离
5、散化 B:信息增益可以用熵而不是GINI系数来计算 C:选取信息增益最大的特征作为树的根节点 D:ID3算法是一个二叉树模型 答案:D 解析:ID3算法的核心思想是以信息增益度量属性选择选择分裂后信息增益最大的属性进行分裂ID3算法的局限是它的属性只能取离散值为了使决策树能应用于连续属性值情况可以使用ID3的一个扩展算法C4.5算法BC选项都是ID3算法的特点ID3算法生成的决策树是一棵多叉树分支的数量取决于分裂属性有多少个不同的取值因此D选项错误 假设一个完整的扑克牌有52张牌2黑色(黑葵和梅花)和2红色(方块和红心)如果给你
6、一副完整的牌和半副牌(1红色和1黑色)则两种情况下抽两张牌都是红色的概率是多少() A:1/21/2 B:25/10212/50 C:50/5124/25 D:25/5112/25 答案:B 解析:一副牌第一张为红色的概率为26/52第二张为红色的概率为25/51两张都为红色的概率为:26/52*25/51=25/102 半副牌第一张为红色的概率为13/26第二张为红色的概率为12/25两张都为红色的概率为:13/26*12/25=12/50 ③、机器学习 下面关于ID3算法中说法错误的是() A:ID3
7、算法要求特征必须离散化 B:信息增益可以用熵而不是GINI系数来计算 C:选取信息增益最大的特征作为树的根节点 D:ID3算法是一个二叉树模型 答案:D 解析:ID3算法的核心思想是以信息增益度量属性选择选择分裂后信息增益最大的属性进行分裂ID3算法的局限是它的属性只能取离散值为了使决策树能应用于连续属性值情况可以使用ID3的一个扩展算法C4.5算法BC选项都是ID3算法的特点ID3算法生成的决策树是一棵多叉树分支的数量取决于分裂属性有多少个不同的取值因此D选项错误
此文档下载收益归作者所有