清华大学模式识别往年考题2

清华大学模式识别往年考题2

ID:13606455

大小:23.50 KB

页数:4页

时间:2018-07-23

清华大学模式识别往年考题2_第1页
清华大学模式识别往年考题2_第2页
清华大学模式识别往年考题2_第3页
清华大学模式识别往年考题2_第4页
资源描述:

《清华大学模式识别往年考题2》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、模式识别张长水2007.7.114:00-16:00             1(15分)两类分类问题,P(w1)=1/4,P(w2)=3/4。样本有两个特征,分别是x和y。两类?的概率密度函数:w1,在0<=x<=3、0<=y<=3中均匀分布,其余为0;w2,在2<=x<=5、1<=y<=7中均匀分布,其余为0。请设计做小错误率贝叶斯分类器,并计算误分率。             2(20分)支持向量机通过二次最优化得到支持向量。现在有一个两类分类问题,共有N个样本,样本有d维特征空间,样本集合是线性可分的。试使用遗传算法求解支持向量,说明算法步骤和使用的遗传算子

2、。使用遗传算法求解支持向量有什么优缺点?             3(20分)两类分类问题,有3个特征x,y,z,共有N个样本。通过经验知道将3个特征进行加权相加得到的特征将具有更好的分类性能,但是不知道如何得到各个特征的权重。试回答?如何得到各个特征的权重。给出必要的计算和推导过程。             4(15分)使用多级聚类算法对下面的样本进行聚类,使用最近距离量度。给出计算过程,多级聚类树。问应该分成几类,为什么?举例说明使用最近距离量度聚类和使用最远距离量度聚类各自的优缺点。(1,0)(2,0)(0,2)(1,3)(0,5)5(20分)距离是模式识别中

3、的重要概念,试说明贝叶斯分类器、近邻法、Fisher投影法、C均值算法是否受不同距离量度选择的影响。如果不是,说明原因;如果是,举例说明受什么影响。             6(10分)一个袋子中装有红、绿、蓝三种颜色的球,采用有放回的取球方法,取出N个球,其中有n1个红色球、n2个绿色球和n3个蓝色球的概率为p(n1,n2,n3)=(N!/(n1!n2!n3!))*p1^n1*p2^n2*p3^n3其中n1+n2+n3=N,p1+p2+p3=1已知概率模型如下:p1=1/4p2=1/4+p/4p3=1/2-p/4如果一个人是红绿色盲,分不清红色球和绿色球,那么他只

4、能知道他取了m1=n1+n2个红/绿球,和m2=n3个蓝色球。试通过这些数据估计概率模型中的p,并估计红色球和绿色球的数?。            --------------------------------不出意外的话应该是在清华最后一门考试了,复习的时候又极其痛苦,500+张ppt,很多公式要理解要背,所以得纪念一下,粗略回忆一下今天考的内容,给后面的同学留点参考吧             (这里研究生的考试题实在有点稀少)             模式识别林行刚(电子系)期末闭卷2008.6.27             一、判断对错40*0.5=20分

5、[1m考的题很细,涉及了各个方面,比如             简单模式匹配、K-L变换(2题)、最小欧氏距离、权向量定义、近邻函数定义、单个神经元分类是否是线性的、子空间(1题)、             “最小马氏距离分类器的错误概率一定不会比最小欧氏距离分类器的错误率大”。             二、对现有算法的理解5*5=251、s个类,可以用s(s-1)/2个线性分类器分开,称为这个样本集成对线性可分。举例二、对现有算法的理解5*5=251、s个类,可以用s(s-1)/2个线性分类器分开,称为这个样本集成对

6、线性可分。举例说明,成对线性可分不一定线性可分。             2、定义相似度为20-min(d{Xi,Xj})(Xi属于类wi,Xj属于类wj),其中d{Xi,Xj}表示两个样本之间的欧氏距离,给了一组样本10个数据,{-2.2,-2.0,-0.3,0.1,0.2,0.4,1.6,1.7,1.9,2.0}(好像是这样),请画出层次聚类算法的分类树,并说明最终聚为几个类比较好。             3、KMP算法,对于在字符串text[1,2,...,n]中查找字串pat[1,2,...,m],当匹配到pat中的p[j]发现不匹配时,         

7、    1)应该怎样确定下一个pat开始查找的位置next[j];             2)给出4个pat形式,写出对于所有j值写出next[j]的值。四个形式大概是abcd,abcaaaad,abcadbab(最后一个不确定)             3)什么情况是最坏情况,最坏要进行多少次比较             4、给定字符串abbc和abcbc,给出求解编辑距离的步骤图并给节点标上最小费用,求编辑距离,画出最小路径,简要说明寻找最小费用路径的步骤。4、给定字符串abbc和abcbc,给出求解编辑距离的步骤图并给节点标上最小费用,求编辑距离,画出最

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。