欢迎来到天天文库
浏览记录
ID:41866904
大小:2.09 MB
页数:19页
时间:2019-09-03
《唐诗相似性比对》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、唐诗相似性比对曹俊越00611109韩晓帆00611111综述:功能检索诗歌:诗歌的查找,录入和输出检索某个题目的诗歌核心:题目的相同性,内容的相似性,情感风格的相似性对诗中某字词的检索输出某首诗某个方面的相关参数,如情感,季节等实现方案与结构1structelement{inta;intb;char*ch;intc;intd;element*e;};实现方案与结构2structNode{intserialNum;//诗歌序号set*title;//标题set*content;//诗体内容}实现方案与结构3structset{intn;element*e;};
2、实现方案与结构4element*creatnewelement(void)//建立一个新的元素set*creatnewset(void)//建立一个新的元素集合Node*creatnewnode(void)//建立一个新的储存诗的结构体voidelementcopy(element*a,element*b)//对元素进行复制的操作voidinsertelement(set*se,element*el)//向集合中插入一个元素voidreadpoem(FILE*fp,Node*p)//将文件指针处的诗歌读入结构体……用途:检验两组(或多组)数据平均数是否相等,即
3、判定两个样本差异性是否显著。特点:不要求正态母体,只要求样本相互独立。方法:见《实用生物统计》(第二版)P123。初衷:为了消除相似性总是为零的影响。假设:若两首诗歌相似性比较高,则它们的秩和应在两临界值之间。将内容和题目相似性计算出来的值乘以运用秩和检验数据表得到的数据,若得到的总相似性为0,这说明内容和题目相似性很小,以至于可以忽略,则舍弃内容和题目相似性的数值,另用秩和检验数表得到的数据修正当作相似性的数值。两总体秩和检验1256910347812345678910查表得:上限36下限15显著性水平:0.05按啥顺序排的?秩和检验是不能这样用的!1夏2春
4、3早春2暮春0150殘花3飘零2落红1落花0春殘季节103102100出自周克,陈延哲《诗歌相似度计算算法》.ppt第四页枯藤老树昏鸦,小桥流水人家。关于第五个功能的扩展利用以上的成果和现有字库可以实现多接口的诗歌参数计算。实质:诗歌与字库的求交运算暮春:春殘,落花,落红,飘零,辭枝,殘花,香消,委泥,點苔,亂紅,墮红,墜粉,鶯老,殘紅春:桃,蕙,鶯,蜂,櫻,蝶,春風,春草,春光,春花,春華,百花,柏酒,爆竹,殘雪,春酒,春雷,春泥,春天,春宵,東風,杜鵑,芳菲,飛絮,寒食,蝴蝶,花柳,黃鸝,黃鳥,黃鶯,蕙蘭,蛺蝶,嬌鶯,鵁鶄,金谷,蘭蓀,爛漫,爛熳,梨花,
5、流鶯,柳花,柳色,柳絮,柳眼,落梅,落絮,落英,鳴鳩,二月,三月,新年,元巳,淑氣,歲華,踏青,桃花,桃李,屠蘇,酴醾,物華,曉鶯,新歲,新葉,新雨,杏花,杏園,陽和,楊花,夭桃,野桃,櫻桃,紫燕,立春,中春,仲春,孟春作业中遇到的问题当程序越写越大时,一个地方的错误往往导致几个甚至几十个错误,牵一发而动全身“写程序真的是一种艺术,是需要精心雕琢的。”让没有选生统课的韩晓帆做这次报告总结与展望由于时间有限,要实现的功能又太过复杂,因此很多思想只能存在于概念之中,已经实现的也并不都尽如人意。将算法与统计学相结合,可以得到一些意想不到的结论。如果有足够的支持,如周
6、克、陈延哲同学的同义词的处理的B+树法,也许能够做出更有意义的工作。THANKYOU!
此文档下载收益归作者所有