欢迎来到天天文库
浏览记录
ID:33994834
大小:69.50 KB
页数:6页
时间:2019-03-03
《基于知网的语义相似度计算》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、基于《知网》的语义相似度计算软件使用手册1功能简介本软件是根据[刘群2002]一文中的原理编写的词汇语义相似度计算程序。主要实现了以下功能:1.1基于交互输入的义原查询、义原距离计算、义原相似度计算1.2基于交互输入的词语义项查询、义项相似度计算、词语相似度计算;1.3基于文件输入的词语义项查询、词语相似度计算;1.4相似度计算中的参数调整。2安装说明本软件包一共有四个文件:《基于<知网>的词汇语义相似度计算》软件使用手册.doc:本使用手册《基于<知网>的词汇语义相似度计算》论文.pdf:本软件所依据的论文,采用pdf格式,
2、用AcrobatReader阅读时需要安装简体中文支持包。自然语言处理开放资源许可证.doc:本软件包的授权许可证WordSimilarity.zip:程序文件软件安装时,将文件WordSimilarity.zip文件解压缩一个目录下即可,解压缩后有以下几个文件:WordSimilarity.exe:可执行程序;Glossary.dat:《知网》数据文件Semdict.dat:《知网》数据文件Whole.dat:《知网》数据文件必须确保《知网》数据文件在程序执行时的当前目录下。3界面说明软件使用简单的对话框界面,如下所示:1功
3、能说明1.1义原操作1.1.1义原查询1.首先在“输入1”框中输入义原名称;2.点击“察看义原1”按钮;3.在“义项1”框中将依次显示出该义原及其所有上位义原的编号、中文、英文;类似的方法可以查询“输入2”框中的义原;1.1.2义原距离计算1.首先在“输入1”和“输入2”框中输入两个义原;2.点击“计算义原距离”按钮;3.在“输出”框中显示两个义原的距离;1.1.1义原相似度计算1.首先在“输入1”和“输入2”框中输入两个义原;2.点击“计算义原相似度”按钮;3.在“输出”框中显示两个义原的相似度;1.2基于交互输入的词语操作
4、1.2.1词语义项查询1.首先在“输入1”框中输入要查询的词语;2.点击“察看义项1”按钮;3.在“义项1”框中将依次显示出该词语的所有义项;类似的方法可以查询“输入2”框中的词语义项;1.2.2义项相似度计算1.首先分别在“输入1”和“输入2”框中输入要计算相似度的两个词语;2.点击“察看义项1”按钮和“察看义项2”按钮;3.在“义项1”框和“义项2”框中将分别显示出这两个词语的所有义项;4.分别在“义项1”框和“义项2”框中点击需要计算相似度的两个词语义项;5.点击“计算义项相似度”按钮;6.在“输出”框中将显示选中的两个
5、义项的相似度;1.2.3词语相似度计算1.首先分别在“输入1”和“输入2”框中输入要计算相似度的两个词语;2.点击“计算词语相似度”按钮;3.在“输出”框中将显示两个词语的相似度;说明:词语相似度定义为两个词语的所有义项相似度中的最大值。1.3基于文件输入的词语操作1.3.1文件输入1.点击“文件:输入”按钮,系统将使用缺省的文本编辑器打开输入文件TestWords.Txt;2.编辑输入文件,其格式如下a)每行一个词;a)若干个词构成一组,组与组之间用空行分隔;例如:男人女人孩子老人少女工人2.保存文件;1.1.1按文件查询词
6、语义项1.首先点击“文件:输入”按钮,按照上面的说明在文件中输入要查询的词语;2.点击“文件:查询词语义项”按钮,系统将使用缺省的文本编辑器词语义项文件TestMeanings.Txt;3.词语义项文件中将显示所有的词语义项,格式为::男人Nhuman
7、人,family
8、家,male
9、男Nhuman
10、人,male
11、男:女人Nhuman
12、人,family
13、家,female
14、女Nhuman
15、人,female
16、女:孩子Nhuman
17、人,family
18、家,young
19、幼Nhuman
20、人,young
21、幼:老人Nhuman
22、人,aged
23、
24、老Nhuman
25、人,family
26、家,aged
27、老:少女Nhuman
28、人,female
29、女,young
30、幼:工人Nhuman
31、人,#occupation
32、职位,industrial
33、工1.1.2按文件计算词语相似度1.首先点击“文件:输入”按钮,按照上面的说明在文件中输入要查询的词语;2.其次点击“文件:查询词语义项”按钮,按照上面的说明得到词语义项文件TestMeanings.Txt;3.编辑打开的词语义项文件TestMeanings.Txt,删除无关的义项(整行删除即可),但每个词语至少应保留一个义项;假设上述例子中删除“
34、男人”和“女人”的各一个义项,得到文件为::男人Nhuman
35、人,male
36、男:女人Nhuman
37、人,family
38、家,female
39、女:孩子Nhuman
40、人,family
41、家,young
42、幼Nhuman
43、人,young
44、幼:老人Nhuman
45、人,aged
46、老Nhuman
47、人
此文档下载收益归作者所有