欢迎来到天天文库
浏览记录
ID:59693608
大小:483.50 KB
页数:8页
时间:2020-11-19
《厦门大学数据库实验室.ppt》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、厦门大学数据库实验室论文阅读进展报告二报告人:罗道文导师:林子雨时间:2015年07月31日过渡页1目录Part-Join:基于划分的字符串相似性连接Ed-Join:AnEfficientAlgorithm12论文一2XiaoChuan,WangWei,LinXuemin.Ed-join:AnefficientalgorithmforsimilarityjoinswitheditdistanceconstraintsPrOcoftheVLDBEndowment.Endowment,NewZealand:VLDBEndowme
2、nt,2008:933-944论文详情:1、基于位置过滤2、基于内容过滤论文内容:论文一基于位置过滤:3基础知识4频率向量:假如有字符串s:abbceeef那么频率向量为f(s)={fa(s)=1,fb(s)=2,fc(s)=1,fd(s)=0,fe(s)=3,ff(s)=1,fg(s)=0,……}辅助定理:基础知识5陈懿诚,骆吉洲,李建中.Part-Join:基于划分的字符串相似性连接《计算机应用研究》,2014年10期论文详情:1、基于频率向量的划分;2、基于字母表的划分;3、基于频率分布的划分论文内容:论文二基础知识6
3、基于频率向量划分子集:1、计算每个字符串的频率向量。2、频率相同的归为到同一个子集。3、迭代所有子集,如果两个子集间的L1距离小于2倍阈值,则计算二者之间的编辑距离,进行验证。谢谢
此文档下载收益归作者所有