0426面向领域的高效web信息检索系统研究

0426面向领域的高效web信息检索系统研究

ID:18465781

大小:984.50 KB

页数:16页

时间:2018-09-18

上传者:jjuclb
0426面向领域的高效web信息检索系统研究_第1页
0426面向领域的高效web信息检索系统研究_第2页
0426面向领域的高效web信息检索系统研究_第3页
0426面向领域的高效web信息检索系统研究_第4页
0426面向领域的高效web信息检索系统研究_第5页
资源描述:

《0426面向领域的高效web信息检索系统研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

国家自然科学基金申请书学科代码:F020106受理部门:收件日期:受理编号:第16页共16页国家自然科学基金申请书第16页共16页国家自然科学基金申请书国家自然科学基金申请书您现在还不能填写文档或打印,请根据以下三个步骤操作:1)如果您是Word2000或以上版本用户,请把Word宏的安全性设为:"中"方法:Word菜单->工具->宏->安全性->安全级,设置为"中"(如果您是Word97用户,继续执行以下步骤)2)关闭本文档,重新打开本文档3)点击"启用宏"按钮,即可开始填写本文档或打印了资助类别:面上项目亚类说明:自由申请项目附注说明:项目名称:面向领域的高效Web信息检索系统研究申请者:何丕廉电话:022-27402114依托单位:天津大学通讯地址:中国天津市南开区卫津路92号邮政编码:300072单位电话:022-27403763E-mail:plhe@tju.edu.cn申报日期:2003年1月27日国家自然科学基金委员会第16页共16页 国家自然科学基金申请书基本信息申请者信息姓名性别男出生年月1942年12月民族汉族学位硕士职称教授主要研究领域计算机辅助教学、自然语言处理、信息检索电话022-27402114E-mailplhe@tju.edu.cn传真27406538个人网页工作单位天津大学电子信息工程学院计算机科学技术系在研项目批准号依托单位信息名称代码30007201联系人李武E-mailliwu@tju.edu.cn电话022-27403763网站地址www.tju.edu.cn合作单位信息单位名称代码项目基本信息项目名称资助类别面上项目亚类说明自由申请项目附注说明学科代码F020106:模式识别、人工智能F020601:中国语言文字信息处理的理论和技基地类别预计研究年限2004年1月—2006年12月研究属性应用基础研究总预算经费申请经费摘要项目研究内容和意义简介(限400字):面向领域的Web信息检索系统可以克服传统通用搜索引擎中存在的领域信息覆盖不全面、更新速度慢、查询功能单一等缺点,成为信息检索技术的一个重要发展方向。本项目拟建立一个面向计算机教育的主题信息检索系统,作为面向领域信息检索研究的支撑平台。进而针对目前信息检索中普遍存在检索效率低的问题,采用数据挖掘和自然语言处理中的相关技术,提出“基于网站拓扑结构挖掘的动态层次文本聚类”、“基于超链接分析的自动文本摘要”、“基于用户访问模式挖掘的查询扩展”等方案,从多方面快速定位用户所需要的领域信息,达到高效检索的目的。关键词(用分号分开,最多5个)面向领域;信息检索;文本聚类;文本摘要;查询扩展第16页共16页 国家自然科学基金申请书项目组主要成员编号姓名出生年月性别职称学位单位名称电话E-mail项目分工每年工作时间(月)11942年12月男教授硕士天津大学022-27402114plhe@tju.edu.cn项目负责人821972年10月男研究员博士UniversityofQueensland61-7-33659771dsong@dstc.edu.au模型构建331969年12月女讲师硕士天津大学022-27402114jchenxia@eyou.com理论研究941973年4月女博士生硕士天津大学27402114zhengxiaoshen@163.com结构设计1051974年6月男博士生硕士天津大学27402114yhs@eyou.com结构设计1061968年3月男博士生硕士天津大学27402114looth2000@sina.com模拟试验671978年8月男硕士生学士天津大学27402114cguihong@hotmail.com软件测试681978年8月男硕士生学士天津大学27402114niesong@eyou.com软件编程1091979年12月男硕士生学士天津大学27402114xzl@eyou.com软件编程10101979年2月男硕士生学士天津大学27402114gywu@eyou.com软件编程10总人数高级中级初级博士后博士生硕士生10210034说明:1.高级、中级、初级人员数按实际项目人数填写,博士后、博士生、硕士生及参加单位数由申请者负责填报,总人数自动生成;说明:2.第一人必须是申请者,信息从前面自动读入。第16页共16页 国家自然科学基金申请书经费预算(单位:万元)科目预算金额备注(计算依据与说明)一.研究经费16.00001.科研业务费14.0000(1)测试/计算/分析费1.0000原型系统分析、测试(2)能源/动力费1.0000网络使用、资料检索、主页服务器维护、水电等(3)会议费/差旅费6.0000计划每年参加高水平学术会议2-3人次(4)出版物/文献/信息传播事务费6.0000论文版面费、专利代理费、申请费用(5)其他0.00002.实验材料费0.0000(1)原材料/试剂/药品购置费0.0000(2)其他0.00003.仪器设备费2.0000(1)购置2.0000信息检索服务器(2)试制0.00004.实验室改装费0.00005.协作费0.00006.其他0.0000二.国际合作与交流费6.00001.项目组成员出国合作交流2.00002.境外专家来华合作交流4.0000三.劳务费2.0000四.管理费1.0000五.其他0.0000经费总预算25.0000申请经费25.0000其他经费来源(单位:万元)自然科学基金其他项目资助经费0.0000国家其他计划资助经费0.0000其他经费资助(含部门匹配)0.0000合计0.0000第16页共16页 国家自然科学基金项目申请书报告正文(本提纲只适用于面上项目,可自行增加栏目,请撰写完毕后删除无关的信息。其他类型的项目请参照相关正文报告撰写提纲。)(一)立项依据与研究内容(4000-8000字):1、项目的立项依据(附主要的参考文献目录)。在信息极大丰富而爆炸式增长的今天,Web信息检索系统已经成为人们获取信息的重要手段。然而,现有的Web搜索引擎普遍存在以下两个方面的问题[1,2,3]:首先,目前绝大部分搜索引擎,如国外的Google(http://www.google.com),Yahoo(http://www.yahoo.com),国内的天网(http://bingle.edu.cn/),百度(http://www.baidu.com)等都属于通用型的Web信息检索系统,它们索引的内容几乎覆盖到所有领域。然而,由于Web上文本数量增长的速度非常快,作为开发和维护此类搜索引擎的实体,出于经济和技术等方面的考虑,往往不能也无法做到把Web空间上的所有内容都收录进来。因此,在信息选取的策略方面,就会出现某种倾向性和搜索不完全的现象。比如,出于商业方面的考虑,大部分搜索引擎都会优先搜索本国的站点,或者是具有商业价值的.com站点,而对于其他国家的站点就相对忽略。此外,由于其服务器存储容量的限制,Google等还规定每个站点最多索引3000个页面[4]。这样,对于某个特定的领域或主题,通用搜索引擎无法保证在信息采集方面做到真正的全面。从另一方面看,通用搜索引擎的海量存储必然会影响到其对索引内容的实时更新,造成更新频率低、成本高、周期长等问题,从而不可避免地出现大量的“空链接”[5],无法保证提供给用户的信息总是最新的。其次就是检索功能单一、检索精度低[6,7]。目前搜索引擎在检索的时候主要还是基于传统的“关键词匹配”,常常会因为关键词存在歧义性影响查询的准确性。再加上Web文本数量庞大,而用户在进行Web信息检索时输入的查询关键词通常又非常简单(70%的情况下只输入单个词[8]),导致查询结果集膨胀,用户必须在大量的与自己查询意图相关或不相关的结果集中寻找自己需要的东西。九十年代之后,国外出现了面向领域(或主题)的Web信息检索系统,例如CiteSeer(http://www.CiteSeer.com),Coral(http://www.coral.justsearch.com)等[9,10]。目前国内尚未出现这类功能全面成熟的面向领域的检索系统,本项目的研究在我国是一个开拓性的尝试。面向领域(或主题)的Web搜索引擎追求的是“小而全,小而精”[11]:①查询主题确定之后,搜索的范围和内容就会极大地缩小,从而可以对该领域的内容进行全面索引;②与通用搜索引擎相比,面向领域的检索系统信息存储量相对较小,索引数据库的更新速度较快[12];③可以充分结合领域知识的特点,在信息抽取、丰富查询方式、提高检索精度等方面做更多的工作。比如,可以建立更加结构化的索引数据库以支持用户多种查询功能;可以通过对本领域特定访问群体的查询特点进行分析,以提供更加专门化、个性化的查询功能。而且,由于用户查询的范围已经被限定在某个特定领域,查询词在语义方面的歧义性也可以很好地避免,这就可以从一个方面提高查询的准确度。总之,建立面向领域的Web信息检索系统,不但在领域信息覆盖量、信息更新速度等方面有明显的优势,而且可以满足用户的特定查询需求,提高检索质量。为帮助用户在Web空间中快速定位到自己想要的资源,国内外研究人员进行了多方面的研究,提出了许多解决方案,其中“文本聚类(DocumentClustering)”,“自动摘要生成(AutomaticSummarization)”,“查询扩展(QueryExtension)”引起普遍关注。研究和大量的实践表明,这些方法均对用户快速定位文本、提高检索效率有帮助。然而,我们通过分析和研究,发现以上方法均是以通用搜索引擎为实现背景的,将其运用在面向领域的主题相关搜索第16页共16页 国家自然科学基金项目申请书上,尚有很大的改进空间,现逐项分析如下:l文本聚类当前检索系统使用的文本聚类方法,一般是通过向量空间模型将文本标准化,然后利用模糊理论或神经网络理论形成基于距离或密度的文本层次聚类[13-14]。由于传统方法没有充分考虑Web拓扑结构的特点,准确度比较低。考虑到网站的设计者在规划网站页面内容时,总会根据内容特点将其放到一个合适的位置,通过Anchor文本对其内容进行适当的描述,以吸引用户浏览相关内容,我们提出“基于网站拓扑结构挖掘的文本聚类”的新思路。依据Web页面文本所在的位置,挖掘网站的拓扑结构,形成文本的自动聚类。当用户对页面进行索引、搜索的时候,系统从主页开始沿着超链接逐层记录下网站信息。对于面向领域的Web信息检索系统,由于同领域的人背景相近,处理信息的思维方式具有相似性,因此从主页开始沿着超链接逐层记录下网站信息也具有相似性。充分利用网站记录信息的相似性,可以提高聚类的准确度。如果把网站的聚类层次结构看作是一个树形目录,基于网站拓扑结构挖掘的文本聚类就是将这个树形目录进行归并,动态生成一个“聚类树”,从而为用户提供一种“动态的目录聚类查询服务”。l文本摘要当前绝大部分Web信息检索系统的返回结果中不包含目标网页的摘要,只提供包含检索词的部分文本,用户难以通过这些文本确定目标页面的内容,只有在打开目标网页后才能知道是否是所需要的信息。显然,提供目标网页的摘要可为用户节省大量时间和精力。国内外对文本摘要技术的研究已有多年,但主要是针对纯文本而设计的,摘要效果尚不够理想。考虑到网页文本比纯文本包含更丰富的信息,我们拟采用“Web数据挖掘技术与传统统计模型理论相结合”的方法,利用半结构化网页提供的隐含信息来提高网页文本摘要的精确度。对于同一领域的网页,其结构和内容有较多的相似之处。为了充分利用这些信息,首先使用结构挖掘技术,挖掘出所有指向该网页的超链接文本,并根据语法/语义规则进行噪音过滤,把剩下的词条作为该网页的特权候选摘要语句;然后进行内容挖掘,通过HTML标识知识和纯文本的词、句、段及篇章的知识,计算网页文本中每句话的权重;最后根据摘要字数的要求提取权重值较大者形成网页的摘要。l查询扩展目前查询扩展主要有两种途径[15]:查询前扩展和查询后扩展。可以根据同义词词典、语义蕴涵词典来扩展查询检索项,其核心思想都是寻找与索引项相关的词汇或短语,在提交查询时把它们添加到检索条件中,或者在查询后应用相关反馈方法把关键的词汇或短语添加到检索条件中。通常采用语义分析方法或词共现方法。然而,增加索引项容易引入噪音,导致检索到的不相关文本数增多。另一方面,查询扩展可能由于引入不适当的关键词产生主题漂移现象[16]。鉴于上述情况,我们提出“基于用户查询模式挖掘的查询扩展”。对于通用领域的网站,挖掘用户的兴趣习惯比较困难,而对于面向特定领域的信息检索系统来说,由于其信息内容的特定性,用户在查询兴趣和习惯上具有更大的形似性,因此,比较容易通过Log日志的挖掘发现并获得用户群体查询特点,从而设计出具有个性化的查询扩展方法。这种方法将更符合用户的查询习惯,可以在一定程度上抑制噪音,避免主题漂移。参考文献:[1]AndrewMcCallum,KamalNigametc,BuildingDomain-SpecificSearchEngineswithMachineLearningTechniques,SchoolofComputerScience,CarnegieMellonUniversity,2002.[2]SoumenChkrabariti,MartinvandenBerg,ByronDom,Focusedcrawling:anewapproachtotopic-sepcificWebresourcediscovery,publishedbyElsevierScienceB.V.,1999.[3]M.Diligenti,F.Mcoetzee,S.Lawrence,C.L.GilesandM.Gori,FocusedCrawlingUsingContext第16页共16页 国家自然科学基金项目申请书Graphs,2000.[4]Ph.D.inComputerScienceattheUniversityofWashington,Seattle.Areasofinterest:InformationRetrieval,UserInterfaces,MachineLearningandKnowledgeDiscovery.M.S.received1997.[5]Krellenstein,M.,ChiefTechnologyOfficer,NorthernLightTechnologyLLC.Theaddedvalueofclassificationintelligence.Talkatthe2001SearchEnginesandBeyondConference,2001.[6]Boyan,J.,Freitag,D.andJoachims,T.AmachinearchitectureforoptimizingWebsearchengines.InProceedingsoftheAAAI-99WorkshoponInternetbasedInformationSystems,1999.[7]RobertSteele,TechniquesforSpecializedSearchEngines,DepartmentofComputerSystems,UniversityofTechnology,Sydney,2001.[8]Brin,S.andPage,L.Theanatomyofalarge-scalehypertextualWebsearchengine.InProceedingsoftheSeventhInternationalWebWideWorldConference(WWW7),1998.[9]http://www.CiteSeer.com.[10]http://www.cora.justsearch.com.[11]TaherH.Haveliwala,Topic-SentsitivePageRank,ComputerScienceDepartment,StandfordUniversity,2002.[12]Guha,S.,Rastogi,R.andShim,K.CURE:Anefficientclusteringalgorithmforlargedatabases.InProceedingsoftheACM-SIGMOD1998InternationalConferenceonManagementofData(SIGMOD’98),73-84,1998.[13]FastandIntuitiveClusteringofWebDocument,OrenZamir,OrenEtzioni,OmidMadaniandRichardKarp,inProceedingofthe3rdInternationalConferenceonKnowledgeDiscoveryandDataMining.[14]Broder,A.Z.,Glassman,S.C.,Manasse,M.S.andZweig,G.SyntacticclusteringoftheWeb.InProceedingsoftheSixthInternationalWebWideWorldConference(WWW6),1997.[15]ArampatzisA,BeneyJ,KosterCHA,vanderWeideTP,“KUNontheTREC-9FilteringTrack:Incrementality,Decay,andThresholdOptimizationforAdaptiveFilteringSystems”,tobepublishedinTheNinthTextREtrievalConference,NIST,2001.[16]CrestaniF,“ExploitingtheSimilarityofNon-MatchingTermsatRetrievalTime”,inInformationRetrieval,vol.2,nr1,KluwerAcademicPublishers,2000.1、项目的研究内容、研究目标,以及拟解决的关键问题。整体研究目标:建立一个面向计算机教育领域、高效实用的Web信息检索系统。阶段性子目标和研究内容:1)面向领域的主题相关文本的收集方案建立面向计算机教育领域的信息搜索模型,利用分布式多Agent技术,通过“FocusCrawler”实现全面、快速、准确的文本获取功能。2)建立与主题内容相关的结构化索引数据库充分考虑计算机教育领域内容的特点,利用Web超链接信息提取技术,并结合传统的向量空间模型,建立与主题内容密切相关的结构化索引数据库,并为每个页面提取其网站自身的类别信息。3)自动文本摘要生成的研究利用自然语言处理技术,并充分挖掘Web文本之间的链接及其自身的结构化信息,实现自动文本摘要生成功能。4)挖掘用户查询模式,研究其与查询扩展相结合的方案。第16页共16页 国家自然科学基金项目申请书1)多功能高效信息查询接口的研究在支持传统关键词查询的基础上实现“查询扩展功能”和“动态的目录聚类查询服务”。拟解决哪些关键问题:1)基于网站结构的聚类模型;2)与Web结构挖掘结合的摘要形成技术;3)基于用户访问模式的查询扩展方法。1、拟采取的研究方案及可行性分析。研究方案在相关领域已有的研究结果之上,合理吸收、有效利用已有的成熟方法,加入我们提出的“基于网站拓扑结构挖掘的动态层次文本聚类”、“基于超链接分析的自动文本摘要”、“基于用户访问模式挖掘的查询扩展”等新思路:(1)基于网站拓扑结构挖掘的动态层次文本聚类在索引数据库建立阶段,通过网站自身的拓扑结构/布局,获取该网站中表征页面分类特征的结构信息。由于本项目的开发背景是某一特定领域的信息检索系统,可以假设同一个领域的人由于其背景相近,因此在信息处理行为上也具有相似性。因此,本系统将利用在索引阶段中页面获取的分类特征标识,如P(A1:A2:A3…An),进行聚类。如果把每个网站的层次结构均看作是一个树形目录,基于网站拓扑结构挖掘的文本聚类就是利用语义分析、贝叶斯算法、决策树等技术将这些树形目录加以削减、结合、归并,动态生成一个“层次结构聚类树”的过程。(2)基于超链接分析的自动文本摘要考虑到网页超链接结构中包含有比文本本身更丰富的信息,我们将挖掘网页的Incoming-Link所在页面中相关联的Anchor文本和其所在段落所提供的隐含的、带有导航性描述内容的关键字词句,通过关联度分析、语法分析等建立摘要生成模型。(3)基于用户访问模式挖掘的查询扩展通过Log日志文件挖掘用户的查询习惯、兴趣特点等与查询关键字之间的关联度,并结合词共现和语义分析技术,设计针对特定用户群体的查询扩展模型。可行性分析1)研究基础雄厚:研究小组自90年代以来,一直从事人工智能、自然语言处理和信息检索方面的研究,已开发出拥有自主版权的信息检索辅助系统,包括中文分词工具、分词性能评价工具、中文文本分类工具、简易词性标注工具及词共现模型研究工具等,并发表相关论文多篇。与亚洲微软研究院合作建立了天津大学-微软计算语言学研究室。多次派遣访问学生进行学术交流。曾参加NTCIR3的比赛,并与亚洲微软研究院合作参加TREC-10,取得了优异的成绩。2)研究力量组织合理:该项目与数学、信息检索、自然语言处理等学科联系紧密,研究小组成员具有计算机和语言处理等多重研究背景,学科交叉将保证本课题高水平完成。项目负责人有完成多项国家自然科学基金项目的经验,刚刚完成的国家自然科学基金高技术项目被评为优秀,项目组成员老中青结合,梯队组成合理。3)研究小组有多台运行SMART和Okapi信息检索系统的专用设备,为该项目的研究搭建了很好的实验平台。2、本项目的特色与创新之处。第16页共16页 国家自然科学基金项目申请书a)基于网站拓扑结构挖掘的“动态目录聚类查询服务”;b)Web数据挖掘技术与传统统计模型理论相结合的“自动文本摘要”;c)基于用户查询模式挖掘的“面向用户的个性化查询扩展”。2、年度研究计划及预期研究结果。2004年1月-3月调研、资料准备、总体设计。2004年4月-10月研究平台的搭建:-利用分布式Agent技术,通过FocusedCrawler建立数据集。-采用超链接分析和信息提取技术建立结构化的WebBase索引数据库。-利用机器学习技术设计从网站拓扑结构/布局提取分类信息的模型,并利用此模型对文档进行索引。-设计利用In-link页面中的Anchor文本提取文本摘要的生成模型。2004年11月-12月原型系统投入试运行。本阶段预计完成系统基础平台的建设,完成技术报告以及高水平论文2-3篇。2005年1月-10月深入研究阶段-通过分析、评价、综合对现有信息提取模型、聚类模型、摘要提取算法进行改进;-通过本系统在试运行期间提供的Log文件挖掘用户查询模型,设计并实现个性化查询扩展功能。本阶段预计完成高水平论文2-3篇,产生专利1-2项。2005年11月-2006年12月:系统评测。本阶段将提供可实用的原型系统,并提供全面的技术报告。(二)研究基础与工作条件1、工作基础本课题组自90年代以来,一直从事人工智能、自然语言处理和信息检索方面的研究,已开发出拥有自主版权的信息检索辅助系统,包括中文分词工具、分词性能评价工具、中文文本分类工具、简易词性标注工具及词共现模型研究工具等,并发表相关论文多篇。本项目的主要参加人宋大为博士是Queensland大学的研究员,在信息检索领域参加过多个国内外项目的研究,发表过10多篇高水平的相关领域文章,是SIGIR2003组委会成员。本课题组与亚洲微软研究院合作建立了计算语言学研究室。多次派遣访问学生到亚洲微软研究参加并出色完成高水平的研究工作。曾参加NTCIR3比赛,并与亚洲微软研究院合作参加TREC-10,取得了优异的成绩。本项目的参加人曹桂宏曾经是亚洲微软研究院的访问学生,现正在澳大利亚进行文本聚类的合作研究。本课题组还与美国新墨西哥洲大学的著名的人工智能专家Luger第16页共16页 国家自然科学基金项目申请书教授建立起了良好的学术合作和交流关系,使我们可以及时地了解研究领域的新技术、新思路,有助于我们把握国际研究的新动向。1、工作条件本项目由资深的教授负责,国外学者、博士生、硕士生参与,在相关领域均具有很强的学术背景。本项目组有自己的DELL2600服务器和十多台高档微机,专门用于信息检索的研究,已经具有SMART语言处理系统(信息检索系统),并已经从英国伦敦城市大学购买了基于统计语言模型(概率模型)的OKAPI信息检索系统;通过参加国际大赛,已经积累了700MB的中文语料库,自主开发出了一套信息检索辅助系统。天津大学计算机软件研究与开发中心以天津大学IBM计算机新技术中心为依托,拥有由美国IBM公司捐赠100万美元的设备。提供丰富的应用开发环境,这些均为该项目的实施提供了强有力的软、硬件环境的支持和技术准备。2、申请人简历何丕廉男天津大学信息学院计算机系教授博士生导师中国人工智能学会计算机辅助教育专业委员会常务理事中国计算机学会微型计算机专业委员会委员中国计算机学会存储专业委员会委员天津市计算机学会副理事长天津市计算机辅助教育学会理事长天津市计算机用户协会副理事长天津大学-微软研究院计算语言学研究室主任<简历>1968北京大学物理系研究生毕业1968-1975大港油田技术攻关队技术员1975-天津大学电子工程系、计算机系任教1981-1983日本神户大学系统工程系访问学者1996.7-12美国罗德爱兰大学计算机系高级访问学者近五年来发表的代表性学术论文:1.自适应随机链路状态路由算法,计算机研究与发展,Vol.39,No.11,2002.112.一种基于上下文的中文信息检索查询扩展,中文信息学报,Vol.16,No.6,2002.113.利用人工和自动生成的资源进行中文信息检索查询扩展,计算机工程与应用,Vol.38,No.21,2002.114.OnDifficultiesofChinese-EnglishMachineTranslation,IEEEProceedingof2002InternationalConferenceonMachineLearningandCybernetics(ICMLC-2002),Nov.2002Beijing,China5.PerformanceofTwoInformationRetrievalSystemsinChineseIR:SMARTSystemandOkapiSystem,IEEERegion10TechnicalConferenceonComputers,Communications,ControlandPowerEngineering(TENCON’02)Oct.28-31,2002Beijing,China6.语音/数据同帧传输方法,天津大学学报,Vol.35,No.5Sep.20027.视频流水线处理器设计评述,郑州轻工业学院学报,Vol.17,No.3Sep.20028.二值图象压缩标准-JBIG2,计算机工程与应用,Vol.38No.13,2002.79.QueryExpansionforChineseInformationRetrievalbyUsingaDecayingCo-occurrenceModel,TransactionsofTianjinUniversity,Vol.8No.3,2002.310.神经网络与模糊技术的结合与发展,计算机应用研究,Vol.18No.5,2001.511.网上虚拟教室中笔记系统的设计与实现,计算机工程与应用,2001.512.模糊聚类神经网络的非对称性学习算法,计算机研究与发展,Vol.38No.3,2001.313.基于神经网络的时间序列鲁棒预测,控制与决策,Vol.16No.3,2001.314.基于预测复杂性的神经网络预测子辨识,信息与控制Vol.30No.1,2001.215.时间延迟反馈神经网络及其在股市预测中的应用,南京大学学报(自然科学),2000.10第16页共16页 国家自然科学基金项目申请书1.PHP在Web数据库的应用研究,计算机工程,2000.9,Vol.26No.92.基于CSCL网络虚拟教室的设计与实现,TheFourthChineseConferenceOnComputersinEducation,May,2000,Singapore.3.论数据库技术与人工智能的融合,计算机工程与设计,1999.10Vol.20No.54.适用于高必要嵌入维的混沌时间序列预测算法,天津大学学报,Vol.32No.51999.95.DesignandImplementationof“Web-basedNetworkSchoolDevelopingTools”,ComputerBasedLearningInScience,ProceedingsofAnInternationalConference,Univ.OfTwente,Enschede,Netherlands,July2-6,19996.应变硬化模量确切意义、实验测法及应用算例,天津大学学报,Vol.32No.4,1999.77.一种新的布尔函数对称检测算法,天津理工学院学报,1999.48.多媒体计算机网络通信技术,第一届全国CSCW学术会议论文集,1998.129.基于TCP/IP的指挥会议系统的设计与开发,第一次全国CSCW学术会议论文集,1998.1210.TheDesignandStudyonInteractiveDistanceLearningSystem,ProceedingsoftheSixthInternationalConferenceonComputerinEducation,199811.MeaningOrientedICAICognitionModel,ProceedingsoftheSixthInternationalConferenceonComputerinEducation,199812.基于WWW的学习语义网络导引图,ICCE'98,19981、承担科研项目情况1智能化课件写作系统,国家自然科学基金(主持),1989完成2师生同步协作的超媒体虚拟教室,国家自然科学基金高技术项目(主持),2000完成3人工智能在微波电路CAD中的应用,国家自然科学基金(参加),1993完成4基于CSCW的远程教学环境,天津市自然科学基金重点科学基金(主持),2002完成4超媒体智能CAI系统,天津市自然科学基金(主持),1998完成5交互式程序自动生成系统,天津市自然科学基金(主持),1995完成6实用多机系统的研制与开发,天津市自然科学基金项目(参加),1996完成7教育网络管理系统,九五攻关项目(参加),已商品化,1993完成8通用报表生成程序系统,中国计算机用户协会软件应用成果奖,19859企业管理自动化多层微机局部网络,天津市科学技术进步三等奖,198610微型机及其应用,全国高校计算机基础教育研究会优秀教材一等奖,199211微型机及其应用课程教学改革及实践,天津市优秀教学成果三等奖,199312通用课件写作系统CACAS,全国首届最佳CAI软件二等奖(软件平台最高奖),199413网上虚拟教室——同步浏览与交互学习,天津市教委一等软件,1999第16页共16页 国家自然科学基金项目申请书签字和盖章页(此页不用填写!!!)申请者:何丕廉依托单位:天津大学项目名称:面向领域的高效Web信息检索系统研究资助类别:面上项目亚类说明:自由申请项目附注说明:申请者承诺:我保证申请书内容的真实性。如果获得基金资助,我将履行项目负责人职责,严格遵守国家自然科学基金委员会的有关规定,切实保证研究工作时间,认真开展工作,按时报送有关材料。若填报失实和违反规定,本人将承担全部责任。签字:项目组主要成员承诺:我保证有关申报内容的真实性。如果获得基金资助,我将严格遵守国家自然科学基金委员会的有关规定,切实保证研究工作时间,加强合作、信息资源共享,认真开展工作,及时向项目负责人报送有关材料。若个人信息失实、执行项目中违反规定,本人将承担相关责任。编号姓名工作单位名称项目分工每年工作时间(月)签字1何丕廉天津大学项目负责人82宋大为UniversityofQueensland模型构建33陈霞天津大学理论研究94郑小慎天津大学结构设计105孙越恒天津大学结构设计106王中天津大学模拟试验67曹桂宏天津大学软件测试68聂颂天津大学软件编程109谢振亮天津大学软件编程1010吴光远天津大学软件编程10依托单位及合作单位承诺:已按填报说明对申请人的资格和申请书内容进行了审核。申请项目如获资助,我单位保证对研究计划实施所需要的人力、物力和工作时间等条件给予保障,严格遵守国家自然科学基金委员会有关规定,督促项目负责人和项目组成员以及本单位项目管理部门按照国家自然科学基金委员会的规定及时报送有关材料。依托单位公章合作单位公章1合作单位公章2合作单位公章3日期:日期:日期:日期:第16页共16页 国家自然科学基金项目申请书个人简历-1个人信息中文姓名:何丕廉拼音姓名:HePilian民族:汉族性别:男出生日期:1942-12-8身份证:120104421208601职称:教授主要研究领域:计算机辅助教学、自然语言处理、信息检索最高学位:硕士授予国别(地区):中国授予年份:1968院士:博士后:办公电话:022-27402114家庭电话:022-27891607手机号码:传真:27406538Email:plhe@tju.edu.cn个人网页:所在单位:天津大学所在院、系、所:电子信息工程学院计算机科学技术系通讯地址:中国天津市南开区卫津路92号邮政编码:300072在研项目批准号(最多三个):最熟悉的研究领域(最多三个):F020106,F0206简历何丕廉男天津大学信息学院计算机系教授博士生导师中国人工智能学会计算机辅助教育专业委员会常务理事中国计算机学会微型计算机专业委员会委员中国计算机学会存储专业委员会委员天津市计算机学会副理事长天津市计算机辅助教育学会理事长天津市计算机用户协会副理事长天津大学-微软研究院计算语言学研究室主任1968北京大学物理系研究生毕业1968-1975大港油田技术攻关队技术员1975-1996天津大学电子工程系、计算机系任教1981-1983日本神户大学系统工程系访问学者1996.7-12美国罗德爱兰大学计算机系高级访问学者1997-天津大学计算机系任教2002年发表的代表性学术论文:1.自适应随机链路状态路由算法,计算机研究与发展,Vol.39,No.11,2002.112.一种基于上下文的中文信息检索查询扩展,中文信息学报,Vol.16,No.6,2002.113.利用人工和自动生成的资源进行中文信息检索查询扩展,计算机工程与应用,Vol.38,No.21,2002.114.OnDifficultiesofChinese-EnglishMachineTranslation,IEEEProceedingof2002InternationalConferenceonMachineLearningandCybernetics(ICMLC-2002),Nov.2002Beijing,China5.PerformanceofTwoInformationRetrievalSystemsinChineseIR:SMARTSystemandOkapiSystem,IEEERegion10TechnicalConferenceonComputers,Communications,ControlandPowerEngineering(TENCON’02)Oct.28-31,2002Beijing,China1.6.QueryExpansionforChineseInformationRetrievalbyUsingaDecayingCo-occurrenceModel,TransactionsofTianjinUniversity,Vol.8No.3,2002.37.神经网络与模糊技术的结合与发展,计算机应用研究,Vol.18No.5,2001.58.网上虚拟教室中笔记系统的设计与实现,计算机工程与应用,2001.59.模糊聚类神经网络的非对称性学习算法,计算机研究与发展,Vol.38No.3,2001.3第16页共16页 国家自然科学基金项目申请书个人简历-2个人信息中文姓名:宋大为拼音姓名:SongDawei民族:汉族性别:男出生日期:1972-10-28其他:149553464职称:研究员主要研究领域:信息检索、语言模型最高学位:博士授予国别(地区):香港授予年份:2000院士:博士后:办公电话:61-7-33659771家庭电话:手机号码:传真:Email:dsong@dstc.edu.au个人网页:所在单位:UniversityofQueensland所在院、系、所:通讯地址:UniversityofQueensland邮政编码:304213在研项目批准号(最多三个):最熟悉的研究领域(最多三个):F020106简历1.EDUCATION:7/1996–7/2000TheChineseUniversityofHongKong,ReceivedPhD2.PATENTS:Bruza,P.D.andD.Song.Context-SensitiveInformationalInferenceMethod.provisional)3.JOURNALPUBLICATIONS:·Song,D.andBruza,P.D.(2002a).TowardsaTheoryofContextSensitiveInformationalInference.ToappearinJournaloftheAmericanSocietyforInformationScienceandTechnology,54(4),2003.·Wong,K.F.,Song,D.,Bruza,P.D.,&Cheng,C.H.(2001)ApplicationofaboutnesstoFunctionalBenchmarkingininformationretrieval.ACMTransactionsonInformationSystems(TOIS),19(4),pp.337-370,2001.·Bruza,P.D.,Song,D.andWong,K.F.(2000)AboutnessfromaCommonsensePerspective.JournaloftheAmericanSocietyforInformationScience(JASIS),51(12),1090-1105.·Song,D.,Wang,L.,Shu,Y.T.,&Wang,B.(1998)Researchinheterogeneousmulti-databaseandthedesignofanoperatingmodel(InChinese,withEnglishabstract).JournalofDevelopmentandApplicationformicrocomputer(6)1998,pp.2-6.4PROFESSIONALACTIVITIES·MemberofProgramCommitteeofACMSIGIR’2003·Reviewer,HumanLanguageTechnologyconference(HLT’2001),AustralasianDocumentComputingSymposium.第16页共16页 国家自然科学基金项目申请书个人简历-3个人信息中文姓名:陈霞拼音姓名:ChenXia民族:汉族性别:女出生日期:1969-12-8身份证:140102691208560职称:讲师主要研究领域:智能CAI,CSCW,基于WEB的应用技术最高学位:硕士授予国别(地区):中国授予年份:1998院士:博士后:办公电话:022-27402114家庭电话:手机号码:传真:Email:jchenxia@eyou.com个人网页:所在单位:天津大学所在院、系、所:电子信息学院计算机科学技术系通讯地址:中国天津市南开区卫津路92号邮政编码:300072在研项目批准号(最多三个):最熟悉的研究领域(最多三个):F020106简历参与的基金项目有:1.1998-2002国家自然科学基金“师生同步协作的超媒体虚拟教室”,(参加)2.1999-2001天津市自然科学基金重点项目“基于CSCW的远程教学环境”(参加)主要成果有:1.网上虚拟教室——同步浏览与交互学习,天津市教委一等软件,1999.11(参与)2.人工智能多媒体教学课件系统,天津市教委二等软件,2001(主持)3.人工智能网络课件,天津大学计算机辅助教学课件开发立项优秀项目,2001(主持)论文:1.李庆明,陈霞,张会生,一个CAI智能控制器的软件设计和实现,山西大学学报(自然科学版)17卷2期,179-182,19942.QuJianmin,MaXirong,ChenXia,ZhangXiajie“ResearchandPracticeofBasicStructureofaMultimediaCAIbasedonDatabase”Proceedingsofaninternationalconference-ComputerBasedLearninginScience(CBLIS’97),LeicesterUK,1997.3.一个通用数据库型CAI的设计与实现,第八届全国CBE学会论文集(获优秀论文奖)4.QuJianmin,MaXirong,ChenXia,ZhangXiajie“ResearchandPracticeofBasicStructureofaMultimediaCAIbasedonDatabase”ProceedingsoftheinternationalconferenceCBLIS’97,19975.ChenXia,HePilian“DesignandImplementationofWeb-basedNetworkSchoolDevelopingTools”ProceedingsoftheinternationalconferenceCBLIS’99(ComputerBasedLearninginScience),Nethrlands,19996.陈霞,何丕廉等,基于CSCL网络虚拟教室的设计与实现,GCCCE2000第四届全球华人教育资讯科技大会论文集,新加坡,20007.贺宏朝,何丕廉,陈霞,利用人工和自动生成的资源进行中文信息检索查询扩展,计算机工程与应用,20028.赵伟,何丕廉,陈霞,谢振亮,Web使用挖掘中的数据预处理技术研究,计算机应用,(已录用)第16页共16页 国家自然科学基金项目申请书第16页共16页

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭