欢迎来到天天文库
浏览记录
ID:12851674
大小:196.50 KB
页数:20页
时间:2018-07-19
《海量智能分词研究版接口手册(精)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、天津市海量科技发展有限公司海量智能分词研究版接口手册天津市海量科技发展有限公司编写二○○五年四月-20-天津市海量科技发展有限公司目录产 品 说 明3功能概述3产品清单3技术支持4第一章 系统环境要求51.1环境要求5第二章 基本使用方法62.1.1分词过程伪码62.1.2标注词性伪码72.1.3计算关键词伪码82.1.4计算语义指纹伪码8第三章分词基础件提供的接口描述103.1.基本接口103.2.分词接口113.3.获取分词结果接口123.4.其他接口13附 录17附录A 功能基础件概念诠释17附录B 术语列表1
2、9-20-天津市海量科技发展有限公司产 品 说 明功能概述²词形切分对给定的字序列文本,自动切分为词序列文本。²标注词性对切分后的词标注词性²计算关键词对给定的序列文本,计算表现本文本内容的关键词²计算语义指纹对给定的序列文本,计算语义指纹。产品清单Ø词典文件HLSplitWord.datØ动态链接库文件Release版:HLSSplit.dllØlib库文件Release版:HLSSplit.libØ源码HLSegFunc.hHLPubDef.hØ说明文件海量智能分词研究版接口手册.doc-20-天津市海量科技发展有
3、限公司技术支持电话:86(010)82601290-18传真:86(010)82601290-20E-mail:yangzhiwei@hylanda.com网站:http://www.hylanda.com/论坛:http://www.hylanda.com/cgi-bin/bbs/main.htm联系人:杨智炜通信地址:北京市海淀区中关村东路18号财智大厦B2009-20-天津市海量科技发展有限公司第一章 系统环境要求1.1环境要求n软件开发环境:VC++6.0n软件支持环境: Windows2000及
4、其以后版本n硬件支持环境:最低配置:128M内存,PII400n提供的开发接口:C/C++-20-天津市海量科技发展有限公司第二章 基本使用方法2.1.1分词过程伪码//初始化分词词典boolbInitDict=HLSplitInit();if(!bInitDict){AfxMessageBox(_T(“初始化分词字典失败!”));return;}CStringstrText;//存放要进行分词的字符串…………………..HANDLEhHandle=HLOpenSplit();//创建分词句柄if(hHandle==IN
5、VALID_HANDLE_VALUE){//创建分词句柄失败AfxMessageBox(_T("创建分词句柄失败!"));HLFreeSplit();//卸载分词字典return;}intiExtraCalcFlag=0;//附加计算标志,不进行附加计算LPCSTRlpText=(LPCSTR)strText;boolbSuccess=HLSplitWord(hHandle,lpText,iExtraCalcFlag);CStringstrResult;strResult=_T(“”);if(bSuccess){//分
6、词成功intnResultCnt=HLGetWordCnt(hHandle);//取得分词个数for(inti=0;im_szWord;strResult+=_T(“”);//以空格分割分词结果中的每个词}HLCloseSplit(hHandle);//关闭分词句柄}else{//分词失败-20-天
7、津市海量科技发展有限公司AfxMessageBox(_T(“分词失败!”));HLCloseSplit(hHandle);//关闭分词句柄HLFreeSplit();//卸载分词字典return;}HLFreeSplit();//卸载分词词典………..…………2.1.2标注词性伪码//略去分词初始化部分HANDLEhHandle=HLOpenSplit();//创建分词句柄if(hHandle==INVALID_HANDLE_VALUE){//创建分词句柄失败AfxMessageBox(_T("创建分词句柄失败!"))
8、;HLFreeSplit();//卸载分词字典return;}intiExtraCalcFlag=HL_CAL_OPT_POS;//附加计算标志LPCSTRlpText=(LPCSTR)strText;boolbSuccess=HLSplitWord(hHandle,lpText,iExtraCalcFlag);CStringst
此文档下载收益归作者所有