图形图像敏感文字信息识别及语义分析技术.doc

图形图像敏感文字信息识别及语义分析技术.doc

ID:50414030

大小:39.52 KB

页数:2页

时间:2020-03-08

图形图像敏感文字信息识别及语义分析技术.doc_第1页
图形图像敏感文字信息识别及语义分析技术.doc_第2页
资源描述:

《图形图像敏感文字信息识别及语义分析技术.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、图形图像敏感文字信息识别及语义分析技术2014-01-2017:14:21 来源: 作者:【大 中 小】浏览:9823次赛题简介:介绍整个赛题的思路和整体要求    社会发展进入信息时代,人们已经不再停留在自己的耳朵和眼睛去直接获得这些信息,而是使用计算机将文字自动的输入计算机。以图像为主的多媒体信息迅速成为重要的信息传递媒介,图像中的文字信息包含了丰富的高层语义信息。提取出这些文字,对于图像高层次语义的理解、索引和检索非常有帮助。    文字识别可用于手稿的识别、检索;单据的识别;车牌识别和标牌识别;银

2、行卡账号的识别。以及各种大、中型计算机的输入,诸如出版印刷、新闻通讯、银行、邮政、资料文献等部门使用的计算机,都有大量文字输入的问题,所以文字识别研究的突破必将显著提高这些部门的工作效率。赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景      在保密环境中,部分非法用户会故意把电子资料或屏幕截屏存成图像格式以防止保密检查工具或反泄密、防泄漏系统检测到。因此,对图形图像文字识别技术提出了较高要求。       可以在图像文件上标记密级等级的字样,通过识别这

3、些密级等级的字样。可以方便的对不同等级的图片进行分类管理。      首先,需要提取这些图像中的文字信息,然后比对密级等级字典,对于不同等级的图像,用一种显著方式对这些图像进行区分。功能性需求      参赛者可以在完全自主开发或在开源代码上做算法上的优化和改进。       1、在文字图像清晰的情况下识别率应达到85%以上(50)。       2、支持按中英文关键字的文字提取与识别(15)。       3、支持身份证号码、车牌号码、银行账号等规则信息的提取和识别(15)。       4、指定一个文

4、件目录,给定一个字典,列举出包含这些关键词的所有图像,识别速度达到秒级(10)。      5、支持jpg,png,bmp等多种图像格式(10)。非功能性需求    支持语义理解与分析,能够按同义词、反义词等相关性进行识别。(可列为加分项,20分)其他限制条件:开发环境、实验平台、开发语言、数据库、编译器等限制条件      开发环境:不限      开发语言:不限       操作系统:Windows XP/Windows  7/Windows 8/Linux测试数据或平台:提供给参赛者的测试环境和测试

5、数据。(可提供电子档)    测试用图片,可通过屏幕截屏自行准备,建议使用新浪、腾讯等门户首页、技术方案或论文等截屏。初赛及决赛时由出题企业统一准备。其他要求提交相关文档:       需求规格书       详细描述课题的功能与非功能需求,使软件设计开发人员能够清晰地理解课题的背景、功能要求、运行环境等,使之成为整个设计开发工作的基础。      系统设计说明书       详细描述软件的架构、设计理念、算法思路等。      测试文档       描述测试环境的搭建、准备的测试数据、测试方法等。按照测

6、试文档进行功能与非功能测试,对测试方案可能出现的问题进行分析和评估。       程序源代码, 请注明使用到的第三方代码。      指未编译的按照一定的程序设计语言规范书写的程序代码,包括代码结构说明书。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。