构建以专利为核心的科技大数据平台以促进创新的设想

构建以专利为核心的科技大数据平台以促进创新的设想

ID:31369270

大小:120.00 KB

页数:14页

时间:2019-01-09

构建以专利为核心的科技大数据平台以促进创新的设想_第1页
构建以专利为核心的科技大数据平台以促进创新的设想_第2页
构建以专利为核心的科技大数据平台以促进创新的设想_第3页
构建以专利为核心的科技大数据平台以促进创新的设想_第4页
构建以专利为核心的科技大数据平台以促进创新的设想_第5页
资源描述:

《构建以专利为核心的科技大数据平台以促进创新的设想》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、构建以专利为核心的科技大数据平台以促进创新的设想  摘要:随着我国知识产权行业的发展,专利申请量不断创出新高。2015年中国发明专利申请量突破100万件,同比增长18.7%,连续5年位居世界首位。我国已经积累了海量的专利数据,同时也积累了大量的非专利数据、应用数据、检索数据等,并且建立了相应的检索系统和分析系统。本文分析了以专利为核心的科技文献大数据的现状,提出了基于大数据关联与整合思路和基于专利信息服务产业链整合思路的两个创新应用观点,并从“五个一”的建设内容、六大关键技术等方面阐述了以专利为核心的科

2、技文献大数据信息服务平台的构建设想,最后从产业整合、信息服务、成果转化、价值评估、数据挖掘等5个方面强调了大数据服务平台对促进创新的作用。  关键词:专利;大数据;科技文献;信息服务;创新  中图分类号:C931文献标识码:A14  作为具有国家知识产权局背景的专利信息服务行业领导者之一,知识产权出版社多年来积累了大量的国内外专利文献数据和非专利科技文献数据。2014年~2016年,我们的数据收集范围从专利扩大到商标、标准、科技期刊、知识产权和创新类图书等,专利信息也从单纯的文摘和全文扩展到法律状态、审

3、查文件、流程信息、运营信息、复审和无效决定、知识产权司法判例等,数据量从1亿扩大到近5亿,数据量达500TB。如此巨大的数据量必须得到有效应用才能产生巨大的价值,推进我国技术创新和科技发展。现在有很多专利信息服务商能够提供传统的专利检索和分析服务,但是都仅限于专利,而且数据质量参差不齐,不够全面、准确和权威,服务价格相对较高。如果能以知识产权出版社的大数据为基础,进行整合加工处理,并进行大数据关联,构建一个以专利为核心的科技大数据信息服务平台,向终端用户提供质优、价低、权威的“一站式”信息服务,以及在此

4、基础上的专利大数据管理、运营、交易等扩展服务,则可以更好地促进我国的知识产权和科技创新工作。  一、专利与科技文献大数据现状及创新应用分析  (一)现状分析  以专利为核心的相关科技文献数据有较大规模。根据我们当前所积累的与专利相关的科技文献数据,总体分为专利文献数据、非专利科技文献数据(二者合称为核心资源数据)、检索数据、应用数据、平台数据和管理数据。具体包括:  1.核心资源数据  主要分为专利数据(含审查过程数据)、商标数据、标准数据、法律文书数据、期刊数据、其他数据。主要内容如下:  (1)中国

5、专利全文文本数据;  (2)国外专利全文文本数据(包括美国、欧洲、日本、韩国、世界知识产权组织WIPO、英国、德国、法国、瑞士、奥地利、加拿大、澳大利亚等);  (3)国外专利著录项目数据(共包括100余个国家及地区、组织);14  (4)中外专利法律状态数据;  (5)中外专利引证文献数据;  (6)中外专利生物序列数据;  (7)中外专利化学结构数据;  (8)中外期刊元数据数据库;  (9)中外标准数据;  (10)中国知识产权类法律文书数据;  (11)知识产权法律法规数据;  (12)中国商标

6、数据;  (13)美国商标数据;  (14)马德里国际商标数据;  (15)知识库及词表数据库;  (16)中外专利说明书及附图全文图像数据。  2.检索数据  主要包括为实现检索而收集整合的原始数据和加工数据,特别是各个检索字段。  3.应用数据  应用数据包括专利检索数据和非专利检索数据(主要是检索表达式和检索结果)、专利分析数据、项目管理数据、大数据商城数据、客户服务数据。  4.平台数据14  平台数据包括系统和网站的资源目录、表单、文本、图片、视频和网页。  5.管理数据  系统管理数据包括用

7、户数据、权限数据、日志数据、统计发布数据、监控数据、运维数据。  根据我们当前的检索业务运行情况,数据检索日访问量在10万左右,数据记录与分析记录量在10亿,在线服务数据量在150TB左右。  (二)基于大数据关联与整合思路的创新应用分析  根据与专利相关的科技文献大数据内容分析,专利文献与非专利文献表现出很强的相关性,例如专利与科技文献间引证关联关系、检索内容关联关系、文献信息相似性关系等,需要用大数据关联的思想对其进行分析、挖掘和整合,将相关数据整合后对外展示和提供服务,产生一系列新的价值。  以专

8、利为核心的科技文献大数据关联与整合的主要过程包括:  1.对专利和非专利文献进行收集、整理、存储。  2.对数据进行清洗、整合、深加工、翻译、代码化等处理。处理完成的数据经过大数据分析,采用数据挖掘算法、预测性分析、语义引擎等技术进行智能关联,将文献引证关系、技术关联性、新颖性、创造性、商业价值等展现出来,同时对部分内容进行人工或自动标引,提高关联分析的有效性。  3.在此基础上形成应用服务,例如检索服务、分析服务、预警服务、专利价值评估、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。