欢迎来到天天文库
浏览记录
ID:40552471
大小:1.54 MB
页数:70页
时间:2019-08-04
《信息资源管理——信息分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2021/7/151信息分析是指以用户的特定需求为依托,以定性和定量研究方法为手段,通过对信息的收集、整理、鉴别、评价、分析、综合等系列化加工过程,形成新的、增值的信息产品,最终为不同层次的决策服务的一项具有科研性质的智能活动。5信息分析5信息分析中的内容分析4.5.1内容分析1.内容分析概述内容分析(contentanalysis)是指识别某一信息的属性或特征,以达到准确地推理出该信息源(messagesource)的意义的过程。一般指自动内容分析。(1)内容分析的技术和工具内容分析采用的技术和工具通常有:词频和相对频率分析技术,停用词表技术
2、,语词轮排和对照技术,基于受控词表的分析方法,词干分析技术,定义语法类(即词类),句法分析法,结构分析法等。内容分析概述(2)内容分析的应用内容分析的应用领域很多。在政治学领域,通过对一个国家的政治性通信、政府控制的舆论工具的社论进行统计分析,来评价一个国家的政治态度是进攻(侵略)性的,还是防守性的;是敌意的,还是友好的。通过分析总统候选人的讲演、竞选演说或报告来估计他的政治倾向、思维方式等。在心理学领域,借助内容分析去确定受试者的品性。1959年9月25日,中国石油勘探队在东北松辽盆地陆相沉积中找到了工业性油流。“大庆油田”。日本要了解:【信
3、息分析的任务】大庆油田的位置?大庆油田的规模?大庆油田的设备1966年:《中国画报》服装衣着:北纬46度至48度的区域内,零下三十度的齐齐哈尔与哈尔滨之间的东北北部地区。油罐车上有很厚一层土,从土的颜色和厚度大庆油田在东北三省偏北1966年10月《人民中国》杂志最早钻井是在北安附近着手的人拉肩扛钻井设备“王进喜一到马家窑看到大片荒野说:‘好大的油海!我们要把石油工业落后的帽子丢到太平洋去。’”马家窑位于黑龙江海伦县东南的一个村子,在北安铁路上一个小车站东边十多公里处。王进喜的事迹王进喜是玉门油矿的工人,是1959年到北京参加国庆之后志愿去大庆的
4、。大庆油田在1959年以前就开钻了王进喜出席了第三届全国人代会,可以肯定油田已出油。1966年10月《人民中国》杂志王进喜所站的钻台上手柄的架式,推算出油井的直径是多少;从王进喜所站的钻台油井他背后隐藏的油井之间的距离和密度,又可基本推算出油田的大致储量和产量。日本决策机构推断:中国在近几年中必然会感到炼油设备不足,买日本的轻油裂解设备是完全可能的,所要买的设备规模和数量要满足每天炼油一万吨需要。日本人迅速设计出适合大庆油田开采用的石油设备。当我国政府向世界各国征求开采大庆油田的设计方案时,日本人一举中标。5.1内容分析2.自动编目与文摘工作自
5、动编目(Automatedcataloguing)指应用自动内容分析技术(如人工智能和专家系统技术),从待编目的文献中自动识别和提取书目信息生成目录产品的过程。自动编目系统有三种类型:编目知识和规则咨询系统,书目记录自动生成系统编目全程自动化系统。自动编目与文摘工作文摘是信息工作者处理和传递信息时经常使用的一种文体和信息产品。通报最新的研究成果和信息资源;深入揭示信息资源的内容;节约阅读时间;克服语言障碍等。撰写文摘是一种再创作活动,应当熟悉有关的规则和标准。其一般程序是:通读全文,了解其内容梗概。重点分析原文中有关研究背景、目的、研究范围与重
6、点、研究方法、研究过程、研究结果和结论等方面的内容。编写文摘。自动编目与文摘工作自动编制文摘:指利用计算机对文献文本进行扫描分析,自动生成文摘的过程和技术。基本原理是:将文章输入计算机中,或加以必要的预编辑;确定抽取“文摘句”的标准,建立一套计算文中各个词和句子的分值的方法;计算机根据给定的标准和方法分析文章全文,选出一批文摘句,加以润色和组织成一篇完整而连贯文摘,打印输出。5.1内容分析3.自动标引自动标引(automaticindexing)是指标引作业全部或部分实现自动化的过程。自动标引就是用机器抽取或赋予索引词,一旦编制好程序和规则,就
7、不需要人工干预。”5.1内容分析4.信息过滤技术信息过虑就是信息的选择性传播。信息过滤关注用户在一段时间内比较固定的信息需求,其目标是帮助用户处理大量的信息,对动态的信息流进行筛选。基于用户需求大纲,从输入的信息流中滤掉用户不希望得到的信息。随着internet的迅猛发展和广泛使用,“信息过载”和“不良信息”问题日趋严重。如何能够更有效、更准确地找到自己感兴趣的信息,滤除与自己的需求无关的信息已成为基于Internet网络信息查询的当务之急。信息过滤技术信息过滤技术可从3个方面分类:①根据操作的主动性分为主动或被动过滤技术;②根据操作的位置可分
8、为代理服务器过滤或客户端过虑;③根据过滤方法分为认知过滤、社会学过滤及经济学过滤。5.1内容分析5.信息提取技术要点在于通过过滤大量的非格式化或半格式
此文档下载收益归作者所有