网络数据存档的存在问题

网络数据存档的存在问题

ID:1212673

大小:189.50 KB

页数:31页

时间:2017-11-08

网络数据存档的存在问题_第1页
网络数据存档的存在问题_第2页
网络数据存档的存在问题_第3页
网络数据存档的存在问题_第4页
网络数据存档的存在问题_第5页
资源描述:

《网络数据存档的存在问题》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、网络数据存档的存在问题B.Kahle2000.3原始出处:http://www.vala.org.au/hans0602.pptbluerye(DXY)译网络数据存档的存在问题“网络站点无论队一个机构的数字资产,还是对于一个国家的信息和文化遗传都起着越来越重要的作用”(JISC2002.4)“许多历史上的信息,生来就是数字化的。这点不同于早期的电视,因为它并没有记录。”(BrewsterKahle2002.3)网络存档的存在问题澳大利亚美国北欧国家:丹麦芬兰瑞典其他国家:英国法国日本国际网络数据的存档库例如:“waybackMachine”

2、三个会议数据储存图书馆的未来达姆施塔特[德国]2001.9国际数据网络存档大会东京2002.1DPC论坛:网络数据存档伦敦2002.3会议网站http://www.bnf.fr/pages/infopro/dliECDL2001.htmhttp://www.ndl.go.jp/enews/sympoeng.htmlhttp://www.jisc.ac.uk/dner/preservation/webforum.html存在问题储存数字化信息的合法性?版权?是否允许访问和对公众开放?选择一部分还是全部储存?多长时间更新介质?何时更新?如何在多

3、变的网络中获得信息?技术上面临的挑战嵌入的外部链接和可执行程序不变的名称和数据标识复制控制内容随时间的变化表层网页和深层网页澳大利亚(潘多拉档案库)NLA:http://www.nla.gov.au/pandora仍没有合法地位储存公有的出版物选择性储存(澳大利亚电子刊物,组织化站点,政府出版物,短期资源)允许公众访问-NDB条款澳大利亚(潘多拉档案库)~1700个标题(2001.11)增长率:每月40站点重新整理:每月35站点ADRI(澳大利亚数字资源确认)独特的确认方法自身处理系统美国(雅典娜议档案库)-议会图书馆将互联网资源制图,可视

4、化档案库可通过网页访问资源版权的合法性正在论证阶段选择性收录对公众公开LC/IA领航计划-“Election2000”将网上和议会资源库共享目标:图书馆:选择收集和分类站点;建造原型访问站点网络档案库:在整理和归档站点的过程中学习经验800多个站点(在这些站点中包括150多个选择后的站点和主要)数据量有2-3万亿字节每日归档(2000.8~2001.1)丹麦皇家图书馆,哥本哈根出版物的储存有一定法律权限非动态的静态出版物-有限的站点只允许皇家图书馆,国立图书馆和大学图书馆访问只归档静态站点(专论和过刊)奥尔胡斯会在每天夜里为国立和大学图书馆

5、提供镜像站点丹麦(统计数字)9000网络出版物(2001.6)-31%为专论,69%为过刊-67.5%来自公共部门和图书馆,32.5%来自私立部门工作人员中有0.5是技术人员,0.8是图书管理员瑞典皇家图书馆每年若干次对本国站点进行扫描-不选择,收录一切-包括所有网页,所有电子刊物,所有新闻-包括.se-,.com,.org,.net在内的所有使用瑞典地址和电话号码的网站。-只归档但不允许访问。瑞典软件使用Whois软件鉴定本国的站点使用COMBINERobot软件收录站点-自动从超链接中收集文章-同时收录图片和声音文件-全自动化无需人为帮

6、助瑞典档案库(Kulturarw3)http://www.kb.se/kw3所有资源都作为一个多部分的MIME一个元数据储存在一个文件里面文件命名:33个字符以及记录时间截至到2001.9:从97000个网络服务器中活得110,000,000文件,总计3000G字节的数据量储存在磁盘和碟片中,用分等储存管理(HSM)管理文件瑞典档案库(Kulturarw3)直到2002.7,只有部分法定权限(一些固定的网络文件)2001.12,数据核查联合会的确认计划被认为违法。于是改计划被叫停了。2002.7,修改后的瑞典版权法,给予了瑞典皇家图书馆以收

7、集本国网站和公开档案库的合法地位芬兰国际图书馆使用了和瑞典类似的方案,最初只是负责本国范围之内。具有收集数据资源的合法性和版权使用芬兰的来自NEDLIB的软件收集数据。档案元数据使用MD5校验和的方法控制复制,这种方法较为权威而且具有唯一的认证码配合时间标识作为一种挽救措施芬兰-现行的数据收集情况2001-2002年度的数据采集-始于2001.8止于2002.4-从29,000,000个URL中收集了9,400,000个文件-压缩后的文件总计340G字节-储存在国际超级计算中心提供的介质上-硬件:SunE450服务器芬兰-现行的数据收集情况

8、项目的经验:“NEDLIB数据收集系统可以除了任何网络空间(美国除外),配合完备的硬件,提供了足够的储存空间”(JuhaHaleka,“FinishTeam”项目的主持人)北欧网

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。