资源描述:
《开放语言典藏组织(olac)与语言典藏後设资料之标准》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、開放語言典藏組織(OLAC)與語言典藏後設資料之標準黃居仁、張如瑩1OutlineIntroductiontoOLACDublinCore&OAIOLACStandardsOLACMetadataSetOLACandAsianLanguagesExamplesSomeRelativeWebSiteOLACLaunch2TheOpenLanguageArchivesCommunity3OLACAimsOLAC,theOpenLanguageArchivesCommunity,isaninternationalpartnersh
2、ipofinstitutionsandindividualswhoarecreatingaworldwidevirtuallibraryoflanguageresourcesby:developingconsensusonbestcurrentpracticeforthedigitalarchivingoflanguageresources;developinganetworkofinteroperatingrepositoriesandservicesforhousingandaccessingsuchresources.
3、4OLACOrganizationCoordinators:StevenBird&GarySimonsAdvisoryBoard:HelenAristarDry,SusanHockey,Chu-RenHuang,MarkLiberman,BrianMacWhinney,MichaelNelson,NicholasOstler,HenryThompson,HansUszkoreit,AntonioZampolliParticipatingArchives&Services:LDC,ELRA,DFKI,CBOLD,ANLC,LA
4、CITO,Perseus,SIL,APS,UtrechtProspectiveParticipants:ASEDA,AcademiaSinica,AISRI,INALF,LCAAJ,Linguist,MPI,NAA,OTA,Rosetta,TibetanDigitalLibrary(UVA)IndividualMembers:~120www.language-archives.org5IntroductiontoOLAC許多協會需要語言資源,如:語言學家、工程師、教師、演說家﹔許多機構提供片段性的架構,如:檔案管理員、軟體發
5、展者和出版者。前所未有的契機:延伸性標誌語言(ExtensibleMarkupLanguage,XML)和Unicode題供以結構化方式彈性呈現以及長期儲存資料。線上或非線上的數位化出版品有效且實際上達到分享語言資源涵義DublinCore後設資料集(資源分類標準模組)連同OpenArchivesInitiative所提供的交換方法,可建立一個跨越多個儲存器與檔案櫃的架構。6TheVisionforanOpenLanguageArchivesCommunity使用者透過一個OLAC的服務題供者網站搜尋與呈現OLAC的meta
6、data欄位。7TheVisionforanOpenLanguageArchivesCommunity#2理論上-使用者可取得任何需要的資源DATA:任何描述語言的相關資訊。問卷結果:25%數位化,但並未採用相同的後設資料欄位。TOOLS:有助於創造、瀏覽、查詢或使用語言資料的計算機資源。ADVICE:什麼資源是可靠的?什麼工具適用於此情境?創造新資料時該如何作?8TheVisionforanOpenLanguageArchivesCommunity#3實際上無法得到想要的資源在不同網站擁有不同名字(Name)造成召回率低(
7、lowrecall).在其他領域有相同意義,造成正確率低(precision).是否運用適當軟體以及判斷ADVICE的價值?許多語言資源並非以文字為基礎。語言資源散佈在不同的網站.9TheVisionforanOpenLanguageArchivesCommunity-BridgingthegapthroughcommunityinfrastructureGateway:使用者可獲得data,tool,advice的單一入口網站。Metadata:data,tool,advice的統一描述,包含所有項目的連結以及解釋如何存取
8、。Review:瀏覽data,tool,advice的評價。Standards:上述各項過程與協定的基礎,例如:metadataschema,harvestingprotocol.10TheVisionforanOpenLanguageArchivesCommunity-Summary:S