语言的电子资料库

语言的电子资料库

ID:43223927

大小:109.50 KB

页数:20页

时间:2019-10-04

语言的电子资料库_第1页
语言的电子资料库_第2页
语言的电子资料库_第3页
语言的电子资料库_第4页
语言的电子资料库_第5页
资源描述:

《语言的电子资料库》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ElectronicDatabaseforLinguisticandLanguageResearch語言的電子資料庫和語言研究一、機器語言可處理的文件快速增加原因1.電子出版2.線上資料庫及紀錄二、基本語言分析↓基本語言資料庫研究三、機器語言可處理的文件來源1.易取得與使用的大型資料庫2.可解決讀者、學者、學生的基本需求Dictionaries字辭典事實上,現代字典都是電子化生產,並且可以以機器呈現、輸出。二十年前,第一部可以機器閱讀的電子字典是1968年約翰歐尼的webster’s第七版字典。電子字彙資料庫的發

2、展可以回溯到那時期。AmericanHeritageElectronicDictionary美國遺產電子字典LongmanDictionaryofContemporary朗文電子字典CD-ROMoftheOxfordEnglishDictionary牛津唯讀電子字典LanguagesoftheWorld語言世界一種名為”語言世界”的字典可以辨認十八種世界上的語言,其系統資源使用者收尋或選擇跨語言的複合字詞。TEXTDATABASES文本資料庫語言資料的資料庫是源自於紙本,而紙本有分為書籍、報紙和期刊…等,根據全文

3、本身,資料庫給予個別辭典的細目,可能包含逐字索引和合乎文法的口頭禪。1960年,BrownUniversity集合由美國辭典編撰的資料庫。CELEX詞彙資料庫-英式英語資料庫,1950年代到1980年間,十萬個單字。COBUILD(CollinsBirminghamUniversityInternationalLanguageDatabase)-1960年後,兩億字。DCI(DataCollectionInitiative)-1989年,超過30億個單字。OverfiftyscholarsfromEurope,t

4、heMiddleEast,andNorthAmericaareparticipatingintheTEIeffortstodefinesetsoftagsformarkingfeaturesoftextsandtocodethetagsetswithintheframeworkoftheStandardGeneralizedMarkupLanguage(SGML).SPEECHDATABASES語音資料庫InstructionSpeechrecognitionandsynthesiseffortsinthe198

5、0splusadvancesinstoragetechnologyhaveledtoestablishmentofsharedspeechdatabasesthatcanbeusedforalgorithmdevelopmentandsystemevaluationandtesting.Suchdatabasesalsoprovideacommonreferenceforevaluationacrosssystemsandtechniques.Speechdatadifferconsiderablyfromtex

6、tdata.TheDARPA-supportedspokenlanguagesystemsresearchhasresultedinseveralspeechdatabases,includingthelargeTIMITdatabasedevelopedbyTexasInstrumentsandMIT.TheJEIDAJapaneselanguagedatabaseAsimilardatabaseforFrenchisGRECO,representingspeechfromthirty-twospeakers.

7、Itisclearthattheavailabilityofspeechdatabasesisnotasadvancedasthatoftextdatabasesbecauseofthelogisticsandresourcesassociatedwithspeechrecordingundercontrolledconditions.NetworkResources andothersourcesTheavailabilityofinternationalelectronicnetworks,suchasBit

8、net,Internet.ElectronicbulletinboardSponsors:theAssociationforComputationalLinguisticstheAssociationforComputersHumanitiesAresearchconsortiumhasbeenestablished,fromNewMexicoStateUnversity

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。