儿童语言习得探究新视角-人类家庭语言计划(humanspeechome)

儿童语言习得探究新视角-人类家庭语言计划(humanspeechome)

ID:31671564

大小:64.20 KB

页数:14页

时间:2019-01-17

儿童语言习得探究新视角-人类家庭语言计划(humanspeechome)_第1页
儿童语言习得探究新视角-人类家庭语言计划(humanspeechome)_第2页
儿童语言习得探究新视角-人类家庭语言计划(humanspeechome)_第3页
儿童语言习得探究新视角-人类家庭语言计划(humanspeechome)_第4页
儿童语言习得探究新视角-人类家庭语言计划(humanspeechome)_第5页
资源描述:

《儿童语言习得探究新视角-人类家庭语言计划(humanspeechome)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、儿童语言习得探究新视角:人类家庭语言计戈U(HumanSpeechome)摘要:人类家庭语言计划(HumanSpeechome,HSP)是2006年开始实施的一个基于大数据采集的儿童语言习得项目。项目组在项目创始人Roy家里安装了14个麦克风和11个全方位摄像机,不间断地收集了其儿子生命中前三年的语言学习数据。目前项目已开发出了各种密集数据收集和处理的新技术,如视听浏览系统、语音转录系统以及视频标注系统等。借助新技术提供的数据,项目组已经取得了不少儿童语言习得方面的研究成果,接下来面对的问题是如何推广和提升其技术。关键词:儿童语言习得研究人类家庭语言计划新视角1.引言

2、人类的语言能力一直是科学界研究的兴趣所在,建立和人类一样具有语言能力的人工智能系统目前对研究者来说仍力所不能及。目前我们对语言习得机制的了解还不够充分,其中一个重要原因就是我们不能给机器提供足量的交流信息让它学习。儿童语言习得研究的数据搜集方法经历了不断的提升和改进。早在18世纪末,德国哲学家DietrichTiedemann就曾对自己孩子的语言发展过程进行过自然观察和记录。此后,研究者又采用了在实验室里观察儿童语言习得的方法,但因其捕捉的儿童行为表现以及儿童和看护之间的相互交流是不自然的,这种研究方式在20世纪下半叶遭到了较多质疑。Bruner(1983)说,要想获

3、得真实的父母和孩子之间相互交流的画面,需要在家里、在生动活泼的环境中进行收集。该观点得到了普遍认可,研究者开始去孩子家中进行观察,但每周只进行几个小时的话语录音,收集到的材料还不到儿童语言学习经历的1.5%(BrianMacWhinney2000)o随后一些研究者(Braunwald1978;Dromi1987)通过日记来记录自己孩子的语言发展过程,收集的数据和之前的相比相对密集了一些,但仍然稀少。这种基于文本记录的方法受到看护记录人员的主观性影响,不能捕捉到儿童语言发展的细节。人类家庭语言计划(HumanSpeechome,HSP)就是在弥补以往研究方法的不足以及满

4、足新的研究需要的基础上建立起来的。该计划创始人DebRoy将各种研究方法的优点结合起来,把自己的家装配成了一个有视听设备永不停歇的实验室,目标是研究儿童语言发展和他们所接触的社会环境刺激之间的关系。1.HSP介绍人类家庭语言计划是由DebRoy和认知机器团队开发的一个项目(DebRoyetal2006)o主题思想是把一个初生婴儿的家用视听设备装配起来,把他从一岁到三岁几乎所有的语言习得过程都记录下来,根据孩子的生活经历和语言发展情况建立一个语言习得的可计算模型,模拟出儿童语言纵向的发展过程。Roy是麻省理工大学终身任职教授,他认为研究人类认知的一种有效方式是仿造人类制

5、造机器(DebRoyetal2006),让它们在社会环境中执行人类功能。这个有启发性的想法激发了Roy启动HSP项目的热情。征得了妻子的同意之后,在2006年,从他儿子出生后离开医院回到家里起,HSP项目就正式启动了。项目组用14个麦克风和11个全方位摄像机把Roy的家装备起来,对他初生儿子的语言习得情况进行了历时三年的数据收集和研究工作。视听设备隐藏在客厅、卧室、厨房、餐厅等各个房间的天花板上。三年下来,共搜集了约23万个小时的视听记录文件,其中包括约14万小时的音频文件和约9万小时的视频文件,记录了孩子在醒着状态下将近80%的生活经历。大规模数据库的语音转录、视频

6、标注等数据采集和处理工作,向HSP提出了新的挑战。项目组把人工操作和机器自动加工结合起来,开发出了人机合作的数据处理系统。下文将对HSP开发的新技术进行简要介绍。1.HSP开发的新技术3.1视频音频数据采集技术3.1.1录音风暴(TotalRecall):初级视听浏览器TotalRecall是项目组(RonyKubatetal2007)为采集数据最早投入使用的系统,也是开发其他系统的平台。TotalRecall具有视频音频的可视化、重放以及标注等功能。处理视频文件时,用户可以选择高分辨率地观看某一个频道,也可以低分辨率地观看所有频道。处理音频文件时,选中一个频道就有相

7、应的录音播放出来,同时会呈现出反映语音频率信息的声谱图。TotalRecall在视频标注中可以标注儿童所在的具体位置,这为儿向语言(ch订ddirectedspeech,CDS)以及儿童可接触语言(childava订ablespeech,CAS)的对比分析提供了条件(RonyKubatetal2007)o3.1.2家蝇(HouseFly):升级版视听浏览器HouseFly和TotalRecall一样,也是一种视听浏览器,不过它是一种更高级别的浏览系统。TotalRecall用传统的2D模式界面来浏览数据,HouseFly(PhilipDeCampet

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。