基于语料库的苏童作品风格研究

基于语料库的苏童作品风格研究

ID:9145243

大小:53.55 KB

页数:8页

时间:2018-04-19

基于语料库的苏童作品风格研究_第1页
基于语料库的苏童作品风格研究_第2页
基于语料库的苏童作品风格研究_第3页
基于语料库的苏童作品风格研究_第4页
基于语料库的苏童作品风格研究_第5页
资源描述:

《基于语料库的苏童作品风格研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、基于语料库的苏童作品风格研究基于语料库技术对文本风格进行定量研宄在国外己经发展得比较成熟,而国内的文本分析大都还处于文艺风格的内省式研宄。苏童是先锋作家的代表人物,第九届茅盾文学奖获得者,并且作品被翻译成多国语言,在国内和国际文学上有很大的影响。从语言学角度研宄其文本风格的很少,我们采用计算风格学理论,利用语料库技术对苏童的代表作品进行从高频词的使用、标点符号的运用以及文本阅读难度三个方面分析。关键词:苏童作品风格计算风格学语料库基于语料库的定量分析属于验证性的分析,我们的研宄试图通过定量分析验证内省式分析的

2、结论并且发现内省式研宂不能得到的结论。苏童是先锋作家的代表人物,第九届茅盾文学奖获得者,并且作品被翻译成多国语言,在国内和国际文学上冇很大的影响。苏童擅长描写女性,其作品中包含了不同类型的女性形象;他出生在江苏,作品中宥着江南水乡的影子;谢光胜(2015)指出苏童小说语言的“陌生化”程度比较高的特点,其中包括标点符号的陌生化。上世纪30年代,西方文体学界引入了定量分析,尤其是统计学的方法。到了50年代,由最初的人工统计文本中的语言项目,到后來借助计算机进行统计,大大提高了研究的效率。这种研究方法取得了很大的成

3、就,逐渐发展成一支独立的学科计算风格学(ComputationalStylistics)。计算风格学是数理语言学的一个分支,其理论基础是写作是个人将思想通过文字表达出来的一种活动,其隐含的是作者语言编码的方式,作者木人可能也察觉不到。因此,可以通过量化文木中语言结构的方式发现作者的写作风格。1.自建作品语料库20世纪90年代,随着计算机技术和互联网的快速发展,文本的搜集变得更加方便,文体学研究呈现出了Leech和Short(2001)所说的“语料库转向”。言语的使用差别很人,仅仅凭内省式的言语感知是不能很好地

4、判断的。使用语料库则极大地提高了文本分析的效率和精确性,避免了人们主观上的误差,为文本分析提供了一种新的分析方法。我们自建了苏童作品语料库,包括了他的四部代表作品,共571477字。具体如表1:我们自建的语料库的语料是从网上下载的,根据权威网站的文本,加上人工校对,以纸质版书籍?橐谰荩?确保语料的正确性。语料是我们分析研究的对象,语料的正确性决定着研究结果的正确性。然后就是对语料的处理,主要是分词。因为本研究中并没冇涉及到词类,因此我们使用的是屮科院张华平老师的分词软件。该分词软件正确率很高,但是我们也对处理

5、后的语料进行了人工校对。分词主要是关系到类符形符比这一分析。数据的统计,使用AntConc可以帮助我们统计高频词和标点符号。2.苏童作品分析2.1基于语料库的高频词分析高频词是文本主题的反映,根据高频词我们可以知道作家的写作闪容主题以及关不同文本之间的差异。这里的高频词仅仅只是实词,不包括虚词。我们用AntConc的Wordlist功能处理苏童作品诏料库可以得到前100个尚频词。根据表2,我们可以分析一下苏童作品的高频词。关于代词,出现了我、她、他、你、自己、这、他们、什么、怎么、谁等。名词包括人、女人、手、

6、母亲、父亲、祖父、男人、孩子、眼睛、老板、家、天、事等,这些词屮女人、母亲出现的频率最高,在代词屮,表示女性的“她”也要高于其他代词。人名包括五龙、保润、颂莲、柳生、织云、绮云、慧仙等,其中七个人名中有四个是女性。可见苏童的作品中女性比较多。动词包括说、去、至lj、要、来、看、吃、住、知道、去、走、坐、想、用、会、做、出、起、跑、问、BH、拿、生、听、打、站等,这些词都是描述日常生活屮的动作,是对H常生活的描写。其他的名词如米、船、河、水等,在苏童的小说中出现了很多与南方生活相关的词汇,这些词汇使苏童的作品更

7、加具有江苏木地特色。2.2基于语料库的标点符号分析标点符号是文字序列的组成部分,相同的语言使用不同会冇不同的表达效果。朱德熙先生在《语法修辞讲话》屮单独对标点符号进行了解释,他指出了标点符号在现代汉语中的重要性:“标点符号是文字里面的有机的部分,不是外面加上去的。”以及标点符号在文本中的作用:“自从有了标点符号,文章的风格也收到了影响。最显著的,有问号……有了引号……有了破折号和省略号……”可见,标点符号在书面语的表达上的重要性。因此,我们对四部作品屮的标点符号进行统计。这些标点符号分别是逗号、句号、问号、感

8、叹号、省略号、破折号、引号冒号和顿号。根据表3,我们可以看出来,逗号、句号、问号、叹号、顿号等频率随着文本容量的增大而增加,只有省略号、破折号、双引号、冒号的频次没有出现增加的趋势,并且也没有规律可循。破折号、省略号根据其表达需要可以是根据作家的写作内容而定,但是小说中的大量对话使得双引号和冒号不可或缺。但是,在苏童的作品中冒号和双引号频次这么低,原因如下:引号分为双引号和单引号,一般情况下用的都是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。