词汇复杂度与英语作文质量
[摘要] 本文利用语料库软件,比较高分作文与低分作文在作文长度和词汇复杂度方面的异同,揭示中国学生在英语写作中的词汇发展规律,在词汇应用能力研究方面做出探索, 对教学法的改进有一定指导作用。
[关键词]英语写作,词汇复杂度
Lexical Complexity and Quality of L2 English Written Productions
ZHAO Xiaojing
International School, East China Jiaotong University, Nanchang 330013
Abstract: This paper, by making use of corpus software, compares lexical complexity between L2 English written productions of different quality levels, with an attempt to discover the developmental law of vocabulary, and to improve the teaching methodology of L2 English writing.
Key word: level of written English, lexical complexity
一、引言
写作作为语言输出能力的体现,是困扰中国学生的难点。而写作水平的上升,又往往需要提高词汇的应用能力。国内外学者, 如鲍贵(2008)[ ], Engber (1995)[ ]等,认为词汇应用能力有助于构建英语语篇,也有助于衡量英语写作质量。
二、研究背景
国外研究者对词汇知识的研究主要涵盖词汇丰富性和词汇多样性等概念, 测量方法主要是通过计算不同词类所占比例, 或是计算功能词所占比例,如Duran(2004)[ ],还有的通过设计词频表或分级词汇表来探查学习者的词汇的深度知识,如Read(2000)[ ]。美国学者Graesser et al (2004)[ ]推出了语言分析软件Coh-Metrix,根据200多个语言变量来对比分析,其中针对词汇应用的各个方面,如词汇的聚合关系和组合关系等的分析等,为研究者进行定量分析提供了便捷的测量手段。
我国大部分研究往往只侧重于测量作文中的词汇丰富性,词汇量等广度知识(万丽芳2010[ ])。而词汇复杂度与英语作文质量的关系,还需要进一步探索。与以往研究不同,本文利用语料库测量手段来测试英语习作中的词汇应用能力,以期探索词汇复杂度与英语作文质量的关系。该研究有助于二语教师和学习者进一步认识词汇学习的规律,有效提高二语写作中教与学的能力。
三、研究问题
词汇复杂度与英语作文质量之间存在什么关系?
3.1研究方法
本文收集了在线定时大学英语作文《整容与就业》, 按照作文质量分成四组:45分左右为差,60左右为及格,75分左右为中等,90分左右为良好。每个作文水平段挑选篇幅为300词左右的语篇各10篇。40篇作文经过核对和文本处理,成为小型语料库,通过语料库检索Range进行比较分析。
3.2词汇复杂度和变化性及统计
词汇复杂度和词汇变化性指的是文本中类符(type)数与形符(token,即文本中实际出现的词)数的比值(type/token ratio,TTR)。本研究将低频词(复杂词)定义为Range32词表中2级词表以外且拼写正确的词。为了便于词型统计,本研究利用lemmatizer中的lemmalist功能将一个词的不同屈折形式还原为类型。
一般说来,高频词因出现和使用的频率高而先被习得,低频词因出现和使用的频率较低而后被习得,低频词掌握程度水平可体现学习者词汇水平的高低。选择与主题、风格恰当的低频词,以准确和复杂的方式表达意义的非常用词,而不限于只使用常见的通用词汇,这就是词汇复杂性(lexical complexity)(Read, 2000:200)。
本研究根据RANGE软件将词汇分为四个词频级:前两级为高频词,按照1级词频表包括最常用的约1,000个英语词簇;2级词频表则包括次常用的约1,000个英语词簇;第3级为低频词,包括前两个词频表之外、最常用的学术词汇570个英语词簇;4级词频表则为未收录进RANGE词表中的词,在本文中不予讨论。
四组大学生作文词频统计数据如下表1:
组别 形符 类符 类/形比/% 3级表类符比/%
45分组 2277 622 27.32 11.74
60分组 2835 755 26.63 10.19
75分组 3994 977 24.46 14.23
90分组 5176 1072 20.71 18.28
下图2更直观地比较四组不同的写作水平:

词汇复杂性各指标趋势从上两图可知,由于作文长度即形符数随分数呈现增长趋势,但类符数并未以相同幅度随之相应增加,因此四组类形比数据呈现逐渐下降形式。从低频词即第三组词频表分析可知,45分和60分这两组,即1组和2组在作文水平上近乎相等,而在3组和4组时,作文水平提高的趋势就变得十分明显了。因此我们可以得出一个结论,虽然作文长度是影响作文词汇变化性的一个重要参数,但也说明,作文越长,重复使用的词可能越多,考察作文质量要综合作文长度和类型比等指标。
从表1中,我们还可以得出以类符比为例的词频表3如下:
组别 1表比 2表比 3表比 非表比
45分组 67.52 9.00 11.74 11.74
60分组 64.77 11.74 10.19 13.29
75分组 58.03 12.28 14.23 15.46
90分组 55.41 11.19 18.28 15.11
从上表可知,1组和2组,即45分和60分组作文较多地依赖高频词,尤其是一级(最高)词频内的词;3、4组,即75分和90分组能较多地使用二级词频以上的低频词。因此,3、4组学生的词汇产出较1、2组强,这也说明了产出词汇量的增长与作文水平的关系。
上图也看出,词汇复杂度部分地反映了作文质量。尽管学习者的作文质量由多个变量决定,譬如内容和篇章结构等,但是毫无疑问,学习者的词汇使用是决定作文整体质量的一个重要指标。
四、结语
本科生处于中介语发展的高级阶段,其语言知识通过积累在逐步增加,体现为词汇复杂度等方面水平的提高,如本文研究结果所示:他们在词汇难度和多样性等方面有很大进步空间;这些指标也在一定程度上反映了目前本科生的英语写作水平情况。本研究对作文教学具有一定的启示:多使用range词表中表2和表3中的词语,可以使作文更加流畅、美观。教师可指导学生先进行模拟填空写作练习,有效促进学生表达能力,增强作文用词的准确性和流利度。
参考文献
[ ] 鲍贵. 二语学习者作文词汇丰富性发展多纬度研究[J].外语电化教学,2008( 2): 38-44
[ ] Engber C A. The relationship of lexical proficiency to the quality of ESL compositions [J] Journal of Second Language Writing, 1995(2):139-155.
[ ] Durán, P, D Malvern, B Richards and N Chipere Developmental trends in lexical diversity [J]. Applied Linguistics, 2004(2):220-242.
[ ]Read,J.(2000).AssessingVocabulary[M].Cambridge:Cambridge University Press.
[5] Graesser, A. C., McNamara, D. S., Louwerse, M. M., & Cai, Z. Coh-Metrix: Larsen-Freeman, D. 2006.The emergence of complexity,fluency, and accuracy in the oraland written production of five Chinese learners of English [J].Applied Linguistics 27,4:590-619.
[ ]万丽芳. 中国英语专业大学生二语写作中的词汇丰富性研究[J]外语界,2010 (1): 40-46.