| 235 | 0 | 98 |
| 下载次数 | 被引频次 | 阅读次数 |
本研究基于翻译比赛语料,利用自然语言处理工具抽取了译文中的词汇丰富度、句法复杂度和语篇衔接等154个汉语语言计量特征,考察了这些特征与英译汉翻译质量之间的关系及其对译文分数的预测力。结果表明:第一,词汇层面的复杂词汇占比、词汇多样性、名词密度及简单词汇占比指标,句法层面的汉语搭配和依存句法特征多样性指标以及篇章层面的中心句子、主语语义类占比、主语密度及代词相关指标与英译汉翻译质量有显著相关关系;第二,逐步线性回归模型的16个指标能够解释译文分数的52.40%,随机森林回归模型的40个指标能够解释译文分数的47.88%,且两个模型在指标选择上有高度一致性。本研究揭示了汉语语言计量特征对译文质量的影响,也为英译汉翻译质量评估提供了有效的研究手段,同时为翻译实践提供了参考和支持。
Abstract:Based on a corpus of English-to-Chinese translation competition data,this study employs natural language processing tools to extract 154 quantitative linguistic features from the translations,covering lexical richness,syntactic complexity,and discourse cohesion.It investigates the relationship between these features and translation quality,as well as their predictive power for translation scores.The results show that several features are significantly correlated with translation quality.At the lexical level,the proportion of complex words,lexical diversity,noun density,and the proportion of simple words exhibit strong associations with translation scores.At the syntactic level,the diversity of Chinese collocations and dependency structures emerges as key indicators.At the discourse level,features such as the proportion of central sentences,the distribution of semantic categories of subjects,subject density,and pronoun-related metrics also demonstrate significant correlations.Furthermore,a stepwise linear regression model incorporating 16 features accounts for 52.40% of the variance in translation scores,while a random forest regression model using 40 features explains47.88% of the variance.Notably,both models show a high degree of consistency in feature selection.This study highlights the influence of Chinese linguistic features on the quality of English-to-Chinese translations,proposes an effective approach for translation quality assessment based on quantitative linguistic analysis,and offers both theoretical insights and practical support for translation evaluation and practice.
[1]Hu,R.,J.Wu & X.Lu.Word-combination-based measures of phraseological diversity,sophistication,and complexity and their relationship to second language Chinese proficiency and writing quality[J].Language Learning,2022(4):1128-1169.
[2]Ortega,L.Syntactic complexity measures and their relationship to L2 proficiency:A research synthesis of college-level L2 writing[J].Applied Linguistics,2003(4):492-518.
[3]Wang,Y.& R.Hu.A prompt-independent and interpretable automated essay scoring method for Chinese second language writing[A].In Proceedings of the 20th Chinese National Conference on Computational Linguistics[C].Huhhot,Chinese Information Processing Society of China,2021.
[4]Williams,M.The application of argumentation theory to translation quality assessment[J].Meta:Journal des traducteurs,2001(2):326-344.
[5]Xu,J.& J.Li.A syntactic complexity analysis of translational English across genres[J].Across Languages and Cultures,2021(2):214-232.
[6]范璐,蒋跃.翻译语言特征新假设“折中假设”——基于依存语法的计量研究[J].外语教学与研究,2024(1):136-147,161.
[7]胡开宝,黑黟.数字人文视域下翻译研究:特征、领域与意义[J].中国翻译,2020(2):5-15;187.
[8]胡韧奋.基于搭配的句法复杂度指标及其与汉语二语写作质量关系研究[J].语言文字应用,2021(1):132-144.
[9]胡韧奋,肖航.面向二语教学的汉语搭配知识库构建及其应用研究[J].语言文字应用,2019(1):135-144.
[10]江进林.英译汉语言质量自动量化研究[J].现代外语,2013(1):85-91;110.
[11]江进林.Coh-Metrix工具在外语教学与研究中的应用[J].中国外语,2016(5):58-65.
[12]李文戈,徐红.语篇中指代的语义模糊性及其翻译研究[J].外语学刊,2008(3):119-122.
[13]梁丽,王舟.标点符号的语篇衔接功能与英汉翻译中的信息处理[J].中国翻译,2001(4):26-29.
[14]彭一平,胡韧奋,吴继峰.汉语语篇衔接特征的自动分析和应用研究[J].语言文字应用,2023(1):114-129.
[15]司显柱.论功能语言学视角的翻译质量评估模式研究[J].外语教学,2004(4):45-50.
[16]田艳.深度学习技术在英译汉即时自动评分中的尝试[J].中国科技翻译,2020(4):24-27.
[17]王金铨,文秋芳.中国学生大规模汉译英测试机助评分模型的研究与构建[J].现代外语,2009(4):415-420.
[18]王金铨,于香,吴万能.基于词汇计量特征的翻译质量评价研究[J].中国翻译,2021(5):113-120.
[19]王俊华.主位、主语和话题——论三者在英汉翻译中的关系及其相互转换[J].西安外国语学院学报,2006(1):24-27.
[20]王克非,胡显耀.基于语料库的翻译汉语词汇特征研究[J].中国翻译,2008(6):16-21;92.
[21]王克非,刘鼎甲.基于超大型英汉平行语料库的英语被动结构汉译考察与分析[J].外国语,2018(6):79-90.
[22]王克友.翻译中的语体风格、修辞意图与文本连贯性[J].解放军外国语学院学报,2010(1):57-61.
[23]吴继峰.汉语二语者学术汉语写作语言特征测量研究[J].语言文字应用,2023(3):51-61.
[24]徐莉娜.翻译中主题句取向的语用视点[J].外语研究,2010(3):71-78.
[25]徐云洁,王兆基,胡韧奋.基于新标准的汉语词汇复杂度自动分析工具及其应用[R].第七届汉语中介语语料库建设与应用国际学术讨论会,2023.
[26]杨志红.翻译质量的量化评估:模型、趋势及启示[J].外语研究,2012(6):65-69;112.
[27]余碧燕,江越,乔晶.英汉翻译句法多样化特征及成因[J].西安电子科技大学学报(社会科学版),2023(1):128-135.
[28]郑咏滟.高水平学习者语言复杂度的多维发展研究[J].外语教学与研究,2018(2):218-229;320.
[29]朱周晔.名词短语复杂度与学习者汉英翻译水平、翻译质量的关系研究[J].解放军外国语学院学报,2021(5):119-127.
[30]朱周晔,王金铨.文体差异、语言特征与学习者汉英翻译质量的关系研究[J].中国外语,2020(4):58-68.
(2) 详情见:第三十三届韩素音国际翻译大赛命题及评审工作报告[J].中国翻译,2021(6):160-162.
基本信息:
DOI:10.13564/j.cnki.issn.1672-9382.2025.05.006
中图分类号:H136;H146;H315.9
引用信息:
[1]王敬,司显柱.汉语语言计量特征与英译汉翻译质量的关系研究[J].中国外语,2025,22(05):98-105.DOI:10.13564/j.cnki.issn.1672-9382.2025.05.006.
基金信息:
北京市社科基金青年项目“基于人工智能的学生译文质量自动评估体系构建及应用研究”(编号:21YYC009)的阶段性成果