发布时间:2024-07-14 09:37 原文链接: 研究揭示中文不需要采用词间空格的认知根源

英语中每个词之间都有空格,但中文没有空格将词隔开,属于不同词的汉字相邻呈现(如图1所示)。绝大部分的英文阅读模型认为利用空格将词分开在阅读中起到了至关重要的作用。这引发了一些重要的问题:为什么英语使用空格,而中文不使用?哪种方式更好?中文是否有必要在词之间加入空格,或者英语是否应该学习中文而取消空格?中国科学院心理研究所李兴珊研究组针对上述问题开展了一项研究。

图1不同书写系统标记词边界的方式


该研究提出了一个假设,认为书写系统对词边界标记方式的选择不是随意的,而是为了达到高效阅读,在权衡词切分需要付出的认知努力和阅读时的视觉加工效率后,选择了更经济的方式。为检验该假设,研究团队基于大规模语料库,运用信息论方法量化了27种语言中空格为确定词边界提供的信息量。结果表明,不同书写系统对词边界标记方式的选择与空格提供的词边界信息量有关:在采用空格的书写系统如英语中,空格提供的信息量更大(2.90比特);而在不采用空格的书写系统如中文中,插入的空格提供的信息量更小(1.10比特,如图2所示)。空格提供的信息量反映了阅读无空格文本时付出的认知努力。对于空格信息量较大的字母书写系统如英语,文本去掉空格后,读者需要付出更多认知努力进行词切分,容易出现词切分错误;但对于中文,如果在文本中插入空格,空格提供的信息量较小,读者不需要付出太多认知努力进行词切分。因此,英语倾向于使用空格以减少词切分的认知负担,而中文则选择不使用空格。两者都选择了更经济的词边界标记方式。

图2二十七种语言中词间空格为确定词边界提供的信息量


空格信息量差异的根本原因是不同书写系统的词长分布不同。中文是表意文字系统,每个汉字代表一个音节或语素,因此每个汉字提供的信息量超过其他书写系统中的字母。中文汉字提供的平均信息量为9.84比特,而英语字母提供的平均信息量为4.32比特。基于该特点,大多数中文词可以用一到两个汉字表示(平均词长为1.40个汉字,标准差为0.57),而英语单词往往由多个字母组成(平均词长为3.78个字母,标准差为2.04)。因此,中文词边界位置的不确定性较小,即使插入词间空格,其为确定词边界提供的额外信息有限;而英语词边界位置不确定性较大,词间空格可以为确定词边界提供更多的信息量。

需要注意的是,中文若加入空格虽然提供的信息量较少,但仍提供了1.10比特的信息量。那中文为什么不用空格呢?这可能是在权衡了词切分付出的认知努力和视觉加工效率两个方面因素后,中文选择了更经济的词边界标记方式。在阅读时,一个注视点的视觉感知范围有限,空格的插入会导致读者在一个注视点上感知的字符变少,从而降低视觉感知效率。对中文而言,插入空格为词切分带来的效益不足以抵消它在视觉感知方面导致的代价,因此中文不采用空格是更经济的。相对地,英语等字母书写系统中空格提供的信息量较大,空格为词切分带来的效益远大于它在视觉感知方面导致的代价。由此可见,虽然有的书写系统采用空格标记词边界,而另外一些书写系统不明确标记词边界,但都是为了实现阅读的经济性而做出的选择。

与该研究的假设一致,以往研究表明,改变词边界的标记方式对不同语言读者的阅读效率产生了不同影响。这些研究发现,在空格信息量较大的书写系统(如英语)中去掉空格,阅读速率大幅下降约50%;而在空格信息量较小的书写系统(如中文),即使插入空格,阅读速率也不会显著提升(如图3所示)。

图3有词间空格与无词间空格的阅读速率


从字母书写系统的演化历史来看,人们逐渐改革书写系统,以实现最经济的词边界标记。历史上,字母书写系统并非始终使用空格标记词边界。由于转录的口语中没有词边界信息且书写材料昂贵,早期书写文本中没有空格。读者为了理解文本意义不得不出声阅读,导致阅读效率较低。这一时期的书写系统仅由少数抄写员或传教士使用。直到文艺复兴时期,随着大众阅读需求增加,这些书写系统才逐渐加入词间空格,提高了识字率和阅读效率。由此可见,字母语言中加入词间空格这一书写系统的变革逐渐适应了人类的认知需求,更符合经济性原则。


这一发现不仅有助于人们更好地理解跨语言普遍性与特异性的阅读认知机制,还可以为不同语言文本的排版和设计提供科学依据。

文章已在线发表于Annals of the New York Academy of Sciences。心理所助理研究员黄林洁琼为第一作者,心理所李兴珊研究员为通讯作者。该研究得到了国家自然科学基金面上项目(32371156)、中国博士后科学基金(2022M723362)、中国科学院心理研究所项目(E2CX6625CX)的支持。

论文信息:

Huang, L., Reichle, E. D., & Li, X. (2024/07/02).?Comparative Analyses of the Information Content of Letters, Characters, and Inter-Word Spaces Across Writing Systems.?Annals of the New York Academy of Sciences.?https://doi.org/10.1111/nyas.15178

相关论文:

Li, X., Huang, L., Yao, P., & Hy?n?, J. (2022). Universal and specific reading mechanisms across different writing systems.?Nature Reviews Psychology,?1(3), 133-144.? https://doi.org/10.1038/s44159-022-00022-6

 


相关文章

研究揭示中文不需要采用词间空格的认知根源

英语中每个词之间都有空格,但中文没有空格将词隔开,属于不同词的汉字相邻呈现(如图1所示)。绝大部分的英文阅读模型认为利用空格将词分开在阅读中起到了至关重要的作用。这引发了一些重要的问题:为什么英语使用......

研究揭示中文不需要采用词间空格的认知根源

英语中每个词之间都有空格,但中文没有空格将词隔开,属于不同词的汉字相邻呈现(如图1所示)。绝大部分的英文阅读模型认为利用空格将词分开在阅读中起到了至关重要的作用。这引发了一些重要的问题:为什么英语使用......

研究揭示中文不需要采用词间空格的认知根源

英语中每个词之间都有空格,但中文没有空格将词隔开,属于不同词的汉字相邻呈现(如图1所示)。绝大部分的英文阅读模型认为利用空格将词分开在阅读中起到了至关重要的作用。这引发了一些重要的问题:为什么英语使用......

心理所发现工作记忆容量影响语言理解中的预测加工

日常交流中,人们经常会预测对方即将说出的内容。例如,你的朋友跟你说“我刚从青岛回来,在海边捡了很多……”,可能还没说完,你就已经根据“青岛”“海边”等概念预测到即将说出的是“贝壳”。这种语义信息的预先......

讯飞星火认知大模型V1.5发布,综合能力实现三大升级

6月9日,讯飞星火认知大模型V1.5正式发布。仅仅时隔一月,讯飞星火认知大模型不仅各项能力持续提升,且在综合能力上实现三大升级:开放式知识问答取得突破,多轮对话、逻辑和数学能力再升级。星火App同步发......

情绪辅导联合认知策略训练提升老年人记忆等获进展

老年人在认知下降的过程中,常伴随情绪问题的困扰。焦虑和抑郁情绪广泛存在于老年人中。有焦虑和抑郁情绪的老年人的认知衰退更严重,痴呆风险更高。焦虑和抑郁情绪对记忆有负面影响。动物研究显示,心理应激导致包括......

离谱,拍核磁可以改善认知?

近日,中国科学院合肥物质科学研究院强磁场中心张欣课题组等依托稳态强磁场实验装置(SHMFF),利用自主搭建的强磁生物学研究平台,开展了33.0T的稳态强磁场生物安全性和神经行为学影响研究,首次报道了3......

看电视,非刺激性久坐活动会增加认知损伤的风险!

“电视看多了会让你变傻!”这是一句父母经常“威胁”子女的警告。目前看来,这个说法是有科学依据的。随着医学技术的发展和生活水平的提高,人类预期寿命正在延长。20世纪初时,全球平均寿命61岁,如今已延长到......

历时10年的青少年大脑认知发育研究发表

科技日报北京6月8日电(记者刘霞)美国科学家在8日出版的《自然·神经科学》在线版上撰文指出,他们开展了迄今最大规模的纵向神经影像学研究,获得的青少年大脑激活数据揭示了与对青少年的发育至关重要的认知过程......

研究发现:海马体前部和后部存在显著差异

美国德州大学西南分校的研究人员对大脑海马的基因活动进行了研究,发现海马体前部和后部存在显著差异。这一发现发表在今天的《Neuron》杂志上,它可能有助于揭示涉及海马的各种大脑疾病,并可能最终帮助我们找......