打开网易新闻 查看更多图片

关键词:计算社会科学,语言复杂性,社交媒体

打开网易新闻 查看更多图片

论文题目:Patterns of linguistic simplification on social media platforms over time 论文地址:https://www.pnas.org/doi/10.1073/pnas.2412105121 期刊名称:PNAS

1.

社交媒体不仅改变了信息传播的路径,还深刻影响了用户的语言使用习惯。从信息茧房到虚假信息传播,社交媒体的社会影响引发了广泛的学术关注。特别是在语言使用方面,学者们开始探讨社交媒体是否导致了语言的简化或退化。尽管已有大量研究探讨了社交媒体对用户行为的影响,但关于语言复杂性随时间变化的系统性研究仍然较为匮乏。

最近,一篇发表在PNAS上的研究填补了这一空白。作者分析了来自八个主要社交媒体平台 (包括Facebook、Twitter、YouTube、Reddit等) 的约3亿条英文评论,时间跨度长达34年,通过词汇量、词汇丰富度和重复性等指标,深入探讨了用户评论的语言复杂性及其随时间的变化。研究发现,尽管用户在评论中不断引入新词,但整体上评论长度、词汇丰富度和重复性都呈现出显著下降趋势

2

作者首先对用户的词汇量进行了详细分析。他们将每个用户的所有评论汇总为一个文档,计算每个用户的词汇量 (即使用的独特词汇数量) 。结果显示,大多数用户的词汇量相对较小,且随着用户活跃水平提高,词汇量有所增加。然而,尽管活跃用户使用更多的词汇,但整体上用户的词汇量仍然呈现出下降趋势。

为了进一步理解用户词汇的演变,研究还分析了用户在不同时间段内引入新词的速度。他们发现,大多数用户在评论中逐渐引入新词,词汇扩展的速度相对较慢。这一现象表明,用户在社交媒体上的语言使用并非一次性达到高峰,而是随着时间推移逐渐丰富。然而,尽管用户在不断引入新词,但整体上评论的词汇丰富度仍然在下降,这进一步支持了语言简化的趋势。

除了词汇量,作者还通过Yule’s K复杂性 (Yule’s K-complexity) 和gzip复杂性 (gzip complexity) 两个指标,分析了评论的复杂性和重复性。Yule’s K复杂性用于衡量词汇的丰富度,而gzip复杂性则用于衡量文本的重复性。结果显示,随着时间的推移,评论的词汇复杂性逐渐降低,而重复性则呈现出上升趋势。这一发现表明,社交媒体上的评论不仅在词汇上变得更加简单,而且在表达方式上也变得更加重复和模式化。

此外,作者做了回归分析以验证这些发现的稳健性,探讨了时间、社交媒体平台和评论复杂性之间的关系。结果显示,除了Twitter和YouTube外,其他平台上的评论复杂性均呈现出显著的下降趋势。这一现象进一步表明,社交媒体上的语言使用正在经历一种普遍的简化过程,而这种简化并非由特定平台驱动,而是反映了更广泛的社会语言变化趋势

3

作者在讨论中指出,社交媒体上的语言简化可能与平台的娱乐化设计有关。为了吸引用户注意力,社交媒体平台倾向于推广简单、情感化的内容,这可能导致用户在表达时倾向于使用更简单、更重复的语言。此外,社交媒体上的快速交流模式也可能促使用户使用更简洁的表达方式,以节省时间和精力。这种语言简化趋势与历史上的语言接触和混合过程相似,但在社交媒体环境下,这一过程被加速和强化。

总的来说,这项研究为我们理解社交媒体对语言使用的影响提供了重要的实证依据。这一发现不仅有助于我们理解社交媒体对语言使用的影响,还为未来的研究提供了新方向。例如,未来研究可以进一步探讨语言简化对信息传播、用户行为和社会互动的影响,以及如何通过平台设计来缓解语言简化的负面影响。

这项研究的另一个重要贡献在于其方法论上的创新。作者通过大规模数据分析,结合多种复杂性指标,系统地探讨了社交媒体上的语言变化。这种方法不仅适用于语言学研究,还可以为其他领域的学者提供借鉴。例如,未来的研究可以借鉴这种方法,探讨社交媒体上的其他语言现象,如情感表达、信息传播和用户互动等。

打开网易新闻 查看更多图片

图1. 每个用户使用的token数量的互补累积分布函数(CCDF)。

打开网易新闻 查看更多图片

图2. 每个用户使用的token类型分布的 CCDF。

打开网易新闻 查看更多图片

图3. 用户对其词汇的逐步探索所确定的曲线下面积的分布。

打开网易新闻 查看更多图片

图4. 每个数据集中平均类型数量的演变。

龚铭康| 编译


计算社会科学读书会第二季

详情请见:

1.

2.

3.

4.

5.

6.