导 语
随着社交媒体研究在体育传播与营销领域的蓬勃发展,我们也见证了其认识论复杂性的同步提升。尽管这一领域取得了显著进展,但对方法论问题及其影响的关注却相对较少。鉴于机器学习的发展,当前研究的总体目标是响应对创新方法论的需求,以推动社交媒体研究领域的知识进步。具体而言,我们:(a)从方法论的角度评估体育社交媒体研究的现状,特别关注机器学习的应用;(b)通过实证示例展示体育学者如何从自然语言处理及其衍生的主题建模技术中受益;(c)讨论机器学习如何提升社交媒体研究的严谨性并改善理论发展;(d)为未来利用机器学习的体育社交媒体研究提供潜在的机会和方向。
作者:James Du, Yoseph Z. Mamo, Carter Floyd, Niveditha Karthikeyan, and Jeffrey D. James
编译:姜本桥
International Journal of Sport Communication, 2024, 17, 97-106
https://doi.org/10.1123/ijsc.2023-0151
研究简介
随着社交媒体在体育传播和营销领域的日益普及,相关研究的深度和广度都在不断提升。社交媒体的研究融合了多学科的理论、方法和视角,包括体育传播、体育社会学和体育管理。从认识论的角度来看,社交媒体为学者提供了独特的视角,用以揭示体育的一个显著特点:粉丝与体育对象之间形成的强烈情感纽带。为实现这一目标,研究者能够分析来自用户生成内容的多样化数据来源。随着社交媒体在体育行业中的使用逐渐增多,研究的重点大多集中于技术媒介的社交网络对个体化体育消费的影响。
数字信息和技术的快速发展,使得体育组织与消费者之间的实时连接和互动变得更加紧密。这一趋势为研究领域带来了新的拐点,研究者能够轻松获取海量数据,从而重新审视和验证传统假设与既有框架。尽管近期研究已经利用机器学习(ML)处理了一些复杂任务,例如休闲参与、客户流失、消费者情感分析、品牌参与度、运动员抗议、电竞直播观看量及社交媒体互动,但将大数据、机器学习与体育管理研究深度结合,仍有巨大潜力尚未开发。
本研究旨在探索以下四个方面:(1) 从方法论角度评估当前体育社交媒体研究的现状,特别关注机器学习的应用;(2) 提供一个实证案例,展示体育研究者如何利用自然语言处理(NLP)和主题建模的最新技术;(3) 探讨机器学习如何提高体育社交媒体研究的严谨性并促进理论发展;(4) 提出未来体育社交媒体研究中使用机器学习的潜在方向和机会。
当前体育社交媒体研究现状
由于体育迷在社交媒体上生成了大量内容,相关研究主要集中在“大数据”的定量分析。“大数据”有四个核心特征:数据量(Volume)、数据多样性(Variety)、数据生成速度(Velocity)和数据真实性(Veracity)。数据量反映了社交媒体和数字工具所生成的信息规模;数据多样性则体现了结构化和非结构化数据的丰富性,包括数字、文本、音频、视频等形式;数据生成速度强调实时性,而数据真实性则聚焦于数据的隐私性、准确性和可靠性。
通过构建实证模型,大数据研究能够捕捉、可视化并分析潜在模式,从而提升理论发展的实际意义。社交媒体研究已成为体育管理领域的核心之一,研究者通过分析社交媒体上的内容,研究消费者的态度、情感和行为。例如,一些学者通过分析与特定体育事件相关的社交媒体帖子,推测消费者的情感动态。另一部分研究则使用情感分析和自然语言处理(NLP)技术,揭示文本数据中的情绪和观点,这在体育营销、消费者心理等领域展现了广阔的应用前景。
尽管体育社交媒体研究蓬勃发展,但由于数据通常是非结构化且以文本为主,这为分析带来了方法论上的挑战。为此,学者们呼吁采用新兴技术来处理这些复杂数据,以进一步推动研究的深度和广度。
实证示例:机器学习在社交媒体研究中的应用
为了展示机器学习在社交媒体文本数据分析中的应用,本研究收集了2010年至2020年间《国际体育传播期刊》(IJSC)发表的261篇与社交媒体相关的文章。我们采用了BERTopic建模来自动识别文献数据集中隐含的主题、模式和关系。
分析结果揭示了三个潜在主题,这些主题是通过传统文本分析难以察觉的定义性术语体现的。第一个主题“体育利益相关者”集中讨论了社交媒体在体育迷、运动员和体育组织等群体中的作用;第二个主题“奥运会”反映了关于社交媒体在奥运会背景下使用的研究;第三个主题“新冠疫情”则围绕一期特别刊物“体育与新冠疫情危机”所展开。此外,研究发现,在这三个主题中,定性方法(如访谈和内容分析)经常出现,与以往主要依赖定量方法的研究形成对比。
本研究的实证示例表明,社交媒体研究可以通过机器学习技术获得显著收益。作为对传统定性研究工具的有力补充,机器学习及相关分析和可视化工具可以帮助体育管理研究者以透明且创新的方式,深入理解大规模文本数据如何在不受既定假设、概念和价值观影响的情况下被清理、编码、分析和解释。这种方法为社交媒体研究开辟了新的视角,也为未来研究提供了重要的启发。
通过机器学习提升体育社交媒体研究的严谨性
机器学习为研究者提供了一种强大的工具,能够将复杂的分析任务交由算法完成,从非结构化的社交媒体数据中挖掘有意义的模式。这种能力不仅推动了基于数据的新理论发展,也为回答传统研究中难以触及的问题提供了灵活的模型支持。例如,机器学习可以帮助研究者识别反直觉的趋势和未曾察觉的关联,从而丰富理论框架。
在理论层面,社交媒体数据具有实时动态的特性,这为研究社交网络中的关系、粉丝情绪及其社会参与行为提供了前所未有的细致视角。通过机器学习的高效分析,研究者可以提炼出隐藏在这些数据中的模式,并将其转化为对体育社交媒体研究的重要洞见。例如,消费者情绪的分析不仅可以揭示不同消费者群体的特征,还可以进一步解释他们与体育对象之间的联系发展过程,这对于理论深化和实践应用都具有重要意义。
自然语言处理(NLP)是机器学习中的关键技术。它不仅能够解析文本和图像中的象征意义,还可以帮助研究者理解消费者在非文本媒介中表达的情感。例如,通过深度学习算法,研究者能将社交媒体图片中的低层次视觉特征映射为高层次的行为模式,这对体育营销和消费者态度研究至关重要。尽管机器学习技术强大,研究者在使用时必须注重模型的透明性和可解释性。一个复杂但无法解释的模型可能限制其理论贡献。可解释性不仅能增强研究的理论价值,也能确保模型在学术和实践中的可用性。
体育社交媒体研究中机器学习的未来方向
未来研究应采用更复杂的自然语言处理和词汇编码技术,以改进文本分析的上下文理解。目前大多数研究依赖通用词库,难以反映体育情境的独特性。开发适用于体育领域的专用词库,例如包含赛事术语和粉丝语言的词汇,将有助于提升研究的准确性。
在模型构建方面,未来研究需要在模型的复杂性、预测精度和可解释性之间实现平衡。尽管开发可解释模型更具挑战性,但其透明性能够提高研究的责任性。研究表明,为了可解释性而牺牲一定的复杂性并不会显著降低模型的预测能力,而是让研究者对模型的细节有更深刻的理解,从而使其对理论的发展更具价值。
研究者还应扩大机器学习的应用范围,不仅限于市场优化目标,还应利用可解释的机器学习技术,在动态语境中探索和挑战现有框架。例如,开发体育特定的自然语言处理词库,或者使用机器学习推动体育产业的多样性、包容性和公平性,这些都可以成为有效的研究方向。
作者:姜本桥印第安纳大学 博士