近日,在中国新闻技术工作者联合会2024年学术年会上,由新华社技术局、媒体融合生产技术与系统国家重点实验室、上海算法创新研究院等30余家科研单位、传媒机构、科技企业共同起草的《新闻行业大规模预训练模型》系列团体标准正式发布。视觉中国参与编制了其中《语言模型安全性要求》《多模态要求》两项重要的团体标准,展现了公司在AI技术安全性和多模态交互领域的专业实力和行业影响力。

打开网易新闻 查看更多图片

新闻行业大模型预训练模型系列标准

图片来源: 新华社

《新闻行业大规模预训练模型》系列标准由五部分组成,从语言模型实用性要求、评测要求、安全性要求、研发数据要求和多模态要求等角度出发,为新闻行业大规模预训练模型构建出一个全面而系统的框架。

1.《语言模型实用性要求》明确了预训练语言模型在完成新闻任务时的使用场景要求、效果要求以及产品化要求,为模型的实际应用提供了具体指导。

2.《语言模型评测要求》规定了新闻行业预训练语言模型的评测指标和评测方法,并给出了具体的评测示例,以确保评测过程的科学性和规范性。

3.《语言模型安全性要求》详细规定了各环节所涉及的安全性要求,确保新闻领域预训练模型应用,能够遵守相关法律法规。

4.《研发数据要求》对用于训练、微调和评估预训练模型的所有数据提出了技术要求,确保了在预训练模型研发过程中,数据的质量和规范性,从而确保模型的可靠性,提升模型性能。

《多模态要求》规定了预训练模型在处理多模态数据时的技术标准,进一步拓展了预训练模型应用范围,使其在多模态新闻内容生成和处理方面也能高效、可靠地发挥作用。

此次新闻行业首个大模型全系列标准的发布,不仅规范了预训练模型在新闻场景的使用,而且为新闻行业研发和应用生成式人工智能技术提供了坚实基础和有力保障,有效推动新闻行业智能化进程,助力培育媒体新质生产力。

在人工智能技术迅猛发展的今天,确保技术的安全性和多模态交互的高效性已成为行业发展的关键。作为全球领先的视觉内容数字版权交易和服务平台,视觉中国始终站在行业发展的前沿,积极参与了全国中文新闻信息标准化技术委员会框架下的国家标准制定和修订工作,包括《中文新闻图片内容描述元数据规范》《中文新闻信息内容》《中文新闻信息分类与代码》等核心技术规范,为建立统一、规范的中文新闻信息处理标准体系贡献专业力量。

作为中国新闻技术工作者联合会会员单位,视觉中国专家团队还深度参与了《中文新闻人物信息标注规范》等前沿技术领域的标准制定,助力新闻行业数字化转型和技术升级。视觉中国将继续积极参与各级标准化组织,不断完善技术创新体系,为新闻传媒行业的标准化建设和高质量发展贡献智慧和力量。