来源:高校人工智能与大数据创新联盟

打开网易新闻 查看更多图片

2025年4月9日至11日,中国电子首席科学家蒋国飞出席第十三届中国电子信息博览会(简称“电博会”)并发表主题演讲,他系统阐述了数据如何驱动人工智能发展,强调在算力与模型能力逐步拉平的竞争格局下,高质量数据集已成为AI发展的核心驱动力,而数据基础设施建设与数据处理技术创新是破解行业应用落地瓶颈的关键路径。

打开网易新闻 查看更多图片

分析认为,蒋国飞提出高质量数据集已成为人工智能发展的核心驱动力,这一观点反映了当前AI技术发展的关键需求和趋势。以下是这一主张的核心逻辑和背景分析:

一、高质量数据是AI模型的“燃料”

(一)基础性作用:AI模型(尤其是深度学习)的性能高度依赖训练数据的质量。数据质量包括多样性、准确性、标注精度和覆盖范围,直接决定了模型的学习上限。

(二)“垃圾进,垃圾出”原则:即使算法先进,低质量数据(如噪声大、偏差明显、标注错误)会导致模型失效或产生误导性结果。例如,医疗影像AI若使用标注错误的病例数据,可能误诊。

二、当前AI发展的瓶颈正在向数据端转移

(一)算力与算法趋于成熟:随着芯片技术(如GPU/TPU)和算法框架(如Transformer)的进步,算力与算法的瓶颈逐渐缓解,但数据质量不足成为新的制约因素。

(二)大模型时代的隐忧:大规模预训练模型(如GPT-4)需要海量数据,但互联网数据的低信噪比(含错误、偏见或虚假信息)可能放大模型缺陷,需通过高质量数据优化。

三、行业应用对数据质量提出更高要求

(一)垂直领域需求:在工业、医疗、金融等领域,AI落地需要高度专业化、场景化的数据。例如:自动驾驶需要精准标注的道路场景数据;医疗AI依赖合规、多模态的医学影像和病例数据。

(二)合规与伦理挑战:高质量数据需符合隐私保护(如GDPR)、伦理规范(如无偏见)和行业标准,这对数据采集、标注和治理提出了更高要求。

四、数据质量驱动技术创新的“飞轮效应”

(一)高质量数据促进算法迭代:例如,ImageNet数据集推动了计算机视觉的突破,但其成功离不开数据集的严格标注和多样性。

(二)反哺数据生态建设:AI技术(如自动标注、数据增强)可提升数据生产效率,形成“数据优化→模型改进→数据再优化”的正向循环。

五、中国AI发展的特殊背景

(一)数据规模优势与质量短板:中国拥有庞大的人口和应用场景,数据量丰富,但数据孤岛、标注标准不统一、隐私保护不足等问题制约了数据价值释放。

(二)国家战略需求:在“十四五”规划中,中国将AI作为核心技术攻关方向,高质量数据基础设施是支撑AI产业化落地的关键。蒋国飞的观点可能与此背景下的技术布局相关。

因此,蒋国飞强调高质量数据集的核心地位,实质上是指出AI发展已进入“数据驱动精细化”阶段。未来的竞争不仅是算法和算力的比拼,更是数据治理能力的竞争,包括:构建跨行业、多模态的数据共享平台;推动数据标注的标准化和自动化;解决数据安全、隐私与开放的平衡问题。蒋国飞这一提法与中国电子(CEC)在数字经济基础设施领域的战略方向一致,旨在通过高质量数据生态建设,推动AI从实验室研究向产业实际价值转化。

蒋国飞,男,毕业于北京理工大学,先后获得本科和博士学位,在美国达特茅斯学院完成博士后研究。 2004年6月,蒋国飞加入NEC美国研究院,历任高级研究员、部门主管及副总裁。2017年,蒋国飞加入蚂蚁集团,曾任蚂蚁集团副总裁、蚂蚁数科总裁。 2024年7月,蒋国飞加入中国电子信息产业集团,负责推动落实国家数据要素和人工智能战略。

全国高校人工智能与大数据创新联盟

全国高校人工智能与大数据创新联盟(简称:高校联盟)是由清华大学、浙江大学、中南大学、东北大学、上海工程技术大学、重庆邮电大学、东北林业大学、佛山科学技术学院、曲阜师范大学、黑龙江大学、海豚大数据科技等全国54家高校、企业共同发起,于2018年5月26日在北京中国科技会堂正式成立。迄今为止,联盟发展会员300多家, 覆盖全国20多个省市。联盟由一批积极投身于“人工智能、大数据、区块链”教育事业的高校、科研机构、企事业单位和个人自愿组成的公益性、全国性学术交流服务平台。中国工程院原常务副院长、中国工程院院士潘云鹤、中国科学院院士陈国良、中国工程院院士李伯虎担任联盟名誉理事长,中国工程院院士谭建荣担任联盟理事长。联盟工作接受工信部、国家网信办等政府部门行政管理和业务指导。联盟主要工作是推进产教融合、校企合作、协同育人。(加盟微信13651193492)

华算人工智能研究院

华算人工智能研究院全称是“山西省华算人工智能研究院有限公司”,是经山西转型综合改革示范区管理委员会批准,于2023年10月在太原成立的第一批专业研究人工智能、赋能数字经济产业发展的独立法人组织。华算人工智能研究院依托全国高校人工智能与大数据创新联盟专家委员会及理事会资源,按照山西省委省政府、山西转型综合改革示范区管理委员会发展人工智能、数字经济的系列文件精神和工作计划,将研究院打造成为山西省发展人工智能、数字经济的示范应用推广平台,同时面向全国开展人工智能业务。华算人工智能研究院名誉院长由中国工程院院士李伯虎担任。研究院内设AI产业学院共建中心、实训实习就业中心、实验室建设中心、专家智库等6个职能部门。欢迎加入华算人工智能研究院专家智库,共同赋能高校AI人才培养及产教融合事业发展。

高校区块链专委会

全国高校人工智能与大数据创新联盟区块链专委会(简称:高校区块链专委会),是由北京大学、浙江大学、武汉大学、西南财经大学、北京交通大学、郑州大学、贵州大学、桂林电子科技大学、山西农业大学、佛山科学技术学院、陕西师范大学、中国网安、海豚大数据科技等全国40多家高校、企业和机构共同发起,于2019年12月7日在广东省佛山市正式成立。目前发展高校及企业会员70多家。中国工程院院士、浙江大学教授陈纯担任高校区块链专委会名誉顾问;福州大学教授蔡维德、中国计算机学会区块链专委会主任斯雪明教授、中国人民银行数字货币研究所副所长狄刚担任高校区块链专委会名誉主任;北京大学信息科学技术学院区块链中心主任陈钟教授担任高校区块链专委会主任。高校区块链专委会主要工作是促进高校区块链教育,为高校区块链专业建设及学科发展提供专家咨询服务。

高校元宇宙专委会

全国高校人工智能与大数据创新联盟元宇宙专业委员会(简称:高校元宇宙专委会),是由清华大学、湖南大学、浙江大学、四川大学、汕头大学、河北金融学院、保定市元宇宙协会、英伟达中国、海尔衣联网研究院、海豚大数据科技(天津)有限公司等全国20多所高校、企业和机构共同发起,于2022年11月5日在北京正式成立。中国工程院院士、计算机软件与虚拟现实领域专家赵沁平担任高校元宇宙专委会名誉顾问;中国工程院院士、北京航空航天大学电气与自动化学院名誉院长、中国航天科工集团有限公司科技委高级顾问李伯虎担任高校元宇宙专委会名誉主任;清华大学信息国研中心可信软件和大数据部常务副主任邢春晓担任高校元宇宙专委会主任委员。目前已发展高校及企业会员30多家。高校元宇宙专委会主要工作是促进高校元宇宙教育、加强校企合作、推动元宇宙专业建设及学科发展,为元宇宙教育教学提供专家咨询服务。

高校数字经济专委会

全国高校人工智能与大数据创新联盟数字经济专业委员会(简称:高校数字经济专委会),是由华算人工智能研究院、清华大学、北京大学、中国人民大学、中国社会科学院信息化研究中心、四川大学、北京外国语大学、北京科技大学、北京工业大学、北京语言大学、北京化工大学、北京联合大学、北京物资学院、北京印刷学院、西藏民族大学、河北金融学院、重庆财经学院、苏州城市学院、北京中关村软件园、百度、海豚大数据科技等全国60多家高校、企业和机构共同发起,于2024年1月12日在北京正式成立。清华大学经济管理学院教授姜旭平、北京大学信息管理系教授赖茂生、中国社会科学院信息化研究中心主任姜奇平、中国科学院大学经济与管理学院教授吕本富担任高校数字经济专委会主任委员。高校数字经济专委会主要工作是促进高校数字经济专业建设及学科发展,推动产学研合作,为高校数字经济专业教育教学提供专家咨询服务。

联盟“资料图书馆”

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

微信咨询

说明:转载文章和图片均来自公开网络,推送文章除非无法确认,都会注明作者和来源,如有侵权请联系删除。

往期精彩文章(单击就可查看):

. 办

. 》