
摘要: 2024 年12 月26 日,国家发展改革委、国家数据局、财政部及人力资源社会保障部联合发布《关于促进数据标注产业高质量发展的实施意见》明确提出,到2027 年,数据标注产业的专业化、智能化及科技创新能力将显著提升,产业规模大幅跃升,年均复合增长率超过20%。将培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创新载体,建设一批成效明显、特色鲜明的数据标注基地。数据标注是指对原始数据进行筛选、清洗、分类、标记、注释、质检等专业化数据治理活动,无论是文本、图像、语音还是视频,只有经标注后,才能从杂乱无章的信息转变为有序且有价值的数据资源,转化为可供人工智能模型训练的“燃料”。作为连接原始数据与智能算法的桥梁,数据标注产业成为建设高质量数据集的关键,是数据要素化的重要环节,数据标注质量直接决定大模型的性能和应用效果。然而,数据标注并不是一件新鲜事物,情报学作为研究文献信息表示、获取、处理、传递和利用方法和规律的学科,一直专注于探索信息组织、信息标引、主题分类、实体识别、信息生成和信息分析等,在人工智能快速应用于各行各业,数据标注作为一种新兴产业爆发式增长的态势下,情报学更应为国家数据标注产业发展提供理论、方法、技术、模型、工具和人才支撑,从文献信息扩展至大数据领域,提升数据管理整体核心能力,发挥我国海量数据规模和应用场景优势,释放数据要素价值,彰显情报学在数智时代新的生命力。
中图分类号:
曾建勋. 支撑数据标注产业发展[J]. 农业图书情报学报, 2025, 37(1): 100-101.