摘要: 2024年4月1日全国数据工作会议提出开展数据标注基地试点,从技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等6个方面探索建设国家级数据标注基地,并发布了承担数据标注基地建设任务的城市名单,预示着数据标注工作将在数据资源汇聚、数据质量提升、数据要素价值盘活中发挥重要作用。长期以来,文献情报领域利用元数据、分类法、主题词表、名称规范档等进行主题、分类和命名实体的著录、编目、标引和识别,以提升信息检索、知识发现、主题聚类和情报分析的性能和效率。作为数据管理的核心能力,文献情报领域也需要借国家建设数据标注基地契机,大力推进知识组织方法与认知计算模式的结合,将知识组织体系融入大模型语料训练环节,嵌入文献加工与情报分析流程,识别文本、图像、视频等数据中的“重点”“笔记”、情感色彩和使用场景,进行分类、注释、标记等多种形式的数据标识,并对标注数据进行审核、校对、统计和管理,提升文献情报数智加工水平和高端服务能力。
中图分类号:
曾建勋. 建设文献情报领域的数据标注基地[J]. 农业图书情报学报, 2024, 36(4): 102-103.