首页>本期目录
当期目录
2024年第9期, 刊出日期:2024-09-05
  
AI数据体系建设专题
面向主题场景的科技文献AI数据体系建设:技术框架研究与实践 | Open Access
常志军, 钱力, 吴垚葶, 曲云鹏, 巩玥, 张智雄

[目的/意义] 人工智能赋能科学研究已成为推动科学发现的重要驱动力。面向主题场景的高质量数据资源是训练高性能AI模型的关键,鉴于科技文献数据的复杂性及其直接用于大模型训练的局限性,亟须构建一套系统化的数据建设技术框架,通过对科技文献资源进行一系列的加工、提炼和整合,最终构建面向AI应用的高质量训练语料。 [方法/过程] 本研究提出了科技文献AI数据体系建设的“3+5 技术框架”,围绕AI数据体系建设全流程,提炼设计了3个层次的数据内容,以及5个阶段的数据治理过程,基于大数据技术、智能挖掘技术作为数据治理的关键要素,详细阐述了数据治理工具链的体系架构与功能。 [结果/结论] 为验证所提出的技术框架的有效性,本研究将其应用于水稻育种领域的AI数据体系构建实践中。结果表明,该框架能够有效地处理科技文献数据,构建出了高质量的领域数据集,为AI模型在水稻育种研究中的应用提供了数据支撑,验证了该技术框架的有效性和实用性。

2024, 36 (9): 4-17 | 摘要 ( 38 ) | HTML |   PDF (1847KB) ( 24 )  
doi:10.13998/j.cnki.issn1002-1248.24-0755
AI+专家驱动的科技文献信息资源消费端数据体系建设研究 | Open Access
叶光辉, 涂凯, 胡丽娜, 韩丽, 冯智敏

[目的/意义] 受限于传统文献分类体系局限,用户产生的高价值消费端标注数据还不能作为数据要素融入科技文献服务,致使科技文献服务无法顺应开放科学时代背景与满足用户读者各类知识需求。本研究旨在挖掘AI提供技术突破潜力,构建AI+专家驱动的科技文献信息资源消费端数据体系,以期推动科技文献服务优化进程。 [方法/过程] 首先分析了科技文献信息资源消费端数据体系建设价值表征,然后提出了科技文献信息资源消费端数据体系建设原则,再者解构与剖析了AI介入科技文献信息资源消费端数据体系建设风险。最后,根据AI介入数据标注工作的程度,设计了3种AI+专家协同用户科技文献信息资源数据标注创新模式。 [结果/结论] 聚焦于引领用户协同完成数据标注工作,AI+专家辅助型数据标注模式下,AI充当工具角色根据专家制定处理规则完成表层信息处理,协助用户完成数据标注;AI+专家合作型数据标注模式下,AI完成科技文献预标注标签审查工作,用户从自生成标签模式转变为评判与挑选AI生成的数据标签模式,专家辅助审核最终数据标签质量;AI+专家主导型数据标注模式下,用户提供数据标注需求,专家进行过程操作指导,数据标注由AI4S平台自动化完成。

2024, 36 (9): 18-31 | 摘要 ( 39 ) | HTML |   PDF (768KB) ( 13 )  
doi:10.13998/j.cnki.issn1002-1248.24-0640
高质量AI数据体系面临的数据版权困境、应对策略解析与实施路径研究 | Open Access
张何灿, 易成岐, 郭鹏, 黄倩倩, 靳晓锟

[目的/意义] 党的二十届三中全会决定明确提出,完善推动人工智能等战略性产业发展政策和治理体系。近年来,全球人工智能版权数据诉讼纷争频发,人工智能训练数据版权保护困境成为构建高质量AI数据体系面临的关键堵点和现实难题。 [方法/过程] 本研究在研究梳理人工智能数据版权保护相关学术研究和产业实践的基础上,系统性总结了应对数据版权困境的六大代表性做法,对比解析了不同做法的优缺点和适用性。 [结果/结论] 针对人工智能数据版权困境,即暂无既能促进人工智能版权数据供给又能兼顾数据版权保护工作的最优解问题,本研究在充分参考六大代表性做法解析和结合中国具备的四大独特优势基础上,研究提出系统妥善解决数据版权困境筑牢高质量AI数据体系的总体实施路径构想,分别为打造国家级人工智能数据版权一体化综合服务平台,探索推进适应人工智能发展的数据版权综合改革试点,建立完善人工智能数据版权相关立法并推动行业自律,以期对加大中国人工智能版权数据供给、制定相关政策和推动工作提供有益参考。

2024, 36 (9): 32-43 | 摘要 ( 121 ) | HTML |   PDF (980KB) ( 119 )  
doi:10.13998/j.cnki.issn1002-1248.24-0475
综述文章
生成式人工智能在图书馆信息素养教育中的机遇、挑战与发展方向——一项范围综述 | Open Access
袁帆, 李佳

[目的/意义] 生成式人工智能技术的快速发展为图书馆信息素养教育带来了新的变革与机遇,引发学界广泛关注。研究聚焦GenAI在图书馆信息素养教育中的创新应用及其挑战,不仅关注技术应用层面,更着重探讨GenAI对信息素养教育范式转型的深层影响,为推动人工智能背景下图书馆信息素养教育转型与创新发展提供理论依据。 [方法/过程] 基于范围综述方法,从SSCI、A&HCI和CSSCI数据库筛选出51篇核心文献,采用PRISMA-ScR框架进行系统分析。通过多维度梳理文献,辨析GenAI在信息素养教育中的应用场景、挑战及其对学习者的影响,并提出相应的应对策略。 [结果/结论] 研究发现,GenAI在提供个性化学习体验和提升数字化教学效果方面具有显著优势,但同时也面临数据准确性、偏见问题、学术不端、虚假信息传播以及过度依赖GenAI可能削弱独立和批判性思维能力等关键挑战。针对这些问题,研究提出了GenAI在信息素养教育情境中的应对策略。人工智能时代的信息素养教育研究应着力于构建系统化、规范化的教育框架,推动AI技术与教育实践的深度融合。

2024, 36 (9): 44-57 | 摘要 ( 36 ) | HTML |   PDF (794KB) ( 11 )  
doi:10.13998/j.cnki.issn1002-1248.24-0614
研究论文
基于MOA模型的公共图书馆信息素养教育读者知识建构研究 | Open Access
何慧敏

[目的/意义] 在构筑美好数字生活新图景的规划目标下,研究公共图书馆信息素养教育中读者知识建构行为不仅有助于读者提升个体信息素养和自主学习能力,还有助于推动全民信息素养体系发展。 [方法/过程] 以MOA模型为基础,从多维动态视角剖析公共图书馆信息素养教育中读者知识建构动机因素、机会因素、能力因素,以及知识建构共同体的构成要素及要素间的交互关系。 [结果/结论] MOA模型下的读者知识建构是一个动态的、多阶段的过程,读者通过动机激发、机会利用、能力提升、知识建构和反馈评估5个阶段,逐步推动读者对知识的理解及应用。未来发展路径需要建立协调机制,促进可持续性;加强资源整合,提升知识资源库的丰富性;开展多样化教育形式,提升科学性;构建全流程性的评估体系。

2024, 36 (9): 58-69 | 摘要 ( 39 ) | HTML |   PDF (846KB) ( 27 )  
doi:10.13998/j.cnki.issn1002-1248.24-0648
AIGC驱动下研究生数字素养教育提升路径探索 | Open Access
罗学妹, 林予哲

[目的/意义] 探索人工智能生成内容(简称AIGC)驱动下研究生数字素养教育的有效路径,以提升研究生在数智时代的综合素养,满足社会对创新型人才的需求。 [方法/过程] 在文献调研基础上,分析AIGC技术发展应用带来知识体系扩展、技能要求提升,教育环境改变。探讨AIGC驱动下研究生数字素养教育边界已拓展,为顺应AIGC技术对研究生数字素养教育带来变革提出系列提升路径。 [结果/结论] AIGC加速教育与智能的融合,研究生数字素养教育需以培养研究生驾驭智能技术能力、跨学科融合能力、创新实践能力、批判性思维、数字伦理为着力点。采取创新教学模式,优化数字素养课程内容,构建跨学科整合机制,建立监管机制,重视引导学功能和完善评价机制等变革路径,以促进研究生的综合素养提升。

2024, 36 (9): 70-77 | 摘要 ( 40 ) | HTML |   PDF (554KB) ( 28 )  
doi:10.13998/j.cnki.issn1002-1248.24-0596
MR技术视域下智慧图书馆的应用模型与创新进路 | Open Access
黄嘉欣, 张晓芳

[目的/意义] 新一代MR技术突破了全球对数字现实交互的传统认识,也为智慧图书馆带来技术革新的发展契机。探讨MR视域下新的应用场景有助于拓展对智慧图书馆的研究深度与领域广度。 [方法/过程] 采用文献综述、内容分析与网站分析等方法,梳理图书馆领域MR技术应用的初步实践探索,结合MR技术的高真实感、全方位性、更智能化等特征,可进一步深化智慧图书馆服务、知识、体验、协作等四要素的能力,以此构建MR技术视域下智慧图书馆的新应用模型。 [结果/结论] 在虚拟现实迅速革新的浪潮中,智慧图书馆建设应从问题导向、理论支撑、人才管理、主体共创4个维度展开思考,利用MR技术聚焦智慧图书馆的4个“面向”,以期构建智慧图书馆与MR技术融会贯通的未来生态图景,更好地为智慧图书馆添加活力、挖掘潜力、赋予能力。

2024, 36 (9): 78-88 | 摘要 ( 27 ) | HTML |   PDF (750KB) ( 15 )  
doi:10.13998/j.cnki.issn1002-1248.23-0492
应用实践
数字人文与大语言模型:古文献语义检索实践与探索 | Open Access
王昊贤, 周子茗, 丁菲菲, 韦成府

[目的/意义] 在人工智能技术,尤其是大语言模型持续升温的背景下,本文旨在探讨其在数字人文领域的应用,特别是古文献检索。研究不仅为数字人文带来新视角和方法,促进学术研究和文化传承,还为其他院校图书馆提供了实践参考,具有指导意义。 [方法/过程] 本文分析了数字人文与大语言模型在古文献检索中的创新应用和趋势,并讨论了大模型在古文献识别、语义理解和信息抽取等方面的潜力和优势,推动了古文献检索的变革。通过案例分析,构建了语义检索模型,并展示了大语言模型在元数据扩展、快速检索和个性化推荐等方面的应用,建立了古文献语义检索平台。 [结果/结论] 研究的主要优势和贡献在于规范化的元数据组织、大模型支持的元数据扩展、自然语言化的检索词支持、容错的检索机制、向量引擎高效检索等。但也存在不足,如大模型生成结果的准确性问题和对用户检索数据的全面分析不足。未来,将致力于改进这些问题,以提高研究效果。

2024, 36 (9): 89-101 | 摘要 ( 26 ) | HTML |   PDF (971KB) ( 24 )  
doi:10.13998/j.cnki.issn1002-1248.24-0615
专家视点
强化数据目录体系研究 | Open Access
曾建勋
作为一种信息整理和结构化工具,目录在不同领域都有着重要的作用。书籍目录按照著作结构层次排列,直观反映整本书的内容架构,方便读者快速定位到感兴趣的章节或内容;网站目录能直观地展示网站各板块内容,方便用户快速定位到所需信息,提升用户体验,减少用户搜索时间,增加网站活跃度;数据目录是实现数据资产统一管理的工具,对所有数据、数据产品和数据服务进行分级、分类、分层、分权限整编,提供一种结构化和可管理的方式来组织和访问数据。以书目为研究对象的目录学,正在数字环境下拓展各类信息资源目录研究,以期形成数字目录学,更需要考虑适应数据要素环境发展,强化数据目录体系研究,进而丰富目录学体系。
2024, 36 (9): 102-103 | 摘要 ( 24 ) | HTML |   PDF (345KB) ( 8 )