农业图书情报学刊 ›› 2014, Vol. 26 ›› Issue (7): 33-35.doi: 10.13998/j.cnki.issn1002-1248.2014.7.008

• 网络技术 • 上一篇    下一篇

数字图书馆文本分类特征提取方法研究与改进

鲍凌云   

  1. 菏泽学院图书馆, 山东 菏泽 274015
  • 收稿日期:2014-01-23 出版日期:2014-07-05 发布日期:2014-07-11
  • 作者简介:鲍凌云, 菏泽学院图书馆助理馆员, 硕士, 研究方向: 信息资源管理与科技创新。
  • 基金资助:
    菏泽学院人文社会科学研究项目“社交网络SNS在高校图书馆服务中的应用研究”(项目编号:XY12SK07)

Research and Improvement of Feature Selection for Page Categorization in Digital Library

BAO Ling-yun   

  1. Library, Heze College, Heze 274015, China
  • Received:2014-01-23 Online:2014-07-05 Published:2014-07-11

摘要: 从数字图书馆应用文本分类的重要性入手, 介绍了文本分类的含义及基本技术, 重点分析了文本分类中常用的两种特征提取方法:互信息算法和 统计量算法, 指出两种算法存在的不足并提出相应的改进措施。

关键词: 文本分类, 特征提取, 互信息算法, 统计量算法

Abstract: Firstly this paper analyzed the importance of applying page categorization in digital library, then it introduced the connation and basic technologies of page categorization. Also the author studied two main feature selection methods specially: Mutual Information algorithm and Chi-square algorithm. Meanwhile, the paper pointed the current weaknesses of the two feature selection methods and put forward corresponding improving measures.

Key words: Page categorization

中图分类号: 

  • G250

引用本文

鲍凌云. 数字图书馆文本分类特征提取方法研究与改进[J]. 农业图书情报学刊, 2014, 26(7): 33-35.

BAO Ling-yun. Research and Improvement of Feature Selection for Page Categorization in Digital Library[J]. , 2014, 26(7): 33-35.