摘要: 介绍了LSI潜在语义索引在信息检索领域的运用。阐述了词项加权的3种方法,分析了矩阵的奇异值分解SVD在提取矩阵重要信息方面的作用,展示了对词项—文档矩阵的降秩近似是如何模拟人类理解语义的过程;比较了向量空间模型与LSI在搜索算法上的异同,通过对词项—文档矩阵进行文本挖掘的例子,指出了LSI在分析文档间内在联系所起到的作用。
中图分类号:
蔡豪源. LSI文本挖掘技术剖析[J]. 农业图书情报学刊, 2016, 28(7): 5-9.
CAI Hao-yuan. Analysis of the Latent Semantic Indexing text Mining Method[J]. , 2016, 28(7): 5-9.