Document
检索banner
高级检索 在检索结果中检索
全部字段 题名 作者 关键词 摘要

基于类内频率的文本分类特征选择方法

  • 【获取途径】 超星期刊网
  • 【作者】崔彩霞,王素格
  • 【刊名】计算机工程与设计
  • 【作者单位】太原师范学院计算机系  山西太原;山西大学数学科学学院  山西太原
  • 【年份】2007
  • 【卷号】第28卷
  • 【期号】 第17期
  • 【页码】4249-4251,4265
  • 【ISSN】1000-7024
  • 【关键词】文本分类 特征选择 文档频率 信息增益 互信息 
  • 【摘要】 随着计算机技术和WWW的飞速发展,文本分类已经成为信息检索的关键技术之一,而特征选择对分类效果起着至关重要的作用.对文本分类的4种常用特征选择方法进行了介绍和分析,提出了一种基于类内频率的特征选择方法.选用kNN法和支持向量机作为分类器,利用以上5种文本特征选择方法在平衡语料和非平衡语料上进行了测试.实验结果表明,该方法能够有效选出真正对分类有意义的特征,分类效果较好,尤其适合支持向量机分类器.
  • 【基金】山西省青年科技研究基金
  • 【文献类型】 期刊
进入发现系统查看更多信息

发文期刊《基于类内频率的文本分类特征选择方法》历年引证文献趋势图

引证的期刊论文等列表

共16条记录 1/2 第一页 [1] [2] 下一页 最后一页 到第
页脚