引用本文
  • 高伟锋,刘连芳.基于分词和基于N-Gram的网页分类系统比较研究[J].广西科学院学报,2005,(S1):58-60.    [点击复制]
  • Gao Weifeng,Liu Lianfang.A Comparative Study of Word-Segment and N-Gram Categorization System[J].Journal of Guangxi Academy of Sciences,2005,(S1):58-60.   [点击复制]
【打印本页】 【在线阅读全文】【下载PDF全文】 查看/发表评论下载PDF阅读器关闭

←前一篇|后一篇→

过刊浏览    高级检索

本文已被:浏览 271次   下载 172 本文二维码信息
码上扫一扫!
基于分词和基于N-Gram的网页分类系统比较研究
高伟锋, 刘连芳
0
(南宁市平方软件新技术有限责任公司, 广西南宁 530003)
摘要:
设计并实现一个网页分类系统,采用相同的特征权值计算方法,特征选择算法以及分类算法,进行基于分词的网页分类系统和基于N-Gram的网页分类系统的对比实验,分析两者的分类效果。结果表明,基于N-Gram的网页分类系统能达到并在一定程度上高于基于分词的网页分类系统的效果。
关键词:  中文网页  分类  N-Gram  分词  KNN
DOI:
投稿时间:2005-09-07
基金项目:
A Comparative Study of Word-Segment and N-Gram Categorization System
Gao Weifeng, Liu Lianfang
(Nanning Pingsoft New Technology Co. Ltd., Nanning, Guangxi, 530003, China)
Abstract:
This page designs a Chinese web categorization system,with the same feature weight,feature selection and categorizing algorithm,based on Word-Segment categorization system and N-Gram categorization system.The experiment demonstrates that being based on N-Gram categorization system has the same effect as being based on Word-Segment categorization system,which is more effective in some aspects.
Key words:  chinese web  categorization  N-Gram  word-segment  KNN

用微信扫一扫

用微信扫一扫