Keyword Extraction for Text Characterization

本文档由 霺ǚ♀輕寒 分享于2010-10-15 18:44

Keywords are valuable means for characterizing texts. In order to extract keywords we propose an efficient and robust, language- and domainindependent approach which is based on small word parts (quadgrams). The basic algorithm can be improved by re-examining and re-ranking keywords using edit distance (i.e. Levenshtein distance) and an algorithm ..
文档格式:
.pdf
文档大小:
81.65K
文档页数:
7
顶 /踩数:
0 0
收藏人数:
0
评论次数:
0
文档热度:
文档分类:
IT计算机  —  开发文档
添加到豆单
文档标签:
Keyword Extraction
系统标签:
text keyword extraction characterization quadgram texts
下载文档
收藏
打印

扫扫二维码,随身浏览文档

手机或平板扫扫即可继续访问

推荐豆丁书房APP  

获取二维码

分享文档

将文档分享至:
分享完整地址
文档地址: 复制
粘贴到BBS或博客
flash地址: 复制

支持嵌入FLASH地址的网站使用

html代码: 复制

默认尺寸450px*300px480px*400px650px*490px

支持嵌入HTML代码的网站使用

分享到