当前位置:首页 » 翻译 
  • 匿名
关注:1 2013-05-23 12:21

求翻译:文本处理的目的是过滤噪声,抽取出最能代表文本主题的词作为文本特征。过滤微博文本噪声可分为三个基本步骤:首先,对文本进行分词、词性标注和词性过滤,本文方法利用中国科学院计算技术研究所研制的汉语词法分析系统ICTCLAS对话题文本进行分词和词性标注,在词性标注以后,将相同或相似词性的邻近词进行合并。考虑到名词对于文本主题的表达能力比其他词性强,所以只抽取其中的名词作为主题特征词;其次,将明星类的微博去除,因为社会类的微博更容易成为热点话题,并且不管是对于政府还是个人都更倾向于对社会类热点话题的发现;最后,对评论文本进行过滤,将评论内容与话题内容进行相似度计算。是什么意思?

待解决 悬赏分:1 - 离问题结束还有
文本处理的目的是过滤噪声,抽取出最能代表文本主题的词作为文本特征。过滤微博文本噪声可分为三个基本步骤:首先,对文本进行分词、词性标注和词性过滤,本文方法利用中国科学院计算技术研究所研制的汉语词法分析系统ICTCLAS对话题文本进行分词和词性标注,在词性标注以后,将相同或相似词性的邻近词进行合并。考虑到名词对于文本主题的表达能力比其他词性强,所以只抽取其中的名词作为主题特征词;其次,将明星类的微博去除,因为社会类的微博更容易成为热点话题,并且不管是对于政府还是个人都更倾向于对社会类热点话题的发现;最后,对评论文本进行过滤,将评论内容与话题内容进行相似度计算。
问题补充:

  • 匿名
2013-05-23 12:21:38
The purpose of the text dealing with noise filter , extract the word that best represents the theme of the text as text features.
  • 匿名
2013-05-23 12:23:18
正在翻译,请等待...
  • 匿名
2013-05-23 12:24:58
The text processing goal filters the noise, extracts most can take the text characteristic on behalf of the text subject word.Filters the micro abundant text noise to be possible to divide into three basic steps: First, carries on the participle, the part-of-speech tagging and the lexical category f
  • 匿名
2013-05-23 12:26:38
Text processing is designed to filter noise, extract the most representative text topic Word as text feature. Filtering Twitter noise in text can be divided into three basic steps: first of all, text segmentation, part of speech tagging and filtering methods using Chinese lexical analysis system dev
  • 匿名
2013-05-23 12:28:18
正在翻译,请等待...
 
 
网站首页

湖北省互联网违法和不良信息举报平台 | 网上有害信息举报专区 | 电信诈骗举报专区 | 涉历史虚无主义有害信息举报专区 | 涉企侵权举报专区

 
关 闭