java实现 “分词(已经标注好词性)与情感词典比较(都存为txt文件)并返回相同词的个数。”

其实就是文本内容的比较 涉及io和字符流相关内容,说说具体实现 有源程序更好!
涉及数据挖掘,内容是经过分词处理的被标注好的词语。文本内容:“穿/v 起来/vf 很/d 舒服/a ,/wd 赞/un 一/m 个/q 。/wj 没有/v 什么/ry 不足/v”
情感词典里面的内容就是:“舒服”,“赞”等能表达情感的词语,我想找出相同的词语 记录个数。

第1个回答  2012-05-09
可以用equal()方法来实现啊追问

equal不是针对数值的方法吗?

追答

在系统中会转换成二进制的

第2个回答  2012-05-09
这样试试看行不行:
找出个数:词性为/m的个数:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test{
public static void main(String []args){
s=“穿/v 起来/vf 很/d 舒服/a ,/wd 赞/un 一/m 个/q 。/wj 没有/v 什么/ry 不足/v”;
Matcher m=Pattern.compile(“/m”).matcher(s);
int pos=0;
int count=0;
while(m.find(pos)){
pos=m.start()+1;
count++;
}
System.out.println(count);
}
}
方法二:找到个数,通过一些操作把找到词存起来
public class Test{
public static void main(String[] args) {
String str="穿/v 起来/vf 很/d 舒服/a ,/wd 赞/un 一/m 个/q 。/wj 没有/v 什么/ry 不足/v";

ArrayList<String>list=new ArrayList<String>();
int count=0;
String s="/w";
while(true){
int index=str.indexOf(s);
if(index!=-1){
if(index==str.indexOf("/wd"));
else
count++;
str=str.substring(index+1, str.length());
//可以通过字符串的一些操作得到当前找的词,然后存入Arrayslist中。如果需要此操作你先试试,不行我再试试 }
if(index==-1)
break;
}
System.out.println(count);
}
}
}
第3个回答  2012-05-09
发的撒范德萨
第4个回答  2012-05-09
txt内容,是什么,具体要求是什么..不是很清楚.追问

如问题补充,就是找出类似于上下两句中相同的词就是2个 分别是 赞 舒服 两个词,都是这样的文本

相似回答