package com;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
/**
* 余弦匹配算法
*
*/
public class SimilarDegreeByCos {
/**
* 计算两个字符串的相似度,简单的余弦计算,未添权重
* @param str1
* @param str2
* @return 返回计算的相识度
*/
public static double getSimilarDegree(String str1, String str2)
{
//创建向量空间模型,使用map实现,主键为词项,值为长度为2的数组,存放着对应词项在字符串中的出现次数
Map<String, int[]> vectorSpace = new HashMap<String, int[]>();
int[] itemCountArray = null;//为了避免频繁产生局部变量,所以将itemCountArray声明在此
//以空格为分隔符,分解字符串
String strArray[] = str1.split(" ");
for(int i=0; i<strArray.length; ++i)
{
if(vectorSpace.containsKey(strArray[i]))
++(vectorSpace.get(strArray[i])[0]);
else
{
itemCountArray = new int[2];
itemCountArray[0] = 1;
itemCountArray[1] = 0;
vectorSpace.put(strArray[i], itemCountArray);
}
}
strArray = str2.split(" ");
for(int i=0; i<strArray.length; ++i)
{
if(vectorSpace.containsKey(strArray[i]))
++(vectorSpace.get(strArray[i])[1]);
else
{
itemCountArray = new int[2];
itemCountArray[0] = 0;
itemCountArray[1] = 1;
vectorSpace.put(strArray[i], itemCountArray);
}
}
//计算相似度
double vector1Modulo = 0.00;//向量1的模
double vector2Modulo = 0.00;//向量2的模
double vectorProduct = 0.00; //向量积
Iterator iter = vectorSpace.entrySet().iterator();
while(iter.hasNext())
{
Map.Entry entry = (Map.Entry)iter.next();
itemCountArray = (int[])entry.getValue();
vector1Modulo += itemCountArray[0]*itemCountArray[0];
vector2Modulo += itemCountArray[1]*itemCountArray[1];
vectorProduct += itemCountArray[0]*itemCountArray[1];
}
vector1Modulo = Math.sqrt(vector1Modulo);
vector2Modulo = Math.sqrt(vector2Modulo);
//返回相似度
return (vectorProduct/(vector1Modulo*vector2Modulo));
}
/**
* 主方法
*/
public static void main(String args[])
{
String str1 = "阳光活泼 跑步 羽毛球";
String str2 = "爱美食 跑步 篮球 足球 冰棒球 骑马 游泳";
String str3 = "90后 动漫 旅游 爱美女";
String str4 = "阳光活泼 爱游戏 爱代码 码农";
String str5 = "羽毛球 羽毛球 羽毛球 羽毛球";
String str6 = "阳光活泼 跑步 羽毛球";
System.out.println("str1和str2相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str2));
System.out.println("str1和str3相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str3));
System.out.println("str1和str4相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str4));
System.out.println("str1和str5相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str5));
System.out.println("str1和str6相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str6));
}
}
机械节能产品生产企业官网模板...
大气智能家居家具装修装饰类企业通用网站模板...
礼品公司网站模板
宽屏简约大气婚纱摄影影楼模板...
蓝白WAP手机综合医院类整站源码(独立后台)...苏ICP备2024110244号-2 苏公网安备32050702011978号 增值电信业务经营许可证编号:苏B2-20251499 | Copyright 2018 - 2025 源码网商城 (www.ymwmall.com) 版权所有