C#中文文本匹配,字符串匹配,中文词语匹配,计算2个句子相似度
当前位置:点晴教程→知识管理交流
→『 技术文档交流 』
向量在数学上余弦定义如下: 因此我们可以将句子向量话计算句子的余弦相似度。 Public static void Main() { var segmenter = new JiebaSegmenter(); var douba = ClassSim.MatchKeywordSim("123", "145"); Console.WriteLine("【相似度1】:{0}", douba); var douba1 = ClassSim.MatchKeywordSim("包皮手术治疗费用怎么治疗?", "包皮手术费用"); Console.WriteLine("【相似度1】:{0}", douba1); var douba2= ClassSim.MatchKeywordSim("包皮手术治疗费用怎么治疗?", "包皮医院"); Console.WriteLine("【相似度2】:{0}", douba2); Console.ReadKey(); } 然后我们看下使用的匹配方法: public class ClassSim { public static double MatchKeywordSim(string keyword, string matchkeyword) { List<char> keywordList = keyword.ToCharArray().ToList(); List<char> matchkeywordList = matchkeyword.ToCharArray().ToList(); List<char> unionKeyword = keywordList.union(matchkeywordList).ToList<char>(); List<int> arrA = new List<int>(); List<int> arrB = new List<int>(); foreach (var str in unionKeyword) { arrA.Add(keywordList.where(x => x == str).Count()); arrB.Add(matchkeywordList.where(x => x == str).Count()); } double num = 0; double numA=0; double numB=0; for (int i = 0; i < unionKeyword.Count; i++) { num+=arrA[i]*arrB[i]; numA+=Math.Pow(arrA[i], 2); numB+=Math.Pow(arrB[i], 2); } double cos = num / (Math.Sqrt(numA) * Math.Sqrt(numB)); return cos; } } 运行结果: 该文章在 2023/3/22 15:50:10 编辑过 |
关键字查询
相关文章
正在查询... |