首页 理论教育 计算字符型指标相似度的方法优化

计算字符型指标相似度的方法优化

更新时间:2025-01-09 工作计划 版权反馈
【摘要】:字符型指标表征了产品某一方面的性能预期,通常以文字描述的形式出现。对于字符型指标,其相似度由其最小编辑距离确定。最小编辑距离又称Levenshtein距离,是指两个字串之间通过插入、删除或替换操作将其中一个字符串转换为另一个字符串所需的最少编辑操作次数,其计算方法如式(5.3)所示,式(5.4)为字符串a={a_1,…,b_m}的相似度SIM(a,b)的计算方法。

字符型指标表征了产品某一方面的性能预期,通常以文字描述的形式出现。例如,枪械产品通常有材料性能、便携性等要求,虽然难以用量化的形式表达,但这类信息同样能够为相似案例的选择提供参考。对于字符型指标,其相似度由其最小编辑距离确定。

最小编辑距离又称Levenshtein距离,是指两个字串之间通过插入、删除或替换操作将其中一个字符串转换为另一个字符串所需的最少编辑操作次数,其计算方法如式(5.3)所示,式(5.4)为字符串a={a_1,…,a_n}与b={b_1,…,b_m}的相似度SIM(a,b)的计算方法。(www.xing528.com)

式中,di,0=i(0≤i≤m),d0,j=j(0≤j≤n);wins(bi-1)表示插入代价,即在字符串b的第i-1个位置插入一个字符对编辑距离产生的影响,取wins(bi-1)=1;wdel(aj-1)为删除代价,即删除字符串a的第j-1位置的字符对编辑距离产生的影响,此处,取wdel(aj-1)=1;wsub(aj-1,bi-1)表示替换代价,即将字符串a的第j-1位置的字符替换为字符串b的第i-1位置的字符时对编辑距离产生的影响,若两者相同,则取wsub(aj-1,bi-1)=0,若不相同则取wsub(aj-1,bi-1)=1。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈