閱: 2347 | 回: 4
發(fā)表于2023/2/28 17:55:51
樓主
等級(jí):初學(xué)者
-
積分:3
-
財(cái)富值:2.00
-
身份:普通用戶(hù)
這是整理上萬(wàn)個(gè)素材,一個(gè)壓縮文件匹配一張圖片。命名相似(不完全相同),以TextMatchRate篩選,結(jié)果發(fā)現(xiàn)這個(gè)相似度是按含有的字符數(shù)量來(lái)計(jì)算,要命的是不按順序!結(jié)果就成了看來(lái)完全不同的兩文件名相似度很高!
圖1:39字符,一個(gè)多個(gè)“1”,為什么只有95%相似度?按字符比例來(lái)算也不止這么多?
圖2:明顯不同字符很多為什么卻達(dá)到96%相似度?這兩文件一眼就看出不匹配
圖3:前面同圖1,前面安全相同,后面多個(gè)模型字符,前面相同35字符,后面多7個(gè)字符,相似度卻只有80%?


我的個(gè)性簽名
等級(jí):傳說(shuō)級(jí)人物