国产一区二区欧美精品免费-欧美国产日韩在线视频-欧美亚洲国语精品一区二区-欧美激情五月综合啪啪-国产69精品麻豆久久久久-亚洲人成精品久久久久桥网站-欧美刺激肥熟在线视频-十七岁日本免费完整版BD-黑夜在线拖拽不卡第一页

`
閱: 2347 | 回: 4
發(fā)表于2023/2/28 17:55:51 樓主 
頭像 等級(jí):初學(xué)者
積分:3
財(cái)富值:2.00
身份:普通用戶(hù)

這是整理上萬(wàn)個(gè)素材,一個(gè)壓縮文件匹配一張圖片。命名相似(不完全相同),以TextMatchRate篩選,結(jié)果發(fā)現(xiàn)這個(gè)相似度是按含有的字符數(shù)量來(lái)計(jì)算,要命的是不按順序!結(jié)果就成了看來(lái)完全不同的兩文件名相似度很高!

圖1:39字符,一個(gè)多個(gè)“1”,為什么只有95%相似度?按字符比例來(lái)算也不止這么多?

圖2:明顯不同字符很多為什么卻達(dá)到96%相似度?這兩文件一眼就看出不匹配

圖3:前面同圖1,前面安全相同,后面多個(gè)模型字符,前面相同35字符,后面多7個(gè)字符,相似度卻只有80%?

我的個(gè)性簽名
發(fā)表于 2023/2/28 18:00:11   
頭像 等級(jí):傳說(shuō)級(jí)人物
積分:2734
財(cái)富值:4
身份:普通用戶(hù)

這個(gè)算法肯定是全文匹配不是按順序匹配的

發(fā)表于 2023/2/28 18:04:11   
頭像 等級(jí):初學(xué)者
積分:3
財(cái)富值:2
身份:普通用戶(hù)

回復(fù):2樓

請(qǐng)問(wèn)下那我這種應(yīng)用用什么函數(shù)來(lái)篩選合適?
我的個(gè)性簽名
發(fā)表于 2023/2/28 18:27:32   
頭像 等級(jí):初學(xué)者
積分:3
財(cái)富值:2
身份:普通用戶(hù)

我是真得不理解這個(gè)匹配規(guī)則設(shè)定了,它的應(yīng)用范圍在哪兒我都想不出了。下面實(shí)驗(yàn)了123456789與987654321,匹配度100%還可以理解成不按順序,有的字符都有。但改成下圖這樣還是100%匹配?就真不理解了。是都是數(shù)字原因?


我的個(gè)性簽名
發(fā)表于 2023/3/1 9:28:40   
頭像 等級(jí):傳說(shuō)級(jí)人物
積分:2734
財(cái)富值:4
身份:普通用戶(hù)
這個(gè)應(yīng)該得用來(lái)匹配漢字,字母和數(shù)字個(gè)數(shù)太少了,加起來(lái)也就36個(gè),很容易重復(fù)

快速回復(fù)

目前不允許游客發(fā)表,請(qǐng) 登錄 注冊(cè) 后再發(fā)貼。