Fuzzywuzzy SeatGeek tərəfindən hazırlanmış və açıq mənbəli ardıcıllıqlar və nümunələr arasındakı fərqləri hesablamaq üçün Levenshtein Distance istifadə edən python kitabxanasıdır, tədbir biletlərini tapan xidmət bütün internet üzərindən və onları bir platformada nümayiş etdirin.
Python-da FuzzyWuzzy nədir?
FuzzyWuzzy sətirlərinin uyğunlaşdırılması üçün istifadə edilən Python kitabxanasıdır. Qeyri-səlis sətir uyğunluğu verilmiş nümunəyə uyğun gələn sətirlərin tapılması prosesidir. Əsasən ardıcıllıqlar arasındakı fərqləri hesablamaq üçün Levenshtein məsafəsindən istifadə edir.
FuzzyWuzzy-də token dəsti nisbəti nədir?
FuzzyWuzzy
Token dəsti nisbətindən istifadə edərək Token Dəsti Nisbəti sətirləri işarələmək, çeşidləmək və sonra yerləşdirmək əvəzinə ümumi tokenləri çıxaran dəst əməliyyatı həyata keçirir tokenlər yenidən birlikdə. Əlavə və ya eyni təkrarlanan sözlərin əhəmiyyəti yoxdur.
Qeyri-səlis uyğunluq nümunəsi nədir?
Qeyri-səlis Uyğunluq (həmçinin Təxmini Sim Uyğunluğu adlanır) təxminən oxşar, lakin tam eyni olmayan mətnin, sətirlərin və ya qeydlərin iki elementini müəyyən etməyə kömək edən texnikadır üçün misal üçün, aşağıdakı qrafikdə Expedia və Priceline tərəfindən göstərildiyi kimi Nyu Yorkdakı otellərin siyahısını götürək.
Token_sort_ratio nə üçün istifadə olunur:-?
token_sort_ratio, simli tokenlər əlifba sırası ilə sıralanır və sonra birləşir. Bundan sonra, sadə bir tüy. oxşarlıq faizini almaq üçün nisbət tətbiq edilir. Bu, bu nümunədəki məhkəmə işləri kimi işlərin eyni kimi qeyd edilməsinə imkan verir.