Fuzzywuzzy هي مكتبة python تستخدم Levenshtein Distance لحساب الاختلافات بين التسلسلات والأنماط التي تم تطويرها وأيضًا مفتوحة المصدر بواسطة SeatGeek، وهي خدمة تبحث عن تذاكر الأحداث من في جميع أنحاء الإنترنت وعرضها على منصة واحدة.
ما هو FuzzyWuzzy في Python؟
FuzzyWuzzy هي مكتبة من Python تُستخدم لمطابقة السلسلة. مطابقة السلسلة المبهمة هي عملية البحث عن السلاسل التي تطابق نمطًا معينًا. يستخدم أساسًا مسافة Levenshtein لحساب الاختلافات بين التسلسلات.
ما هي نسبة تعيين الرمز المميز في FuzzyWuzzy؟
نسبة تعيين الرمز المميز باستخدام FuzzyWuzzy
نسبة مجموعة الرموز تنفذ عملية محددة تأخذ الرموز المميزة الشائعة بدلاً من مجرد ترميز السلاسل، والفرز ، ثم اللصق الرموز مرة أخرى معًا. لا يهم تكرار الكلمات الزائدة أو نفسها.
ما هو مثال المطابقة الغامضة؟
المطابقة الضبابية (وتسمى أيضًا مطابقة السلسلة التقريبية) هي تقنية تساعد في تحديد عنصرين من النص أو السلاسل أو الإدخالات المتشابهة تقريبًا ولكنها ليست متماثلة تمامًالـ على سبيل المثال ، لنأخذ حالة الفنادق المدرجة في نيويورك كما هو موضح في Expedia و Priceline في الرسم أدناه.
ما هو Token_sort_ratio المستخدم لـ: -؟
token_sort_ratio ، يتم ترتيب الرموز المميزة للسلسلة أبجديًا ثم يتم ضمها معًا. بعد ذلك ، زغب بسيط. يتم تطبيق النسبة للحصول على نسبة التشابه. يسمح هذا بوضع علامة على قضايا مثل قضايا المحاكم في هذا المثال على أنها هي نفسها.