Mô tả dự ánTổng quanSứa là một thư viện cho sự kết hợp gần đúng & ngữ âm của các chuỗi. is a library for approximate & phonetic matching of strings. Show Nguồn: https://github.com/jamesturk/jellyfish Tài liệu: https://jamesturk.github.io/jellyfish/ Các vấn đề: https://github.com/jamesturk/jellyfish/issues Bao gồm thuật toánSo sánh chuỗi:
Mã hóa ngữ âm:
Ví dụ sử dụng>>> import jellyfish >>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish') 2 >>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish') 0.89629629629629637 >>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs') 1 >>> jellyfish.metaphone(u'Jellyfish') 'JLFX' >>> jellyfish.soundex(u'Jellyfish') 'J412' >>> jellyfish.nysiis(u'Jellyfish') 'JALYF' >>> jellyfish.match_rating_codex(u'Jellyfish') 'JLLFSH' Tải tập tinTải xuống tệp cho nền tảng của bạn. Nếu bạn không chắc chắn nên chọn cái nào, hãy tìm hiểu thêm về việc cài đặt các gói. Phân phối nguồnPhân phối xây dựngMô tả dự án
Sứa là một thư viện Python để thực hiện kết hợp gần đúng và ngữ âm của các chuỗi. Được viết bởi James Turk và Michael Stephens..p.turk@gmail.com> and Michael Stephens. Xem https://github.com/jamesturk/jellyfish/graphs/contributors cho những người đóng góp. Nguồn có sẵn tại http://github.com/jamesturk/jellyfish. Bao gồm thuật toánSo sánh chuỗi:
Mã hóa ngữ âm:
Ví dụ sử dụng>>> import jellyfish >>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish') 2 >>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish') 0.89629629629629637 >>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs') 1 >>> jellyfish.metaphone(u'Jellyfish') 'JLFX' >>> jellyfish.soundex(u'Jellyfish') 'J412' >>> jellyfish.nysiis(u'Jellyfish') 'JALYF' >>> jellyfish.match_rating_codex(u'Jellyfish') 'JLLFSH' Tải tập tinTải xuống tệp cho nền tảng của bạn.Nếu bạn không chắc chắn nên chọn cái nào, hãy tìm hiểu thêm về việc cài đặt các gói. Phân phối nguồnPhân phối xây dựng |