Mô tả dự án
Tổng quan
Sứa là một thư viện cho sự kết hợp gần đúng & ngữ âm của các chuỗi. is a library for approximate & phonetic matching of strings.
Nguồn: //github.com/jamesturk/jellyfish
Tài liệu: //jamesturk.github.io/jellyfish/
Các vấn đề: //github.com/jamesturk/jellyfish/issues
Bao gồm thuật toán
So sánh chuỗi:
- Khoảng cách Levenshtein
- Khoảng cách Damerau-Levenshtein
- Khoảng cách jaro
- Khoảng cách Jaro-Winkler
- Phương pháp đánh giá so sánh so sánh
- Khoảng cách hamming
Mã hóa ngữ âm:
- American Soundex
- Siêu hình
- NYSIIS (Hệ thống Nhận dạng và Tình báo Tiểu bang New York)
- Kết hợp đánh giá Codex
Ví dụ sử dụng
>>> import jellyfish >>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish') 2 >>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish') 0.89629629629629637 >>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs') 1 >>> jellyfish.metaphone(u'Jellyfish') 'JLFX' >>> jellyfish.soundex(u'Jellyfish') 'J412' >>> jellyfish.nysiis(u'Jellyfish') 'JALYF' >>> jellyfish.match_rating_codex(u'Jellyfish') 'JLLFSH'Tải tập tin
Tải xuống tệp cho nền tảng của bạn. Nếu bạn không chắc chắn nên chọn cái nào, hãy tìm hiểu thêm về việc cài đặt các gói.
Phân phối nguồn
Phân phối xây dựng
Mô tả dự án
Sứa là một thư viện Python để thực hiện kết hợp gần đúng và ngữ âm của các chuỗi.
Được viết bởi James Turk và Michael Stephens..p.turk@gmail.com> and Michael Stephens.
Xem //github.com/jamesturk/jellyfish/graphs/contributors cho những người đóng góp.
Nguồn có sẵn tại //github.com/jamesturk/jellyfish.
Bao gồm thuật toán
So sánh chuỗi:
Khoảng cách Levenshtein
Khoảng cách Damerau-Levenshtein
Khoảng cách jaro
Khoảng cách Jaro-Winkler
Phương pháp đánh giá so sánh so sánh
Khoảng cách hamming
Mã hóa ngữ âm:
American Soundex
Siêu hình
NYSIIS (Hệ thống Nhận dạng và Tình báo Tiểu bang New York)
Kết hợp đánh giá Codex
Ví dụ sử dụng
>>> import jellyfish >>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish') 2 >>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish') 0.89629629629629637 >>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs') 1 >>> jellyfish.metaphone(u'Jellyfish') 'JLFX' >>> jellyfish.soundex(u'Jellyfish') 'J412' >>> jellyfish.nysiis(u'Jellyfish') 'JALYF' >>> jellyfish.match_rating_codex(u'Jellyfish') 'JLLFSH'Tải tập tin
Tải xuống tệp cho nền tảng của bạn.Nếu bạn không chắc chắn nên chọn cái nào, hãy tìm hiểu thêm về việc cài đặt các gói.