Hướng dẫn jellyfish python - trăn sứa

Mô tả dự án

Tổng quan

Sứa là một thư viện cho sự kết hợp gần đúng & ngữ âm của các chuỗi. is a library for approximate & phonetic matching of strings.

Nguồn: https://github.com/jamesturk/jellyfish

Tài liệu: https://jamesturk.github.io/jellyfish/

Các vấn đề: https://github.com/jamesturk/jellyfish/issues

Hướng dẫn jellyfish python - trăn sứa
Hướng dẫn jellyfish python - trăn sứa

Bao gồm thuật toán

So sánh chuỗi:

  • Khoảng cách Levenshtein
  • Khoảng cách Damerau-Levenshtein
  • Khoảng cách jaro
  • Khoảng cách Jaro-Winkler
  • Phương pháp đánh giá so sánh so sánh
  • Khoảng cách hamming

Mã hóa ngữ âm:

  • American Soundex
  • Siêu hình
  • NYSIIS (Hệ thống Nhận dạng và Tình báo Tiểu bang New York)
  • Kết hợp đánh giá Codex

Ví dụ sử dụng

>>> import jellyfish
>>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish')
2
>>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish')
0.89629629629629637
>>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs')
1

>>> jellyfish.metaphone(u'Jellyfish')
'JLFX'
>>> jellyfish.soundex(u'Jellyfish')
'J412'
>>> jellyfish.nysiis(u'Jellyfish')
'JALYF'
>>> jellyfish.match_rating_codex(u'Jellyfish')
'JLLFSH'

Tải tập tin

Tải xuống tệp cho nền tảng của bạn. Nếu bạn không chắc chắn nên chọn cái nào, hãy tìm hiểu thêm về việc cài đặt các gói.

Phân phối nguồn

Phân phối xây dựng

Mô tả dự án

Sứa là một thư viện Python để thực hiện kết hợp gần đúng và ngữ âm của các chuỗi.

Được viết bởi James Turk và Michael Stephens..p.turk@gmail.com> and Michael Stephens.

Xem https://github.com/jamesturk/jellyfish/graphs/contributors cho những người đóng góp.

Nguồn có sẵn tại http://github.com/jamesturk/jellyfish.

Bao gồm thuật toán

So sánh chuỗi:

  • Khoảng cách Levenshtein

  • Khoảng cách Damerau-Levenshtein

  • Khoảng cách jaro

  • Khoảng cách Jaro-Winkler

  • Phương pháp đánh giá so sánh so sánh

  • Khoảng cách hamming

Mã hóa ngữ âm:

  • American Soundex

  • Siêu hình

  • NYSIIS (Hệ thống Nhận dạng và Tình báo Tiểu bang New York)

  • Kết hợp đánh giá Codex

Ví dụ sử dụng

>>> import jellyfish
>>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish')
2
>>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish')
0.89629629629629637
>>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs')
1
>>> jellyfish.metaphone(u'Jellyfish')
'JLFX'
>>> jellyfish.soundex(u'Jellyfish')
'J412'
>>> jellyfish.nysiis(u'Jellyfish')
'JALYF'
>>> jellyfish.match_rating_codex(u'Jellyfish')
'JLLFSH'

Tải tập tin

Tải xuống tệp cho nền tảng của bạn.Nếu bạn không chắc chắn nên chọn cái nào, hãy tìm hiểu thêm về việc cài đặt các gói.

Phân phối nguồn

Phân phối xây dựng