Tôi đang tìm một người bảo trì mới cho dự án vì rõ ràng là tôi đã không có nhu cầu về thư viện cụ thể này trong hơn 7 năm nay, do nó là thư viện chỉ dành cho C và giấy phép ban đầu hơi hạn chế của nó
Mô-đun mở rộng Levenshtein Python C chứa các chức năng để tính toán nhanh
- Levenshtein (chỉnh sửa) khoảng cách và chỉnh sửa các thao tác
- chuỗi tương tự
- các chuỗi trung bình gần đúng và nói chung là chuỗi trung bình
- trình tự chuỗi và thiết lập độ tương tự
Nó hỗ trợ cả chuỗi thường và chuỗi Unicode
Trăn 2. 2 hoặc mới hơn là bắt buộc;
Trình so khớp chuỗi. py là một lớp giống như SequenceMatcher ví dụ được xây dựng trên đỉnh của Levenshtein. Nó thiếu một số chức năng của SequenceMatcher và có thêm một số OTOH
Levenshtein. c cũng có thể được sử dụng như một thư viện C thuần túy. Bạn chỉ phải xác định ký hiệu tiền xử lý NO_PYTHON (-DNO_PYTHON) khi biên dịch nó. Chức năng tương tự như chức năng của tiện ích mở rộng Python. Chưa có tài liệu riêng nào được cung cấp, RTGS. Nhưng chúng không thể hoán đổi cho nhau
- Các hàm C được xuất khi biên dịch với -DNO_PYTHON (xem Levenshtein. h) không được xuất khi biên dịch dưới dạng phần mở rộng Python (và ngược lại)
- Loại ký tự Unicode được sử dụng với -DNO_PYTHON là wchar_t, phần mở rộng Python sử dụng Py_UNICODE, chúng có thể giống nhau nhưng không được tính
- Tài liệu cho phiên bản hiện tại
gendoc. sh tạo tài liệu API HTML, bạn có thể muốn có một phiên bản độc lập thay vì có thể bao gồm, vì vậy hãy chạy trong ./gendoc.sh --selfcontained. Nó cần Levenshtein đã được cài đặt và genxtdoc. py
Levenshtein là phần mềm miễn phí;
Xem tệp SAO CHÉP để biết toàn văn Giấy phép Công cộng GNU phiên bản 2
Gói này đã bị thiếu từ lâu trong Chỉ mục gói Python và chỉ có sẵn dưới dạng kiểm tra nguồn, nhưng giờ đây có thể tìm thấy lại trên PyPI
Cài đặt gói python-levenshtein trên Ubuntu dễ như chạy lệnh sau trên terminal
sudo apt-get update sudo apt-get install python-levenshteinthông tin gói python-levenshtein
Thông tin thêm về cài đặt bằng apt-get
Advanced Package Tool, hay APT, là một giao diện người dùng phần mềm miễn phí hoạt động với các thư viện cốt lõi để xử lý việc cài đặt và gỡ bỏ phần mềm trên Debian, Ubuntu và các bản phân phối Linux khác. APT đơn giản hóa quy trình quản lý phần mềm trên các hệ thống máy tính giống Unix bằng cách tự động truy xuất, cấu hình và cài đặt các gói phần mềm, từ các tệp được biên dịch sẵn hoặc bằng cách biên dịch mã nguồn
apt-get là công cụ dòng lệnh để xử lý các gói và có thể được coi là "back-end" của người dùng đối với các công cụ khác sử dụng thư viện APT
cài đặt apt-get được theo sau bởi một hoặc nhiều gói mong muốn để cài đặt hoặc nâng cấp. Mỗi gói là một tên gói, không phải là tên tệp đủ điều kiện. Tất cả các gói được yêu cầu bởi (các) gói được chỉ định để cài đặt cũng sẽ được truy xuất và cài đặt. /etc/apt/nguồn. tệp danh sách được sử dụng để định vị các gói mong muốn. Nếu một dấu gạch nối được thêm vào tên gói (không có khoảng trống ở giữa), thì gói đã xác định sẽ bị xóa nếu nó được cài đặt. Tương tự, một dấu cộng có thể được sử dụng để chỉ định gói cần cài đặt. Các tính năng sau này có thể được sử dụng để ghi đè các quyết định do hệ thống giải quyết xung đột của apt-get đưa ra
Một phần mở rộng Python được viết bằng C để tính toán nhanh. Levenshtein (chỉnh sửa) khoảng cách và chỉnh sửa thao tác trình tự; . Levenshtein có một số trùng lặp với difflib (SequenceMatcher). Nó chỉ hỗ trợ các chuỗi, không phải các loại chuỗi tùy ý, nhưng mặt khác, nó nhanh hơn nhiều. Lưu ý rằng dự án đã được đổi tên và python-Levenshtein hiện chỉ là một siêu dữ liệu cài đặt gói Levenshtein
Hướng dẫn cài đặt nhanh python-levenshtein trên Ubuntu Server. Nó siêu dễ. chỉ cần nhấp vào nút Sao chép để sao chép lệnh và dán vào thiết bị đầu cuối dòng lệnh của bạn bằng trình quản lý gói APT tích hợp
Xem bên dưới để biết hướng dẫn từng bước nhanh về các lệnh SSH, Sao chép/Dán để tránh viết sai chính tả hoặc vô tình cài đặt một gói khác
Mô-đun Levenshtein tính toán khoảng cách Levenshtein, tỷ lệ tương tự, trung bình tổng quát và thiết lập trung vị của chuỗi Unicode hoặc không phải Unicode. Bởi vì nó được triển khai trong C, nên nó nhanh hơn nhiều so với các hàm và phương thức tương ứng của thư viện Python. . Khoảng cách Levenshtein là số lần chèn, xóa và thay thế một ký tự đơn tối thiểu để biến một chuỗi này thành một chuỗi khác. . Nó rất hữu ích để kiểm tra chính tả hoặc kết hợp mờ các tin nhắn gettext