Hướng dẫn how do you store long numbers in python? - làm thế nào để bạn lưu trữ các số dài trong python?

Tôi đã xem xét đánh giá tay nhanh trong Python. Nó xảy ra với tôi rằng một cách để tăng tốc quá trình sẽ là đại diện cho tất cả các mặt và phù hợp với các số nguyên tố và nhân chúng lại với nhau để đại diện cho bàn tay. Để Whit:

class PokerCard: faces = '23456789TJQKA' suits = 'cdhs' facePrimes = [11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 53, 59, 61] suitPrimes = [2, 3, 5, 7]

VÀ

def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit]

Điều này sẽ mang lại cho mỗi bàn tay một giá trị số mà thông qua Modulo có thể cho tôi biết có bao nhiêu vị vua trong tay hoặc có bao nhiêu trái tim. Ví dụ, bất kỳ bàn tay nào có năm hoặc nhiều câu lạc bộ trong đó sẽ chia đều cho 2^5; Bất kỳ bàn tay nào có bốn vị vua sẽ chia đều cho 59^4, v.v.

Vấn đề là một bàn tay bảy thẻ như Acadahaskdkhks có giá trị băm khoảng 62,7 triệu triệu, sẽ mất hơn 32 bit để thể hiện nội bộ. Có cách nào để lưu trữ số lượng lớn như vậy trong Python sẽ cho phép tôi thực hiện các hoạt động số học trên đó không?

Phụ trợ @unacademy • Dữ liệu @Amazon • Nền tảng @Practo | Viết về ngôn ngữ nội bộ và toán học trong khoa học máy tính

Khi bạn mã hóa bằng ngôn ngữ cấp thấp như C, bạn lo lắng về việc chọn đúng loại dữ liệu và vòng loại cho số nguyên của bạn; Ở mỗi bước, bạn cần phải suy nghĩ nếu int sẽ đủ hoặc bạn nên đi cho def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 0 hoặc thậm chí cao hơn đến def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 1. Nhưng trong khi mã hóa trong Python, bạn không cần phải lo lắng về những điều "tầm thường" này vì Python hỗ trợ các số nguyên có kích thước tùy ý.

Trong C, khi bạn cố gắng tính toán 2²⁰⁰⁰⁰ bằng cách sử dụng hàm def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 2 tích hợp, nó cung cấp cho bạn def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 3 làm đầu ra.

#include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf

Nhưng đối với Python, nó là một miếng bánh 🎂

>>> 2 ** 20000 39802768403379665923543072061912024537047727804924259387134 ... ... ... 6021 digits long ... ... 6309376

Python phải làm một cái gì đó đẹp trong nội bộ để hỗ trợ các số nguyên có kích thước tùy ý và hôm nay chúng tôi tìm ra những gì dưới mui xe!

Đại diện và định nghĩa

Một số nguyên trong Python là một cấu trúc C được xác định như sau

struct _longobject { PyObject_VAR_HEAD digit ob_digit[1]; };

def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 4 là một macro mở rộng thành def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 5 có cấu trúc sau

typedef struct { PyObject ob_base; Py_ssize_t ob_size; /* Number of items in variable part */ } PyVarObject;

Các loại khác có def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 4 là

def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 7
def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 8
def HashVal(self): return PokerCard.facePrimes[self.cardFace] * PokerCard.suitPrimes[self.cardSuit] 9

Điều này chỉ ra rằng một số nguyên, giống như #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 0 hoặc #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 1, có độ dài khác nhau và đây là cái nhìn sâu sắc đầu tiên của chúng tôi về cách nó có thể hỗ trợ các số nguyên dài. #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 2 sau khi mở rộng vĩ mô có thể được xem là

struct _longobject { PyObject ob_base; Py_ssize_t ob_size; /* Number of items in variable part */ digit ob_digit[1]; };

Đây là một số trường meta trong cấu trúc #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 3, được sử dụng để đếm tham chiếu (thu gom rác), nhưng chúng tôi sẽ yêu cầu một bài viết riêng. Trường mà chúng tôi sẽ tập trung vào là #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 4 và ở một mức độ nào đó #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 5.

Giải mã #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 4

#include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 4 là một mảng loại #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 8, được đánh máy từ #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 9, được phân bổ tĩnh cho chiều dài >>> 2 ** 20000 39802768403379665923543072061912024537047727804924259387134 ... ... ... 6021 digits long ... ... 6309376 0. Vì nó là một mảng, #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 4 chủ yếu là >>> 2 ** 20000 39802768403379665923543072061912024537047727804924259387134 ... ... ... 6021 digits long ... ... 6309376 2, con trỏ tới #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 8, và do đó nếu được yêu cầu có thể được đưa vào bất kỳ độ dài nào. Điều này làm cho Python có thể đại diện và xử lý các số nguyên dài.

Nói chung, trong các ngôn ngữ cấp thấp như C, độ chính xác của các số nguyên được giới hạn ở mức 64 bit, nhưng Python thực hiện các số nguyên chính xác tùy ý. Vì Python 3, tất cả các số nguyên được biểu diễn dưới dạng bignum và chúng chỉ bị giới hạn bởi bộ nhớ có sẵn của hệ thống máy chủ.

Giải mã #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 5

#include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 5 giữ số lượng các yếu tố trong #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 4. Để hiệu quả hơn trong khi phân bổ bộ nhớ thành mảng #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 4, các sự cung cấp quá mức của Python và sau đó dựa vào giá trị của #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 5 để xác định số lượng các phần tử thực tế được giữ trong mảng.

Kho

Một cách ngây thơ để lưu trữ một số nguyên chữ số là bằng cách thực sự lưu trữ một chữ số thập phân trong một mục của mảng và sau đó các hoạt động như bổ sung và trừ có thể được thực hiện giống như toán học lớp.

Với cách tiếp cận này, một số >>> 2 ** 20000 39802768403379665923543072061912024537047727804924259387134 ... ... ... 6021 digits long ... ... 6309376 9 sẽ được lưu trữ dưới dạng

Cách tiếp cận này không hiệu quả vì chúng ta sẽ sử dụng tăng 32 bit chữ số (#include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 9) để lưu trữ một chữ số thập phân thực sự chỉ dao động từ 0 đến 9 và có thể dễ dàng được biểu thị bằng 4 bit, và trong khi viết một cái gì đó linh hoạt như Python, Một nhà phát triển cốt lõi phải tháo vát hơn thế này.

Vì vậy, chúng ta có thể làm tốt hơn không? Để chắc chắn, nếu không, bài viết này sẽ không giữ chỗ trên internet. Hãy đi sâu vào cách Python lưu trữ một số nguyên siêu dài.

Cách pythonic

Thay vì chỉ lưu trữ một chữ số thập phân trong mỗi mục của mảng #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 4, Python chuyển đổi số từ cơ sở 10 thành cơ sở 2³⁰ và gọi từng phần tử là #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 8 dao động từ 0 đến 2³⁰ - 1.

Trong hệ thống số thập lục phân, cơ sở là 16 ~ 2⁴ Điều này có nghĩa là mỗi "chữ số" của một số thập lục phân dao động từ 0 đến 15 của hệ thống thập phân. Tương tự đối với Python, "Digit" nằm trong cơ sở 2³⁰ có nghĩa là nó sẽ nằm trong khoảng từ 0 đến 2³⁰ - 1 = 1073741823 của hệ thống thập phân.

Bằng cách này, Python sử dụng hiệu quả hầu hết tất cả không gian được phân bổ 32 bit mỗi chữ số và giữ cho chính nó tháo vát và vẫn thực hiện các hoạt động như bổ sung và trừ như toán học lớp.

Tùy thuộc vào nền tảng, Python sử dụng các mảng số nguyên không dấu 32 bit với các chữ số 30 bit hoặc các mảng số nguyên không dấu 16 bit với các chữ số 15 bit. Nó đòi hỏi một vài bit để thực hiện các hoạt động sẽ được thảo luận trong một số bài viết trong tương lai.

Ví dụ: 1152921504606846976

Như đã đề cập, đối với Python, một "chữ số" là cơ sở 2³⁰ do đó nếu bạn chuyển đổi struct _longobject { PyObject_VAR_HEAD digit ob_digit[1]; }; 3 thành cơ sở 2³⁰ bạn sẽ nhận được struct _longobject { PyObject_VAR_HEAD digit ob_digit[1]; }; 4.

1152921504606846976 = 0 * (2³⁰) ⁰ + 0 * (2³⁰) ¹ + 1 * (2³⁰) ² = 0 * (2³⁰)⁰ + 0 * (2³⁰)¹ + 1 * (2³⁰)²

Cấu trúc #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 2 cho giá trị này sẽ được giữ

#include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 5 là struct _longobject { PyObject_VAR_HEAD digit ob_digit[1]; }; 7
#include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 4 là struct _longobject { PyObject_VAR_HEAD digit ob_digit[1]; }; 9

Tôi đã tạo ra một bản demo sẽ xuất hiện theo cách mà Python đang lưu trữ các số nguyên trong nội bộ và cũng có tham chiếu đến các thành viên cấu trúc như #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 5, typedef struct { PyObject ob_base; Py_ssize_t ob_size; /* Number of items in variable part */ } PyVarObject; 1, v.v.

Hoạt động trên các số nguyên siêu dài

Bây giờ chúng ta có một ý tưởng công bằng về cách Python hỗ trợ và thực hiện các số nguyên chính xác tùy ý của nó để hiểu làm thế nào các hoạt động toán học khác nhau xảy ra với chúng.

Phép cộng

Các số nguyên vẫn tồn tại "khôn ngoan về chữ số", điều này có nghĩa là sự bổ sung cũng đơn giản như những gì chúng ta học được ở trường lớp và mã nguồn của Python cho chúng ta thấy rằng đây chính xác là cách nó được thực hiện. Hàm có tên X_ADD trong Tệp LongObject.c thực hiện việc bổ sung hai số.

... for (i = 0; i < size_b; ++i) { carry += a->ob_digit[i] + b->ob_digit[i]; z->ob_digit[i] = carry & PyLong_MASK; carry >>= PyLong_SHIFT; } for (; i < size_a; ++i) { carry += a->ob_digit[i]; z->ob_digit[i] = carry & PyLong_MASK; carry >>= PyLong_SHIFT; } z->ob_digit[i] = carry; ...

Đoạn mã ở trên được lấy từ hàm typedef struct { PyObject ob_base; Py_ssize_t ob_size; /* Number of items in variable part */ } PyVarObject; 2 và bạn có thể thấy rằng nó lặp lại trên các chữ số và thực hiện thêm chữ số-khôn ngoan và tính toán và truyền tải mang theo.

Mọi thứ trở nên thú vị khi kết quả của việc bổ sung là một số âm. Dấu hiệu của #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 5 là dấu hiệu của số nguyên, có nghĩa là, nếu bạn có số âm thì #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 5 sẽ âm. Giá trị tuyệt đối của #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 5 sẽ xác định số chữ số trong #include <stdio.h> #include <math.h> int main(void) { printf("%Lf\n", powl(2, 20000)); return 0; } $ ./a.out inf 4.

Phép trừ

Tương tự như cách bổ sung được thực hiện, phép trừ cũng xảy ra theo chữ số. Hàm có tên x_sub trong Tệp LongObject.c thực hiện phép trừ hai số.

... for (i = 0; i < size_b; ++i) { borrow = a->ob_digit[i] - b->ob_digit[i] - borrow; z->ob_digit[i] = borrow & PyLong_MASK; borrow >>= PyLong_SHIFT; borrow &= 1; /* Keep only one sign bit */ } for (; i < size_a; ++i) { borrow = a->ob_digit[i] - borrow; z->ob_digit[i] = borrow & PyLong_MASK; borrow >>= PyLong_SHIFT; borrow &= 1; /* Keep only one sign bit */ } ...

Đoạn mã ở trên được lấy từ hàm typedef struct { PyObject ob_base; Py_ssize_t ob_size; /* Number of items in variable part */ } PyVarObject; 7 và bạn có thể thấy cách nó lặp lại trên các chữ số và thực hiện phép trừ và tính toán và tuyên truyền Burrow. Rất giống với bổ sung thực sự.

Phép nhân

Một lần nữa, một cách ngây thơ để thực hiện phép nhân sẽ là những gì chúng ta học được trong toán học lớp nhưng nó sẽ không hiệu quả. Python, để giữ cho mọi thứ hiệu quả thực hiện thuật toán Karatsuba nhân lên hai số N-chữ số trong các bước cơ bản O (Nˡᵒᵍ³).

Thuật toán hơi phức tạp nằm ngoài phạm vi của bài viết này nhưng bạn có thể tìm thấy việc triển khai của nó trong các hàm k_mul và k_lopsided_mul trong tệp longobject.c.
k_lopsided_mul functions in file longobject.c.

Bộ phận và các hoạt động khác

Tất cả các hoạt động trên số nguyên được xác định trong tệp longoBject.c và nó rất đơn giản để định vị và theo dõi từng cái. CẢNH BÁO: Sẽ mất một thời gian để hiểu chi tiết từng người một số bỏng ngô trước khi bạn bắt đầu lướt qua.

Tối ưu hóa các số nguyên thường được sử dụng

Python preall phân biến các số nguyên nhỏ trong phạm vi từ -5 đến 256. Phân bổ này xảy ra trong quá trình khởi tạo và vì chúng tôi không thể cập nhật số nguyên (tính bất biến) các số nguyên được phân tách này là đơn lẻ và được tham chiếu trực tiếp thay vì phân bổ lại. Điều này có nghĩa là mỗi khi chúng ta sử dụng/tạo ra một số nguyên nhỏ, python thay vì phân bổ lại chỉ trả về tham chiếu của một cái được phân bổ.

Tối ưu hóa này có thể được truy tìm trong macro typedef struct { PyObject ob_base; Py_ssize_t ob_size; /* Number of items in variable part */ } PyVarObject; 8 và hàm get_small_int trong longobject.c. Bằng cách này, Python tiết kiệm rất nhiều không gian và tính toán cho các số nguyên thường được sử dụng.

Đây là bài viết thứ hai trong sê -ri Python Internals. Bài viết đầu tiên là cách tôi thay đổi con trăn của mình và làm cho nó trở nên đáng ngờ và nó giúp bạn thực hiện những bước đầu tiên trong mã nguồn của Python và mở đường cho bạn để trở thành nhà phát triển Python Core.

Bài viết này ban đầu được xuất bản trên blog của tôi - Làm thế nào Python thực hiện các số nguyên siêu dài ?.

Nếu bạn muốn đọc thêm các bài viết như thế này, hãy đăng ký nhận bản tin của tôi và nhận bài đăng được gửi trực tiếp vào hộp thư đến của bạn. Tôi viết về kỹ thuật, thiết kế hệ thống và một chút lập trình, mỗi thứ Sáu. Hãy cho tôi một tiếng hét @arpit_bhayani. Bạn có thể tìm thấy các bài viết trước của tôi @arpitbhayani.me/blog.

Làm thế nào để bạn nhập một số nguyên dài vào Python?

Như chúng ta biết rằng hàm đầu vào tích hợp () của Python luôn trả về đối tượng lớp STR (Chuỗi).Vì vậy, để lấy đầu vào số nguyên, chúng ta phải gõ các đầu vào đó vào số nguyên bằng cách sử dụng hàm int int () tích hợp python.type cast those inputs into integers by using Python built-in int() function.

Con số lớn nhất Python có thể xử lý là gì?

Trong Python3, INT không có giới hạn tối đa.Python2 có hai loại số nguyên, int và dài, nhưng python3 chỉ có int.int trong python3 tương đương với dài trong python2 và không có giới hạn tối đa.Bạn có thể xử lý giá trị lớn như bộ nhớ có sẵn.int has no max limit. Python2 has two integer types, int and long , but Python3 has only int . int in Python3 is equivalent to long in Python2, and there is no max limit. You can handle as large value as memory is available.

Số nguyên có thể lớn trong bao lâu trong Python?

Chúng đại diện cho các số trong phạm vi -2147483648 đến 2147483647. (Phạm vi có thể lớn hơn trên các máy có kích thước từ tự nhiên lớn hơn, nhưng không nhỏ hơn.)-2147483648 through 2147483647. (The range may be larger on machines with a larger natural word size, but not smaller.)