Mục lục bài viết:
Show NumPy là một thư viện Python cung cấp cấu trúc dữ liệu đơn giản nhưng mạnh mẽ: mảng n-chiều . Đây là nền tảng mà trên đó hầu như tất cả sức mạnh của bộ công cụ khoa học dữ liệu của Python được xây dựng và học NumPy là bước đầu tiên trên hành trình của bất kỳ nhà khoa học dữ liệu Python nào. Hướng dẫn này sẽ cung cấp cho bạn kiến thức cần thiết để sử dụng NumPy và các thư viện cấp cao hơn dựa vào nó. Trong hướng dẫn này, bạn sẽ học:
Để tận dụng tối đa hướng dẫn NumPy này, bạn nên làm quen với việc viết mã Python. Làm việc thông qua Lộ trình học Python Giới thiệu là một cách tuyệt vời để đảm bảo bạn đã có các kỹ năng cơ bản. Nếu bạn đã quen thuộc với toán học ma trận , thì điều đó chắc chắn cũng sẽ hữu ích. Tuy nhiên, bạn không cần biết bất cứ điều gì về khoa học dữ liệu. Bạn sẽ học được điều đó ở đây. Ngoài ra còn có một kho lưu trữ các mẫu mã NumPy mà bạn sẽ thấy trong suốt hướng dẫn này. Bạn có thể sử dụng nó để tham khảo và thử nghiệm với các ví dụ để xem việc thay đổi mã sẽ thay đổi kết quả như thế nào. Để tải xuống mã, hãy nhấp vào liên kết bên dưới: Chọn NumPy: Lợi íchVì bạn đã biết Python, bạn có thể tự hỏi mình liệu bạn có thực sự phải học một mô hình hoàn toàn mới để làm khoa học dữ liệu hay không. Các Dưới đây là bốn lợi ích hàng đầu mà NumPy có thể mang lại cho mã của bạn:
Vì những lợi ích này, NumPy là tiêu chuẩn thực tế cho mảng đa chiều trong khoa học dữ liệu Python và nhiều thư viện phổ biến nhất được xây dựng dựa trên nó. Học NumPy là một cách tuyệt vời để thiết lập một nền tảng vững chắc khi bạn mở rộng kiến thức của mình sang các lĩnh vực khoa học dữ liệu cụ thể hơn. Cài đặt NumPyĐã đến lúc thiết lập mọi thứ để bạn có thể bắt đầu học cách làm việc với NumPy. Có một số cách khác nhau để thực hiện việc này và bạn không thể làm sai bằng cách làm theo hướng dẫn trên trang web NumPy . Nhưng có một số chi tiết bổ sung cần lưu ý được nêu dưới đây. Bạn cũng sẽ cài đặt Matplotlib . Bạn sẽ sử dụng nó trong một trong các ví dụ sau để khám phá cách các thư viện khác sử dụng NumPy. Sử dụng Repl.it làm Trình chỉnh sửa trực tuyếnNếu bạn chỉ muốn bắt đầu với một số ví dụ, hãy làm theo hướng dẫn này và bắt đầu xây dựng một số bộ nhớ cơ bắp với NumPy, thì Repl.it là một lựa chọn tuyệt vời để chỉnh sửa trong trình duyệt. Bạn có thể đăng ký và kích hoạt môi trường Python trong vài phút. Dọc theo bên trái, có một tab cho các gói. Bạn có thể thêm bao nhiêu tùy thích. Đối với hướng dẫn NumPy này, hãy xem các phiên bản hiện tại của NumPy và Matplotlib. Đây là nơi bạn có thể tìm thấy các gói trong giao diện: May mắn thay, chúng cho phép bạn chỉ cần nhấp chuột và cài đặt. Cài đặt NumPy với AnacondaBản phân phối Anaconda là một bộ công cụ khoa học dữ liệu Python phổ biến được đóng gói xung quanh trình quản lý gói giúp quản lý môi trường ảo và các phụ thuộc dự án của bạn. Nó được xây dựng xung quanh Nếu bạn đã có một quy trình làm việc mà bạn thích sử dụng Sau khi
Điều này sẽ cài đặt những gì bạn cần cho hướng dẫn NumPy này và bạn sẽ sẵn sàng. Cài đặt NumPy với pipMặc dù dự án NumPy khuyên bạn nên sử dụng Dưới đây là các lệnh để thiết lập
Sau đó, hãy đảm bảo rằng môi trường ảo của bạn đã được kích hoạt và tất cả mã của bạn sẽ chạy như mong đợi. Sử dụng IPython, Notebooks hoặc JupyterLabMặc dù các phần trên sẽ cung cấp cho bạn mọi thứ bạn cần để bắt đầu, nhưng có một số công cụ khác mà bạn có thể tùy chọn cài đặt để làm việc trong khoa học dữ liệu thân thiện hơn với nhà phát triển. IPython là một vòng lặp đọc-đánh giá-in (REPL) của Python được nâng cấp giúp việc chỉnh sửa mã trong phiên thông dịch trực tiếp trở nên đơn giản hơn và đẹp hơn. Đây là phiên IPython REPL trông như thế nào: >>>
Nó có một số khác biệt so với một REPL Python cơ bản, bao gồm số dòng của nó, cách sử dụng màu sắc và chất lượng của hình ảnh hóa mảng. Ngoài ra còn có rất nhiều phần thưởng trải nghiệm người dùng giúp việc nhập, nhập lại và chỉnh sửa mã trở nên dễ chịu hơn. Bạn có thể cài đặt IPython dưới dạng độc lập: Ngoài ra, nếu bạn đợi và cài đặt bất kỳ công cụ nào tiếp theo, thì chúng sẽ bao gồm một bản sao của IPython. Một sự thay thế tính năng hơn một chút cho REPL là một sổ ghi chép . Tuy nhiên, sổ ghi chép là một phong cách viết Python hơi khác so với các tập lệnh tiêu chuẩn. Thay vì một tệp Python truyền thống, chúng cung cấp cho bạn một loạt các tập lệnh nhỏ được gọi là các ô mà bạn có thể chạy và chạy lại theo bất kỳ thứ tự nào bạn muốn, tất cả trong cùng một phiên bộ nhớ Python. Một điều thú vị về sổ ghi chép là bạn có thể bao gồm đồ thị và hiển thị các đoạn Markdown giữa các ô, vì vậy chúng thực sự tuyệt vời để viết các phân tích dữ liệu ngay bên trong mã! Đây là những gì nó trông giống như: Sản phẩm máy tính xách tay phổ biến nhất có lẽ là Máy tính xách tay Jupyter , nhưng nteract là một tùy chọn khác bao gồm chức năng của Máy tính xách tay và cố gắng làm cho nó dễ tiếp cận và mạnh mẽ hơn một chút. Tuy nhiên, nếu bạn đang xem Jupyter Notebook và nghĩ rằng nó cần nhiều phẩm chất giống IDE hơn, thì JupyterLab là một lựa chọn khác. Bạn có thể tùy chỉnh trình soạn thảo văn bản, sổ ghi chép, thiết bị đầu cuối và các thành phần tùy chỉnh, tất cả trong giao diện dựa trên trình duyệt. Nó có thể sẽ thoải mái hơn cho những người đến từ MatLab . Đây là phiên bản trẻ nhất trong số các dịch vụ, nhưng bản phát hành 1.0 của nó đã trở lại vào năm 2019, vì vậy nó sẽ ổn định và đầy đủ tính năng. Đây là giao diện trông như thế nào: Cho dù bạn chọn tùy chọn nào, khi bạn đã cài đặt nó, bạn sẽ sẵn sàng chạy những dòng mã NumPy đầu tiên của mình. Đã đến lúc cho ví dụ đầu tiên. |