Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Python là một ngôn ngữ lập trình cấp cao và đa năng với các gói khoa học dữ liệu và máy học. Sử dụng video dưới đây để cài đặt trên Windows, MacOS hoặc Linux. Bước đầu tiên, cài đặt Python cho Windows, MacOS hoặc Linux.

Cài đặt các gói Python

Sức mạnh của Python nằm trong các gói có sẵn thông qua các nhà quản lý gói PIP hoặc Conda. Trang này là một cái nhìn tổng quan về một số gói tốt nhất để học máy và khoa học dữ liệu và cách cài đặt chúng.

Chúng tôi sẽ khám phá các gói Python thường được sử dụng cho khoa học dữ liệu và học máy. Bạn có thể cần cài đặt các gói từ thiết bị đầu cuối, lời nhắc Anaconda, dấu nhắc lệnh hoặc từ máy tính xách tay Jupyter. Nếu bạn có nhiều phiên bản Python hoặc có các phụ thuộc cụ thể thì hãy sử dụng Trình quản lý môi trường như PyenV. Đối với hầu hết người dùng, một cài đặt duy nhất thường là đủ. Trình quản lý gói Python PIP có tất cả các gói (như Gekko) mà chúng tôi cần cho khóa học này. Nếu có lỗi truy cập quản trị, hãy cài đặt vào cấu hình cục bộ bằng cờ --USer.pyenv. For most users, a single installation is typically sufficient. The Python package manager pip has all of the packages (such as gekko) that we need for this course. If there is an administrative access error, install to the local profile with the --user flag.

Cài đặt phương pháp #1

Cài đặt phương pháp #2

Các gói được cài đặt từ tập lệnh Python mặc dù điều này không được khuyến khích.

Từ Pip._Internal Nhập chính dưới dạng Pipmain Pipmain (['Cài đặt', 'Gekko'])) pip._internal import main as pipmain
pipmain(['install','gekko'])

Danh sách các số phiên bản gói

Nhiều mô-đun được đóng gói sẵn với các bản phân phối như Anaconda. Liệt kê các gói và số phiên bản hiện tại.

   Package                            Version
   ---------------------------------- -------------------
   anaconda-client                    1.7.2
   anaconda-navigator                 1.10.0
   anaconda-project                   0.8.3
   beautifulsoup4                     4.9.3
   conda                              4.9.2
   gekko                              1.0.4

Các gói bổ sung để trực quan hóa, khoa học dữ liệu và học máy được liệt kê dưới đây.


Súp đẹp

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Súp đẹp là gói Python để trích xuất thông tin (cạo) từ các trang web. Nó sử dụng trình phân tích cú pháp HTML hoặc XML (LXML) và các chức năng để lặp, tìm kiếm và sửa đổi cây phân tích.

pip cài đặt đẹp lxmlinstall beautifulsoup4 lxml


GEKKO

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Gekko cung cấp một giao diện cho các bộ giải dựa trên gradient để học máy và tối ưu hóa các phương trình hỗn hợp, phương trình đại số khác biệt và các mô hình chuỗi thời gian. Gekko cung cấp các dẫn xuất chính xác và thứ hai chính xác thông qua sự khác biệt tự động và phân biệt với các phương pháp đồng thời hoặc tuần tự.

Keras

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Keras cung cấp một giao diện cho các mạng thần kinh nhân tạo. Keras hoạt động như một giao diện cho thư viện TensorFlow. Các gói phụ trợ khác được hỗ trợ cho đến phiên bản 2.4. TensorFlow hiện là phụ trợ duy nhất và được cài đặt riêng với PIP Cài đặt TensorFlow.pip install tensorflow.

Matplotlib

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Gói matplotlib tạo ra các lô trong Python.

Numpy

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Numpy là một gói điện toán số cho toán học, khoa học và kỹ thuật. Nhiều gói khoa học dữ liệu sử dụng Numpy như một sự phụ thuộc.

OpenCV

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

OpenCV (Thư viện tầm nhìn máy tính nguồn mở) là một gói cho tầm nhìn máy tính thời gian thực và được phát triển với sự hỗ trợ từ Intel Research.

PIP Cài đặt OpenCV-Pythoninstall opencv-python

Gấu trúc

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Pandas trực quan hóa và thao tác các bảng dữ liệu. Có nhiều chức năng cho phép thao tác hiệu quả cho các bước sơ bộ của các vấn đề phân tích dữ liệu.

Pandas-Profiling

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Hồ sơ gấu trúc tạo ra phân tích chi tiết hơn so với chức năng mô tả gấu trúc. Tiện ích mở rộng tiện ích cần được bật như một phần của cài đặt này để sử dụng các báo cáo Widget là kết quả tương tác trong sổ ghi chép Python.

PIP Cài đặt Pandas-Profiling [Notebook] Jupyter Nbextension cho phép-Py WidgetSnBextensioninstall pandas-profiling[notebook]
jupyter nbextension enable --py widgetsnbextension

Âm mưu

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Lô đất kết xuất các sơ đồ tương tác với HTML và JavaScript. Plotly Express được bao gồm với cốt truyện.

Pytorch

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Pytorch cho phép học sâu, tầm nhìn máy tính và xử lý ngôn ngữ tự nhiên. Phát triển được dẫn dắt bởi Phòng thí nghiệm nghiên cứu AI của Facebook (FAIR).

Scikit-Learn

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Scikit-learn (hoặc Sklearn) bao gồm nhiều loại phân loại, hồi quy và thuật toán phân cụm bao gồm mạng lưới thần kinh, máy vectơ hỗ trợ, rừng ngẫu nhiên, tăng cường độ dốc, phân cụm K-MEAN và các phương pháp học tập có giám sát hoặc không giám sát khác.

Scipy

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Scipy là một gói đa năng cho toán học, khoa học và kỹ thuật và mở rộng các khả năng cơ bản của Numpy.

SeaBall

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Seaborn được xây dựng trên matplotlib và tạo ra các lô chi tiết trong một vài dòng mã.

StatSmodels

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

StatSmodels là một gói để khám phá dữ liệu, ước tính các mô hình thống kê và thực hiện các bài kiểm tra thống kê. Nó bao gồm thống kê mô tả, kiểm tra thống kê, các chức năng vẽ đồ thị và thống kê kết quả.

Phòng thí nghiệm kiểm soát nhiệt độ

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Phòng thí nghiệm kiểm soát nhiệt độ được sử dụng trong suốt khóa học cho các hoạt động thực hành như các mô-đun khoa học dữ liệu và học tập dữ liệu. Dữ liệu cũng có thể được tạo từ một trình giả lập song sinh kỹ thuật số nếu một thiết bị TCLAB không được kết nối. Sử dụng tclabmodel để tạo dữ liệu mô phỏng ở bất cứ nơi nào TCLAB được sử dụng để kết nối Python với phòng thí nghiệm vật lý.TCLabModel to generate simulated data wherever TCLab is used to connect Python to the physical lab.

Tensorflow

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Tensorflow là một nền tảng học máy nguồn mở, đặc biệt tập trung vào đào tạo và suy luận của các mạng thần kinh sâu. Phát triển được dẫn dắt bởi nhóm Google Brain.

XGBOOST

Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

XGBOOST là một nguồn mở trong Python và các nền tảng khoa học dữ liệu khác để tăng độ dốc. Các tính năng độc đáo bao gồm hình phạt cây, thu hẹp nút lá tỷ lệ, tăng cường newton và kiến ​​trúc điện toán có thể mở rộng. Nó thường là công cụ lựa chọn các đội chiến thắng cho các cuộc thi học tập của Kaggle Machine.


Hướng dẫn what packages to install for python data science? - những gói nào để cài đặt cho khoa học dữ liệu python?

Tôi nên cài đặt các gói nào với Python?

Top 10 gói Python mỗi nhà phát triển nên học..
#1 Numpy. Bạn có thể thực hiện các hoạt động toán học cơ bản mà không cần bất kỳ gói Python đặc biệt nào. ....
#2 Con lắc. ....
#3 Thư viện hình ảnh Python. ....
#4 phim. ....
#5 yêu cầu. ....
#7 Pyqt. ....
#9 Pywin32. ....
#10 pytest ..

Các gói được sử dụng cho khoa học dữ liệu là gì?

Đối với khoa học dữ liệu nói riêng, Numpy là nền tảng cho nhiều gói khác nắm giữ hệ sinh thái khoa học dữ liệu như gấu trúc, matplotlib và scikit-learn.Pandas, Matplotlib and Scikit-learn.

Tôi nên cài đặt gì cho khoa học dữ liệu?

Chúng tôi thực sự khuyên bạn nên cài đặt phân phối Anaconda, bao gồm Python, Jupyter Notebook (một IDE nhẹ rất phổ biến đối với các nhà khoa học dữ liệu) và tất cả các thư viện chính.Đó là điều gần nhất với một cửa một cửa cho tất cả các nhu cầu thiết lập của bạn.Anaconda Distribution, which includes Python, Jupyter Notebook (a lightweight IDE very popular among data scientists), and all the major libraries. It's the closest thing to a one-stop-shop for all your setup needs.

Làm cách nào để cài đặt Python cho khoa học dữ liệu?

Đây là cách để thiết lập máy của bạn đúng cách ...
Cài đặt Anaconda.....
Tải xuống và cài đặt các gói phổ biến cho khoa học dữ liệu trong Python.....
Chạy máy tính xách tay Jupyter!....
Để dừng máy tính xách tay Jupyter: ....
Để lại môi trường hướng dẫn (với tất cả các gói vui nhộn của chúng tôi) và quay lại môi trường bình thường của bạn:.