Cập nhật lần cuối: ngày 9 tháng 8 năm 2022 Pandas trong Python là gì?Pandas là một gói Python nguồn mở được sử dụng rộng rãi nhất để phân tích dữ liệu/phân tích dữ liệu và các tác vụ học máy. Nó được xây dựng trên đỉnh của một gói khác có tên Numpy, cung cấp hỗ trợ cho các mảng đa chiều. Là một trong những gói gây tranh cãi dữ liệu phổ biến nhất, Pandas hoạt động tốt với nhiều mô -đun khoa học dữ liệu khác bên trong hệ sinh thái Python và thường được đưa vào mỗi phân phối Python, từ các phân phối đi kèm với hệ điều hành của bạn đến các nhà cung cấp thương mại như ActiveState's ActivePython. & NBSPSPS ;ActivePython. Bạn có thể làm gì với DataFrames bằng cách sử dụng gấu trúc?Pandas làm cho việc thực hiện nhiều nhiệm vụ tốn thời gian, lặp đi lặp lại liên quan đến việc làm việc với dữ liệu, bao gồm: bao gồm: bao gồm: bao gồm: bao gồm: bao gồm:
Trên thực tế, với gấu trúc, bạn có thể làm mọi thứ làm cho các nhà khoa học dữ liệu hàng đầu thế giới bỏ phiếu cho gấu trúc là công cụ phân tích dữ liệu và thao tác tốt nhất có sẵn. Với loạt bài này, chúng tôi sẽ thông qua việc đọc một số dữ liệu, phân tích nó, thao túng nó và cuối cùng lưu trữ nó. Đây là tất cả những điều mà bạn có thể được thực hiện với Thư viện Pandas. Có nhiều chức năng hơn có thể được khám phá nhưng điều đó chỉ cần mất quá nhiều thời gian và đối với những người quan tâm đến thư viện và muốn đi sâu hơn vào tài liệu cho nó là một khởi đầu tuyệt vời: https: //pandas.pydata. org/docs/user_guide/index.html#hướng dẫn người dùnghttps://pandas.pydata.org/docs/user_guide/index.html#user-guide Với nguồn gốc sâu thẳm trong nguồn mở, và là thành viên sáng lập của Quỹ Python, Activeestate đã tích cực đóng góp cho cộng đồng Python. Chúng tôi cung cấp sự tiện lợi, bảo mật và hỗ trợ mà doanh nghiệp của bạn cần trong khi tương thích với phân phối nguồn mở của Python. Tải xuống ActiveState Python để bắt đầu hoặc liên hệ với chúng tôi để tìm hiểu thêm về việc sử dụng Python ActiveState trong tổ chức của bạn. to get started or contact us to learn more about using ActiveState Python in your organization. Đừng nhầm lẫn với Pandas, hệ thống quản lý lưu trữ Úc được sử dụng cho kho lưu trữ Pandora. gấu trúc
Pandas là một thư viện phần mềm được viết cho ngôn ngữ lập trình Python để thao tác và phân tích dữ liệu. [2] Cụ thể, nó cung cấp các cấu trúc dữ liệu và hoạt động để thao tác các bảng số và chuỗi thời gian. Nó là phần mềm miễn phí được phát hành theo giấy phép BSD ba điều khoản. [3] Tên này có nguồn gốc từ thuật ngữ "dữ liệu bảng", một thuật ngữ kinh tế lượng cho các bộ dữ liệu bao gồm các quan sát trong nhiều khoảng thời gian cho cùng một cá nhân. [4] Tên của nó là một vở kịch trên cụm từ "Phân tích dữ liệu Python". [5] Wes McKinney bắt đầu xây dựng những gì sẽ trở thành gấu trúc tại AQR Capital khi ông là một nhà nghiên cứu ở đó từ năm 2007 đến 2010. [6] is a software library written for the Python programming language for data manipulation and analysis.[2] In particular, it offers data structures and operations for manipulating numerical tables and time series. It is free software released under the three-clause BSD license.[3] The name is derived from the term "panel data", an econometrics term for data sets that include observations over multiple time periods for the same individuals.[4] Its name is a play on the phrase "Python data analysis" itself.[5] Wes McKinney started building what would become pandas at AQR Capital while he was a researcher there from 2007 to 2010.[6] Các tính năng thư viện [Chỉnh sửa][edit]
Thư viện được tối ưu hóa cao cho hiệu suất, với các đường dẫn mã quan trọng được viết bằng Cython hoặc C. [8] DataFrames[edit][edit]Pandas chủ yếu được sử dụng để phân tích dữ liệu và thao tác liên quan đến dữ liệu bảng trong các khung dữ liệu. Pandas cho phép nhập dữ liệu từ các định dạng tệp khác nhau như các giá trị được phân tách bằng dấu phẩy, JSON, bảng điều khiển, bảng cơ sở dữ liệu SQL hoặc truy vấn và Microsoft Excel. [9] Pandas cho phép các hoạt động thao tác dữ liệu khác nhau như hợp nhất, [10] định hình lại, [11] chọn, [12] cũng như làm sạch dữ liệu và các tính năng gây tranh cãi dữ liệu. Sự phát triển của gấu trúc được giới thiệu thành Python nhiều tính năng tương đương khi làm việc với các khung dữ liệu được thiết lập trong ngôn ngữ lập trình R. Thư viện PANDAS được xây dựng trên một thư viện khác Numpy, được định hướng để làm việc hiệu quả với các mảng thay vì các tính năng làm việc trên DataFrames. History[edit][edit]Nhà phát triển Wes McKinney bắt đầu làm việc trên Gandas vào năm 2008 trong khi tại AQR Capital Management vì nhu cầu về một công cụ linh hoạt, hiệu suất cao để thực hiện phân tích định lượng trên dữ liệu tài chính. Trước khi rời AQR, anh ta đã có thể thuyết phục ban quản lý cho phép anh ta mở nguồn thư viện. Một nhân viên AQR khác, Chang She, đã tham gia nỗ lực vào năm 2012 với tư cách là người đóng góp chính thứ hai cho thư viện. Vào năm 2015, Pandas đã ký hợp đồng với tư cách là một dự án được tài trợ bởi Numf Focus, một tổ chức từ thiện phi lợi nhuận 501 (c) (3) tại Hoa Kỳ. [13] Timeline:[14][edit][edit]
Xem thêm [sửa][edit]
References[edit][edit]
Đọc thêm [Chỉnh sửa][edit]
Liên kết bên ngoài [Chỉnh sửa][edit]
Tại sao chúng ta sử dụng gấu trúc trong Python?Pandas là một thư viện Python để phân tích dữ liệu.Bắt đầu bởi Wes McKinney vào năm 2008 vì nhu cầu về một công cụ phân tích định lượng mạnh mẽ và linh hoạt, Pandas đã phát triển thành một trong những thư viện Python phổ biến nhất.Nó có một cộng đồng đóng góp cực kỳ tích cực.for data analysis. Started by Wes McKinney in 2008 out of a need for a powerful and flexible quantitative analysis tool, pandas has grown into one of the most popular Python libraries. It has an extremely active community of contributors.
Pandas là gì và việc sử dụng gấu trúc là gì?Pandas là gì?Pandas là một thư viện Python được sử dụng để làm việc với các bộ dữ liệu.Nó có các chức năng để phân tích, làm sạch, khám phá và thao tác dữ liệu.Tên "Pandas" có một tham chiếu đến cả "dữ liệu bảng" và "phân tích dữ liệu Python" và được Wes McKinney tạo ra vào năm 2008.a Python library used for working with data sets. It has functions for analyzing, cleaning, exploring, and manipulating data. The name "Pandas" has a reference to both "Panel Data", and "Python Data Analysis" and was created by Wes McKinney in 2008. |