Bài viết này sẽ rất hữu ích cho các độc giả đang tìm kiếm một điểm dừng đọc cho tất cả các mã thao tác dữ liệu và cú pháp. Trong bài viết này, thư viện Pandas đã được sử dụng để thao tác dữ liệu. Pandas là một công cụ phân tích dữ liệu Python phổ biến. Nó cung cấp các cấu trúc dữ liệu dễ sử dụng và hiệu quả cao. Các cấu trúc dữ liệu này liên quan đến dữ liệu số hoặc được dán nhãn, được lưu trữ dưới dạng bảng.
Các chủ đề được đề cập trong bài viết này:
1. Bộ dữ liệu
Bán hàng tại nhà của Hoa Kỳ, 1963 Từ2016: Dữ liệu quốc gia và khu vực về số lượng nhà ở một gia đình mới được bán và bán. Cũng cung cấp dữ liệu quốc gia về giá trung bình và trung bình, số lượng nhà được bán và bán theo giai đoạn xây dựng và các số liệu thống kê khác. Từ điều tra dân số Hoa Kỳ, các chỉ số chuỗi thời gian kinh tế. Dữ liệu được cung cấp bởi Enigma.io từ Bộ Thương mại Hoa Kỳ.
Bộ dữ liệu có 20.404 hàng và 20 cột.
2. Đưa dữ liệu của bạn vào một khung dữ liệu
Tải DataFrame từ tệp CSV
df = pd.read_csv(‘file.csv’)df = pd.read_csv(‘file.csv’, header=0, index_col=0, quotechar=’”’,sep=’:’, na_values = [‘na’, ‘-‘, ‘.’, ‘’])3. Lưu một khung dữ liệu
Lưu DataFrame vào tệp CSV
df.to_csv(‘name.csv’, encoding=’utf-8')Lưu một khung dữ liệu vào từ điển Python
dictionary = df.to_dict()Lưu một khung dữ liệu vào chuỗi python
string = df.to_string()4. Làm việc với toàn bộ khung dữ liệu
Nhìn vào nội dung DataFrame
df.info()Tóm tắt số liệu thống kê cột
df.describe()Cái đầu
df.head(n)Cái đuôi
df.tail(n)Hình dạng (Count Row, Cột số)
df.shape5. Làm việc với các hàng - Phần 1
Giữ hàng
df = df[df['cat_code']== 'SOLD']Thả hàng
df.to_csv(‘name.csv’, encoding=’utf-8')0Thả giá trị NULL (NAN)
df.to_csv(‘name.csv’, encoding=’utf-8')16. Làm việc với các cột - Phần 1
Thả cột
df.to_csv(‘name.csv’, encoding=’utf-8')2Giữ cột
df.to_csv(‘name.csv’, encoding=’utf-8')3Thêm các cột mới vào DataFrame
df.to_csv(‘name.csv’, encoding=’utf-8')47. Các chức năng do người dùng xác định
Tạo một cột mới bằng cách sử dụng các chức năng
df.to_csv(‘name.csv’, encoding=’utf-8')58. Bộ dữ liệu làm sạch
Tạo ba bộ dữ liệu
df.to_csv(‘name.csv’, encoding=’utf-8')6Giữ cột
df.to_csv(‘name.csv’, encoding=’utf-8')7Thêm các cột mới vào DataFrame
df.to_csv(‘name.csv’, encoding=’utf-8')87. Các chức năng do người dùng xác định
Tạo một cột mới bằng cách sử dụng các chức năng
df.to_csv(‘name.csv’, encoding=’utf-8')9df.to_csv(‘name.csv’, encoding=’utf-8')5
dictionary = df.to_dict()08. Bộ dữ liệu làm sạch
Tạo ba bộ dữ liệu
dictionary = df.to_dict()1Đổi tên cột
dictionary = df.to_dict()29. Tham gia/kết hợp DataFrames và Groupby
dictionary = df.to_dict()3Hợp nhất trên các cột
dictionary = df.to_dict()4Nhóm - Áp dụng chức năng tổng hợp
dictionary = df.to_dict()510. Đồ thị và thống kê
Biểu đồ dòng đơn
Đồ thị nhiều dòngTương quan
dictionary = df.to_dict()7Định lượng
dictionary = df.to_dict()8Biểu đồ
11. Làm việc với các hàng - Phần 2
dictionary = df.to_dict()9Sắp xếp các giá trị hàng dataFrame
string = df.to_string()0dictionary = df.to_dict()6
string = df.to_string()1Sắp xếp DataFrame theo chỉ mục hàng của nó
string = df.to_string()2Chọn một lát hàng theo vị trí số nguyên
string = df.to_string()312. Làm việc với các cột - Phần 2
Tìm nhãn chỉ mục cho các giá trị tối đa/tối đa trong cột
string = df.to_string()4Toán học trên toàn bộ khung dữ liệu
string = df.to_string()5Các phương pháp toàn cột phổ biến
string = df.to_string()6Các phương pháp phần tử thông thường phổ biến
string = df.to_string()7Áp dụng các chức năng toán học vô dụng cho các cột
string = df.to_string()813. Làm việc với các tế bào
Chọn một ô theo nhãn và cột cột
string = df.to_string()9Đặt một ô theo nhãn và cột cột
df.info()0Chọn và cắt trên nhãn
df.info()1Chọn hàng
df.info()2Chọn cột
df.info()314. Làm việc với các giá trị và chuỗi bị thiếu
df.info()4Thả tất cả các hàng với Nan
df.info()5Thả tất cả các cột với NAN
Thả tất cả các hàng nơi Nan xuất hiện nhiều hơn hai lần
df.info()6Cái đầu
df.info()7Cái đuôi
df.info()8