Hướng dẫn dùng dataframe rename python

Bạn có thể thay đổi tên cột của gấu trúc DataFrame bằng cách sử dụng phương thức DataFrame.rename () và phương thức DataFrame.columns (). Trong bài viết này, tôi sẽ giải thích cách thay đổi tên cột đã cho của Pandas DataFrame bằng các ví dụ.

Nội dung chính

  • 1. Ví dụ nhanh về thay đổi tên cột
  • 2. Sử dụng phương thức DataFrame.rename ()
  • 3. Thay đổi cột bằng phương pháp DataFrame.columns
  • 4. Cập nhật tất cả tên cột
  • 5. Sử dụng phương thức DataFrame.column.str.replace ()
  • 6. Tăng lỗi khi cột không tồn tại
  • 7. Hoàn thành các ví dụ về thay đổi tên cột của gấu trúc
  • Sự kết luận
  • Bạn cũng có thể thích
  • Người giới thiệu

Nội dung chính

  • 1. Ví dụ nhanh về thay đổi tên cột
  • 2. Sử dụng phương thức DataFrame.rename ()
  • 3. Thay đổi cột bằng phương pháp DataFrame.columns
  • 4. Cập nhật tất cả tên cột
  • 5. Sử dụng phương thức DataFrame.column.str.replace ()
  • 6. Tăng lỗi khi cột không tồn tại
  • 7. Hoàn thành các ví dụ về thay đổi tên cột của gấu trúc
  • Sự kết luận
  • Bạn cũng có thể thích
  • Người giới thiệu
  • Sử dụng hàm pandas DataFrame.rename () để sửa đổi các tên cột cụ thể.
  • Đặt DataFrame columns thuộc tính cho danh sách tên cột mới của bạn.
  • 1. Ví dụ nhanh về thay đổi tên cột
  • 2. Sử dụng phương thức DataFrame.rename ()
  • 3. Thay đổi cột bằng phương pháp DataFrame.columns
  • 4. Cập nhật tất cả tên cột
  • 5. Sử dụng phương thức DataFrame.column.str.replace ()
  • 6. Tăng lỗi khi cột không tồn tại
  • 7. Hoàn thành các ví dụ về thay đổi tên cột của gấu trúc
    • Sự kết luận
    • Bạn cũng có thể thích
    • Người giới thiệu

1. Ví dụ nhanh về thay đổi tên cột

Nếu bạn đang vội, dưới đây là một số ví dụ nhanh để thay đổi tên cột cụ thể trên DataFrame.


# Below are some quick examples.
# Syntax to change column name using rename() function.
df.rename(columns={"OldName":"NewName"})

# Using rename() function.
df.rename(columns = {'Fee': 'Fees'}, inplace = True)  

# Renaming Multiple columns.
df.rename({'Courses': 'Course_ Name','Fee': 'CourseFee', 'Duration': 'CourseDuration'}, 
          axis = "columns", inplace = True)  

# Changing Column Attribute.
df.columns.values[0] = 'Course'

# errors parameter to 'raise' when column not present.
df2 = df.rename(columns={'Courses': 'EmpCourses'},errors="raise") 

Bây giờ, hãy tạo một Pandas DataFrame với một vài hàng và cột, đồng thời thực thi một số ví dụ và xác nhận kết quả. DataFrame của chúng tôi chứa các tên cột Courses, FeeDiscount.


# Create a Pandas DataFrame.
import pandas as pd
import numpy as np
technologies= {
    'Courses':["Spark","PySpark","Spark","Python","PySpark"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days','35days','60days']
          }
df = pd.DataFrame(technologies)
print(df)

Sản lượng thấp hơn sản lượng.


   Courses    Fee Duration
0    Spark  22000   30days
1  PySpark  25000   50days
2    Spark  23000   30days
3   Python  24000   35days
4  PySpark  26000   60days

2. Sử dụng phương thức DataFrame.rename ()

Hàm pandas DataFrame.rename () là một hàm khá linh hoạt được sử dụng không chỉ để đổi tên các tên cột mà còn cả các chỉ số hàng. Điều tốt về chức năng này là bạn có thể đổi tên các cột cụ thể. Cú pháp để thay đổi tên cột bằng cách sử dụng hàm đổi tên là-


# Syntax to change column name using rename() function.
df.rename(columns={"OldName":"NewName"})

Các rename() trả về một DataFrame mới với các nhãn trục được đổi tên (tức là các cột hoặc hàng được đổi tên tùy thuộc vào cách sử dụng). Để sửa đổi DataFrame tại chỗ, hãy đặt đối số inplace đến True.


# Using rename() function.
df.rename(columns = {'Fee': 'Fees'}, inplace = True)       
print(df)

Sản lượng thấp hơn sản lượng.


   Courses   Fees Duration
0    Spark  22000   30days
1  PySpark  25000   50days
2    Spark  23000   30days
3   Python  24000   35days
4  PySpark  26000   60days

3. Thay đổi cột bằng phương pháp DataFrame.columns

Bạn cũng có thể cập nhật cột DataFrame bằng cách đặt columns thuộc tính cho danh sách cột mới của bạn. Truy cập chỉ mục để thay đổi tên cột được chỉ định.


# Changing Column Attribute.
df.columns.values[0] = 'Course'
print(df)

Sản lượng thấp hơn sản lượng.


    Course    Fee Duration
0    Spark  22000   30days
1  PySpark  25000   50days
2    Spark  23000   30days
3   Python  24000   35days
4  PySpark  26000   60days

4. Cập nhật tất cả tên cột

Trong phần này, các tên cột được cập nhật dưới dạng danh sách để đổi tên các cột. Độ dài của danh sách mà chúng tôi cung cấp phải là tương tự là số cột trong DataFrame. Nếu không, một lỗi xảy ra. Ví dụ-


# Using new list of column names
df.columns = technologies
print(df)

Sản lượng thấp hơn sản lượng.


   Courses    Fee Duration
0    Spark  22000   30days
1  PySpark  25000   50days
2    Spark  23000   30days
3   Python  24000   35days
4  PySpark  26000   60days

5. Sử dụng phương thức DataFrame.column.str.replace ()

Nếu số lượng cột trong Pandas DataFrame là rất lớn, gần 100 và chúng tôi muốn thay thế khoảng trắng trong tất cả các tên cột (nếu nó tồn tại) bằng một dấu gạch dưới và không dễ dàng để cung cấp một danh sách hoặc từ điển để đổi tên tất cả. Các cột. Sau đó, chúng tôi sử dụng phương pháp sau-


# Using DataFrame.column.str.replace() Method.
df2 = df.columns.str.replace(' ', '_')
print(df2)

Sản lượng thấp hơn sản lượng.


Index(['Courses', 'Fee', 'Duration'], dtype="object")

6. Tăng lỗi khi cột không tồn tại

Khi cột bạn muốn thay đổi không tồn tại, thì không có lỗi nào được đưa ra theo mặc định. sử dụng tham số nâng cao để tăng lỗi.


# errors parameter to 'raise'.
df2 = df.rename(columns={'Courses': 'EmpCourses'},errors="raise") 
print(df2)

Sản lượng đầu ra tương tự như trên.

7. Hoàn thành các ví dụ về thay đổi tên cột của gấu trúc


# Below are complete examples.
# Create a Pandas DataFrame.
import pandas as pd
import numpy as np
technologies= {
    'Courses':["Spark","PySpark","Spark","Python","PySpark"],
    'Fee' :[22000,25000,23000,24000,26000],
    'Duration':['30days','50days','30days','35days','60days']
          }
df = pd.DataFrame(technologies)
print(df)

# Syntax to change column name using rename() function.
df.rename(columns={"OldName":"NewName"})
print(df)

# Using rename() function.
df.rename(columns = {'Fee': 'Fees'}, inplace = True)  
print(df)

# Renaming Multiple columns.
df.rename({'Courses': 'Course_ Name','Fee': 'CourseFee', 'Duration': 'CourseDuration'}, 
          axis = "columns", inplace = True)  
print(df)

# Change column name using rename() and lambda function.
df2 = df.rename(columns = lambda x: x+':')
print(df2)

# Changing Column Attribute.
df.columns.values[0] = 'Course'
print(df)

# Using new list of column names
df.columns = technologies
print(df)

# Using DataFrame.column.str.replace() Method.
df2 = df.columns.str.replace(' ', '_')
print(df2)

# NO Error is raised.
df2 = df.rename(columns={'Courses': 'EmpCourses'})
print(df2)

# errors parameter to 'raise'.
df2 = df.rename(columns={'Courses': 'EmpCourses'},errors="raise") 
print(df2)

Sự kết luận

Trong bài viết này, bạn đã tìm hiểu về cách thay đổi tên cột cụ thể của Pandas DataFrame bằng cách sử dụng DataFrame.rename() phương pháp và thuộc tính DataFrame.column vài ví dụ.

Bạn cũng có thể thích

Người giới thiệu