Hướng dẫn how do i change text in a dataframe in python? - làm cách nào để thay đổi văn bản trong khung dữ liệu trong python?

Sử dụng phương pháp

df['range'].replace(',','-',inplace=True)
6
df['range'].replace(',','-',inplace=True)
7:

df['range'] = df['range'].str.replace(',','-')

df
      range
0    (2-30)
1  (50-290)

Chỉnh sửa: Vì vậy, nếu chúng tôi nhìn vào những gì bạn đã thử và tại sao nó không hoạt động: so if we look at what you tried and why it didn't work:

df['range'].replace(',','-',inplace=True)

Từ các tài liệu chúng tôi thấy mô tả này:

str hoặc regex: str: chuỗi khớp chính xác với_replace sẽ được thay thế bằng giá trị

Vì vậy, vì các giá trị STR không khớp, không có sự thay thế xảy ra, so sánh với các điều sau:

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object

Ở đây chúng tôi nhận được một trận đấu chính xác trên hàng thứ hai và sự thay thế xảy ra.

Bạn có thể thay thế một chuỗi trong cột DataFrame của Pandas bằng cách sử dụng thay thế (),

df['range'].replace(',','-',inplace=True)
8 bằng các hàm
df['range'].replace(',','-',inplace=True)
9. Trong bài viết này, tôi sẽ giải thích cách thay thế chuỗi của cột DataFrame bằng nhiều ví dụ.

  • Thay thế một chuỗi bằng một chuỗi khác trong gấu trúc.
  • Thay thế một mẫu chuỗi bằng một chuỗi khác bằng cách sử dụng biểu thức thông thường.

1. Ví dụ nhanh để thay thế chuỗi trong DataFrame

Nếu bạn vội vàng dưới đây là một số ví dụ về cách thay thế một chuỗi trong gấu trúc DataFrame.


# Below are some quick examples.
# Replace string using DataFrame.replace() method.
df2 = df.replace('Py','Python with ', regex=True)

# Replace pattern of string using regular expression.
df2 = df.replace({'Courses': 'Py', 'Duration': 'days'}, 
    {'Courses': 'Python with', 'Duration': ' Days'}, regex=True)

# Replace pattern of string using regular expression.
df2=df.replace(regex=['Language'],value='Lang')

# By using str.replace()
df['Courses'] = df['Courses'].str.replace('Language','Lang')

# Replace String using apply() function with lambda.
df2 = df.apply(lambda x: x.replace({'Py':'Python with', 'Language':'Lang'}, regex=True))

Bây giờ, hãy để Lôi tạo một khung dữ liệu gấu trúc với một vài hàng và cột, thực hiện các ví dụ này và xác nhận kết quả. DataFrame của chúng tôi chứa tên cột & nbsp; ________ 20, & nbsp; ________ 21 và

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
2.


# Create a pandas DataFrame.
import pandas as pd
import numpy as np
technologies= {
    'Courses':["Spark","PySpark","Spark","Java Language","PySpark","PHP Language"],
    'Fee' :[22000,25000,23000,24000,26000,27000],
    'Duration':['30days','50days','30days','60days','35days','30days']
          }
df = pd.DataFrame(technologies)
print(df)

Năng suất dưới đầu ra.


         Courses    Fee Duration
0          Spark  22000   30days
1        PySpark  25000   50days
2          Spark  23000   30days
3  Java Language  24000   60days
4        PySpark  26000   35days
5   PHP Language  27000   30days

2. Pandas thay thế ví dụ chuỗi

Bạn có thể thay thế chuỗi của cột DataFrame Pandas bằng một chuỗi khác bằng cách sử dụng phương thức dataFrame.replace (). Phương thức này & NBSP; cập nhật giá trị được chỉ định với một giá trị được chỉ định khác và trả về DataFrame mới. Để cập nhật trên DataFrame hiện có

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
3


# Replace string using DataFrame.replace() method.
df2 = df.replace('PySpark','Python with Spark')
print(df2)

Năng suất dưới đầu ra. Ví dụ này thay thế chuỗi

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
4 bằng
df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
5.


             Courses    Fee Duration
0              Spark  22000   30days
1  Python with Spark  25000   50days
2              Spark  23000   30days
3      Java Language  24000   60days
4  Python with Spark  26000   35days
5       PHP Language  27000   30days

3. Thay thế nhiều chuỗi

Bây giờ, hãy để xem cách thay thế (các) cột nhiều chuỗi, trong ví dụ này, tôi cũng sẽ chỉ ra cách thay thế một phần của chuỗi bằng cách sử dụng param

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
6. Để cập nhật nhiều cột chuỗi, hãy sử dụng Dict với cặp giá trị khóa. Ví dụ dưới đây cập nhật
df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
7 với
df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
8 với cột
df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
0 và

# Below are some quick examples.
# Replace string using DataFrame.replace() method.
df2 = df.replace('Py','Python with ', regex=True)

# Replace pattern of string using regular expression.
df2 = df.replace({'Courses': 'Py', 'Duration': 'days'}, 
    {'Courses': 'Python with', 'Duration': ' Days'}, regex=True)

# Replace pattern of string using regular expression.
df2=df.replace(regex=['Language'],value='Lang')

# By using str.replace()
df['Courses'] = df['Courses'].str.replace('Language','Lang')

# Replace String using apply() function with lambda.
df2 = df.apply(lambda x: x.replace({'Py':'Python with', 'Language':'Lang'}, regex=True))
0 với

# Below are some quick examples.
# Replace string using DataFrame.replace() method.
df2 = df.replace('Py','Python with ', regex=True)

# Replace pattern of string using regular expression.
df2 = df.replace({'Courses': 'Py', 'Duration': 'days'}, 
    {'Courses': 'Python with', 'Duration': ' Days'}, regex=True)

# Replace pattern of string using regular expression.
df2=df.replace(regex=['Language'],value='Lang')

# By using str.replace()
df['Courses'] = df['Courses'].str.replace('Language','Lang')

# Replace String using apply() function with lambda.
df2 = df.apply(lambda x: x.replace({'Py':'Python with', 'Language':'Lang'}, regex=True))
1 trên cột
df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
2.


# Replace pattern of string using regular expression.
df2 = df.replace({'Courses': 'Py', 'Duration': 'days'}, 
    {'Courses': 'Python with ', 'Duration': ' Days'}, regex=True)
print(df2)

Năng suất dưới đầu ra.


             Courses    Fee Duration
0              Spark  22000  30 Days
1  Python with Spark  25000  50 Days
2              Spark  23000  30 Days
3      Java Language  24000  60 Days
4  Python with Spark  26000  35 Days
5       PHP Language  27000  30 Days

4. Thay thế mẫu chuỗi bằng cách sử dụng biểu thức thông thường

Sử dụng biểu thức thông thường, bạn có thể thay thế chuỗi khớp bằng một chuỗi khác trong gấu trúc DataFrame. Ví dụ dưới đây tìm chuỗi


# Below are some quick examples.
# Replace string using DataFrame.replace() method.
df2 = df.replace('Py','Python with ', regex=True)

# Replace pattern of string using regular expression.
df2 = df.replace({'Courses': 'Py', 'Duration': 'days'}, 
    {'Courses': 'Python with', 'Duration': ' Days'}, regex=True)

# Replace pattern of string using regular expression.
df2=df.replace(regex=['Language'],value='Lang')

# By using str.replace()
df['Courses'] = df['Courses'].str.replace('Language','Lang')

# Replace String using apply() function with lambda.
df2 = df.apply(lambda x: x.replace({'Py':'Python with', 'Language':'Lang'}, regex=True))
3 và thay thế nó bằng

# Below are some quick examples.
# Replace string using DataFrame.replace() method.
df2 = df.replace('Py','Python with ', regex=True)

# Replace pattern of string using regular expression.
df2 = df.replace({'Courses': 'Py', 'Duration': 'days'}, 
    {'Courses': 'Python with', 'Duration': ' Days'}, regex=True)

# Replace pattern of string using regular expression.
df2=df.replace(regex=['Language'],value='Lang')

# By using str.replace()
df['Courses'] = df['Courses'].str.replace('Language','Lang')

# Replace String using apply() function with lambda.
df2 = df.apply(lambda x: x.replace({'Py':'Python with', 'Language':'Lang'}, regex=True))
4.

df['range'].replace(',','-',inplace=True)
0

Năng suất dưới đầu ra.

df['range'].replace(',','-',inplace=True)
1

2. Pandas thay thế ví dụ chuỗi

Bạn có thể thay thế chuỗi của cột DataFrame Pandas bằng một chuỗi khác bằng cách sử dụng phương thức dataFrame.replace (). Phương thức này & NBSP; cập nhật giá trị được chỉ định với một giá trị được chỉ định khác và trả về DataFrame mới. Để cập nhật trên DataFrame hiện có

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
3

df['range'].replace(',','-',inplace=True)
2

Năng suất dưới đầu ra. Ví dụ này thay thế chuỗi

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
4 bằng
df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
5.

Courses Fee Duration 0 Spark 22000 30days 1 Python with Spark 25000 50days 2 Spark 23000 30days 3 Java Language 24000 60days 4 Python with Spark 26000 35days 5 PHP Language 27000 30days

3. Thay thế nhiều chuỗi

df['range'].replace(',','-',inplace=True)
3

Năng suất dưới đầu ra.

df['range'].replace(',','-',inplace=True)
4

2. Pandas thay thế ví dụ chuỗi

df['range'].replace(',','-',inplace=True)
5

Bạn có thể thay thế chuỗi của cột DataFrame Pandas bằng một chuỗi khác bằng cách sử dụng phương thức dataFrame.replace (). Phương thức này & NBSP; cập nhật giá trị được chỉ định với một giá trị được chỉ định khác và trả về DataFrame mới. Để cập nhật trên DataFrame hiện có df = pd.DataFrame({'range':['(2,30)',',']}) df['range'].replace(',','-', inplace=True) df['range'] 0 (2,30) 1 - Name: range, dtype: object 3

Năng suất dưới đầu ra. Ví dụ này thay thế chuỗi

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
4 bằng
df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object
5.

Những bài viết liên quan

  • Thay đổi đối tượng chuỗi cho đến ngày trong gấu trúc DataFrame
  • Đếm (riêng biệt) tương đương SQL trong Pandas DataFrame
  • Chuyển đổi ngày (DateTime) sang định dạng chuỗi
  • Pandas Bộ lọc DataFrame Hàng ngày
  • Cột Groupby Pandas và nhận được số lượng

Người giới thiệu

  • https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.replace.html