Hướng dẫn create new variable in dataframe python - tạo biến mới trong dataframe python

Trong bài viết này, hãy để Lừa học cách thêm một biến mới vào Pandas DataFrame bằng cách sử dụng hàm gán () và dấu ngoặc vuông.

Pandas là gói Python cung cấp các cấu trúc và hoạt động dữ liệu khác nhau để thao tác dữ liệu số và chuỗi thời gian. Nó chủ yếu phổ biến để nhập và phân tích dữ liệu dễ dàng hơn nhiều. Trong khi GANDAS DATAFRAME là một cấu trúc dữ liệu bảng có kích thước hai chiều có khả năng không đồng nhất với các trục được dán nhãn (hàng và cột). Khung dữ liệu là cấu trúc dữ liệu hai chiều trong đó dữ liệu được sắp xếp theo các hàng và cột ở định dạng bảng. Dữ liệu, hàng và cột là ba thành phần chính của khung dữ liệu gấu trúc. Ở đây chúng tôi sẽ thấy hai phương pháp khác nhau để thêm các biến mới vào DataFrame của chúng tôi.is a Python package that offers various data structures and operations for manipulating numerical data and time series. It is mainly popular for importing and analyzing data much easier. Whereas Pandas DataFrame is a potentially heterogeneous two-dimensional size-mutable tabular data structure with labeled axes (rows and columns). A data frame is a two-dimensional data structure in which data is organized in rows and columns in a tabular format. The data, rows, and columns are the three main components of a Pandas DataFrame. here we will see two different methods for adding new variables to our pandas Dataframe.

Phương pháp 1: Sử dụng phương thức pandas.dataframe.assign ()

Phương pháp này được sử dụng để tạo các cột mới cho DataFrame. Nó trả về một đối tượng mới chứa tất cả các cột gốc cũng như các cột mới. Nếu có & nbsp; các cột hiện tại, chúng sẽ bị ghi đè nếu chúng được gán lại. & Nbsp;

Cú pháp: dataFrame.Assign (** kwargs)DataFrame.assign(**kwargs)

  • ** kwargsdict của {str: callable hoặc series}: từ khóa được sử dụng để đặt tên cho các cột. Nếu các giá trị được gọi, chúng được tính toán và gán cho các cột mới trên DataFrame. Có thể gọi được không được sửa đổi DataFrame đầu vào. Nếu các giá trị không thể gọi được (ví dụ: nếu chúng là một chuỗi, vô hướng hoặc mảng), chúng sẽ dễ dàng được gán. Keywords are used to name the columns. If the values are callable, they are computed and assigned to the new columns on the DataFrame. The callable must not modify the input DataFrame . If the values are not callable (for example, if they are a Series, scalar, or array), they are easily assigned.

Trả về: Một dataFrame mới được trả về với các cột mới cũng như tất cả các cột hiện có.A new DataFrame is returned with the new columns as well as all the existing columns.

Thí dụ

Trong ví dụ này, chúng tôi nhập các gói Numpy và Panda, chúng tôi đặt hạt giống để cùng một dữ liệu ngẫu nhiên được tạo ra mỗi lần. Một bộ dữ liệu với 10 điểm số trong khoảng từ 30 đến 100 được tạo cho ba đội. Phương thức gán () được sử dụng để tạo một cột khác trong DataFrame, chúng tôi cung cấp tên từ khóa sẽ là tên của cột mà chúng tôi sẽ gán dữ liệu cho nó. Sau khi gán dữ liệu, một DataFrame mới được tạo với một cột mới ngoài các cột hiện có.

Python3

import numpy as np

import pandas as pd

np.random.seed(123)

df = import0import1import2import3import4import5import4import7import8

import9numpy as np0import2import3import4import5import4import7import8

import9numpy as np9import2import3import4import5import4import7import6

import7import8import9)

import7pandas as pd2

pandas as pd3= pandas as pd5import3import4import5import4import7)

np.random.seed(2= np.random.seed(4=np.random.seed(6

import7import8np.random.seed(9)

import71232

Output:

Hướng dẫn create new variable in dataframe python - tạo biến mới trong dataframe python

Phương pháp 2: Sử dụng [] để thêm cột mới

Trong ví dụ này, thay vì sử dụng phương thức gán (), chúng tôi sử dụng dấu ngoặc vuông ([]) để tạo một biến hoặc cột mới cho một khung dữ liệu hiện có. Cú pháp diễn ra như thế này:

dataframe_name['column_name'] = data
column_name is the name of the new column to be added in our dataframe.

Thí dụ

Trong ví dụ này, chúng tôi nhập các gói Numpy và Panda, chúng tôi đặt hạt giống để cùng một dữ liệu ngẫu nhiên được tạo ra mỗi lần. Một bộ dữ liệu với 10 điểm số trong khoảng từ 30 đến 100 được tạo cho ba đội. Phương thức gán () được sử dụng để tạo một cột khác trong DataFrame, chúng tôi cung cấp tên từ khóa sẽ là tên của cột mà chúng tôi sẽ gán dữ liệu cho nó. Sau khi gán dữ liệu, một DataFrame mới được tạo với một cột mới ngoài các cột hiện có.TeamD is created in this example, which shows the scores of people in TeamD. Random data is created and assigned to the Dataframe to the new column.  

Python3

import numpy as np

import pandas as pd

np.random.seed(123)

df = import0import1import2import3import4import5import4import7import8

pandas as pd3= pandas as pd5import3import4import5import4import7)

import9numpy as np9import2import3import4import5import4import7import6

import7import8import9)

import7pandas as pd2

np.random.seed(2= np.random.seed(4=np.random.seed(6

Phương pháp 2: Sử dụng [] để thêm cột mới

import7import8np.random.seed(9)

import7pandas as pd2

Output: