Hướng dẫn what is astype in python? - astype trong python là gì?

Python là một ngôn ngữ tuyệt vời để phân tích dữ liệu, chủ yếu là do hệ sinh thái tuyệt vời của các gói Python tập trung vào dữ liệu. Pandas là một trong những gói đó và giúp nhập và phân tích dữ liệu dễ dàng hơn nhiều.

Phương pháp DataFrame.astype() được sử dụng để đúc một đối tượng gấu trúc vào một DTYPE được chỉ định. Hàm

import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
0 cũng cung cấp khả năng chuyển đổi bất kỳ cột hiện có phù hợp thành loại phân loại.

Hàm DataFrame.astype() rất tiện dụng khi chúng tôi muốn trường hợp một loại dữ liệu cột cụ thể sang kiểu dữ liệu khác. Không chỉ vậy mà chúng ta cũng có thể sử dụng đầu vào từ điển Python để thay đổi nhiều loại cột cùng một lúc. Nhãn chính trong từ điển tương ứng với tên cột và nhãn giá trị trong từ điển tương ứng với các loại dữ liệu mới mà chúng tôi muốn các cột được phát hành.

Cú pháp: dataFrame.Asype (dtype, copy = true DataFrame.astype(dtype, copy=True, errors=’raise’, **kwargs)

Tham số: DTYPE: Sử dụng loại python

import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
2or để đúc toàn bộ đối tượng gấu trúc theo cùng một loại. Ngoài ra, sử dụng {col: dtype, xông}, trong đó col là nhãn cột và dtype là loại
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
3 hoặc python để đúc một hoặc nhiều cột của DataFrame thành các loại cụ thể cột. Hãy cài đặt rất cẩn thận Sao chép = Sai khi thay đổi các giá trị sau đó có thể truyền sang các đối tượng gấu trúc khác).

dtype : Use a
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
2or Python type to cast entire pandas object to the same type. Alternatively, use {col: dtype, …}, where col is a column label and dtype is a
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
3 or Python type to cast one or more of the DataFrame’s columns to column-specific types.
copy : Return a copy when copy=True (be very careful setting copy=False as changes to values then may propagate to other pandas objects).

Lỗi: Kiểm soát nâng cao các ngoại lệ trên dữ liệu không hợp lệ cho DTYPE.raise được cung cấp: Cho phép các ngoại lệ được tăng cường: triệt tiêu các ngoại lệ. Khi lỗi trả về đối tượng gốc Control raising of exceptions on invalid data for provided dtype.
raise : allow exceptions to be raised
ignore : suppress exceptions. On error return original object

KWARGS: Đối số từ khóa để truyền cho hàm tạokeyword arguments to pass on to the constructor

Returns: Casted: loại người gọi casted : type of caller

Đối với liên kết đến tệp CSV được sử dụng trong mã, bấm vào đây

Ví dụ #1: Chuyển đổi kiểu dữ liệu cột trọng lượng. Convert the Weight column data type.

import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
4
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
5

import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
6
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
7
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
8
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
9
Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
0

Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
1
Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
2
Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
3

Hướng dẫn what is astype in python? - astype trong python là gì?

Vì dữ liệu có một số giá trị của NAN NAN, vì vậy, để tránh mọi lỗi, chúng tôi sẽ bỏ tất cả các hàng có chứa bất kỳ

Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
4Values ​​nào.

Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
5
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
7
Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
7
Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
0

Hướng dẫn what is astype in python? - astype trong python là gì?

Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
9
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
7
block['Gender'] = block['Gender'].astype('category')
block.dtypes
1
block['Gender'] = block['Gender'].astype('category')
block.dtypes
2
block['Gender'] = block['Gender'].astype('category')
block.dtypes
3
block['Gender'] = block['Gender'].astype('category')
block.dtypes
4

block['Gender'] = block['Gender'].astype('category')
block.dtypes
5
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
7
block['Gender'] = block['Gender'].astype('category')
block.dtypes
7
block['Gender'] = block['Gender'].astype('category')
block.dtypes
8
Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
0

Gender    category
NAME        object
dtype: object
0
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
7
block['Gender'] = block['Gender'].astype('category')
block.dtypes
1
block['Gender'] = block['Gender'].astype('category')
block.dtypes
2
block['Gender'] = block['Gender'].astype('category')
block.dtypes
3
block['Gender'] = block['Gender'].astype('category')
block.dtypes
4

Gender    category
NAME        object
dtype: object
6

Gender    category
NAME        object
dtype: object
7

Output:

Hướng dẫn what is astype in python? - astype trong python là gì?

Hướng dẫn what is astype in python? - astype trong python là gì?

Hướng dẫn what is astype in python? - astype trong python là gì?

Ví dụ #2: Thay đổi kiểu dữ liệu của nhiều hơn một cột cùng một lúc Change the data type of more than one column at once

Thay đổi

Gender    category
NAME        object
dtype: object
8Column thành loại phân loại và
Gender    category
NAME        object
dtype: object
9Column thành loại Int64.

import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
4
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
5

import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
6
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
7
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
8
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
9
Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
0

Vì dữ liệu có một số giá trị của NAN NAN, vì vậy, để tránh mọi lỗi, chúng tôi sẽ bỏ tất cả các hàng có chứa bất kỳ

Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
4Values ​​nào.

temp            float64
hum             float64
windspeed       float64
cnt               int64
season_1          int64
season_2          int64
season_3          int64
season_4          int64
yr_0              int64
yr_1              int64
mnth_1            int64
mnth_2            int64
mnth_3            int64
mnth_4            int64
mnth_5            int64
mnth_6            int64
mnth_7            int64
mnth_8            int64
mnth_9            int64
mnth_10           int64
mnth_11           int64
mnth_12           int64
weathersit_1      int64
weathersit_2      int64
weathersit_3      int64
holiday_0         int64
holiday_1         int64
dtype: object
0

Output:

Hướng dẫn what is astype in python? - astype trong python là gì?

Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
5
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
7
Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
7
Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
0

Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object
9
import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes
7
block['Gender'] = block['Gender'].astype('category')
block.dtypes
1
block['Gender'] = block['Gender'].astype('category')
block.dtypes
2
block['Gender'] = block['Gender'].astype('category')
block.dtypes
3
block['Gender'] = block['Gender'].astype('category')
block.dtypes
4

temp            float64
hum             float64
windspeed       float64
cnt               int64
season_1          int64
season_2          int64
season_3          int64
season_4          int64
yr_0              int64
yr_1              int64
mnth_1            int64
mnth_2            int64
mnth_3            int64
mnth_4            int64
mnth_5            int64
mnth_6            int64
mnth_7            int64
mnth_8            int64
mnth_9            int64
mnth_10           int64
mnth_11           int64
mnth_12           int64
weathersit_1      int64
weathersit_2      int64
weathersit_3      int64
holiday_0         int64
holiday_1         int64
dtype: object
0

Output:

Hướng dẫn what is astype in python? - astype trong python là gì?

Output:

Hướng dẫn what is astype in python? - astype trong python là gì?


Trong bài viết này, chúng tôi sẽ làm việc trên một khái niệm quan trọng - chuyển đổi kiểu dữ liệu của các cột trong một khung dữ liệu bằng phương thức python astype () một cách chi tiết.Data Type Conversion of columns in a DataFrame using Python astype() method in detail.


Hiểu chức năng Python astype ()

Trước khi đi sâu vào khái niệm chuyển đổi kiểu dữ liệu với phương thức python astype (), trước tiên chúng ta hãy xem xét kịch bản dưới đây.

Trong lĩnh vực khoa học dữ liệu và học máy, chúng ta thường bắt gặp một giai đoạn mà chúng ta cần xử lý trước và chuyển đổi dữ liệu. Trong thực tế, chính xác, việc chuyển đổi các giá trị dữ liệu là bước sắc sảo hướng tới mô hình hóa.

Đây là khi chuyển đổi các cột dữ liệu đi vào hình ảnh.

Phương thức Python astype () cho phép chúng tôi đặt hoặc chuyển đổi kiểu dữ liệu của cột dữ liệu hiện có trong bộ dữ liệu hoặc khung dữ liệu.

Bằng cách này, chúng ta có thể thay đổi hoặc chuyển đổi loại giá trị dữ liệu hoặc đơn hoặc nhiều cột thành hoàn toàn một biểu mẫu khác bằng cách sử dụng hàm ASTYPE ().

Bây giờ chúng ta hãy tập trung vào chức năng cú pháp của astype () một cách chi tiết trong phần sắp tới.


Chức năng cú pháp - ASTYPE ()

Có một cái nhìn vào cú pháp dưới đây!

DataFrame.astype(dtype, copy=True, errors=’raise’)

  • DTYPE: Kiểu dữ liệu chúng tôi muốn áp dụng cho toàn bộ khung dữ liệu.: The data type we want to apply to the entire data frame.
  • Sao chép: Bằng cách đặt nó thành True, nó tạo một bản sao khác của bộ dữ liệu khắc sâu các thay đổi cho nó.: By setting it to True, it creates another copy of the dataset inculcating the changes to it.
  • Lỗi: Bằng cách đặt nó thành ‘Nâng cao, chúng tôi cho phép các ngoại lệ được đưa ra bởi hàm. Nếu không, chúng ta có thể đặt nó thành ‘Bỏ qua‘.: By setting it to ‘raise‘, we allow the exceptions to be raised by the function. If not, we can set it to ‘ignore‘.

Đã hiểu cú pháp của chức năng, bây giờ chúng ta hãy tập trung vào việc thực hiện giống nhau!


1. Python astype () với DataFrame

Trong ví dụ này, chúng tôi đã tạo một khung dữ liệu từ từ điển như được hiển thị bên dưới bằng cách sử dụng

BIKE = BIKE.astype({"season_1":'category', "temp":'int64'}) 
BIKE.dtypes
3Method.

Example:

import pandas as pd 
data = {"Gender":['M','F','F','M','F','F','F'], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}

block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
block.dtypes

Output:

Chúng ta hãy xem các loại dữ liệu gốc của các khóa.

Original Data frame:

  Gender    NAME
0      M    John
1      F  Camili
2      F  Rheana
3      M  Joseph
4      F  Amanti
5      F   Alexa
6      F    Siri

Gender    object
NAME      object
dtype: object

Bây giờ, chúng tôi đã áp dụng phương thức astype () trên cột ‘giới tính và đã thay đổi kiểu dữ liệu thành‘ danh mục.

block['Gender'] = block['Gender'].astype('category')
block.dtypes

Output:

Gender    category
NAME        object
dtype: object


2. Thực hiện Python astype () với bộ dữ liệu

Ở đây, chúng tôi đã nhập bộ dữ liệu bằng hàm pandas.read_csv (). Bạn có thể tìm thấy bộ dữ liệu ở đây.

Example:

import pandas 
BIKE = pandas.read_csv("Bike.csv")
BIKE.dtypes

Các loại dữ liệu gốc của các cột

temp            float64
hum             float64
windspeed       float64
cnt               int64
season_1          int64
season_2          int64
season_3          int64
season_4          int64
yr_0              int64
yr_1              int64
mnth_1            int64
mnth_2            int64
mnth_3            int64
mnth_4            int64
mnth_5            int64
mnth_6            int64
mnth_7            int64
mnth_8            int64
mnth_9            int64
mnth_10           int64
mnth_11           int64
mnth_12           int64
weathersit_1      int64
weathersit_2      int64
weathersit_3      int64
holiday_0         int64
holiday_1         int64
dtype: object

Bây giờ, chúng tôi đã cố gắng thay đổi loại dữ liệu của các biến ‘Season_1, và‘ Temp. Do đó, chúng tôi nói rằng với hàm ASTYPE (), chúng tôi có thể thay đổi các loại dữ liệu của nhiều cột trong một lần!

BIKE = BIKE.astype({"season_1":'category', "temp":'int64'}) 
BIKE.dtypes

Output:

temp               int64
hum              float64
windspeed        float64
cnt                int64
season_1        category
season_2           int64
season_3           int64
season_4           int64
yr_0               int64
yr_1               int64
mnth_1             int64
mnth_2             int64
mnth_3             int64
mnth_4             int64
mnth_5             int64
mnth_6             int64
mnth_7             int64
mnth_8             int64
mnth_9             int64
mnth_10            int64
mnth_11            int64
mnth_12            int64
weathersit_1       int64
weathersit_2       int64
weathersit_3       int64
holiday_0          int64
holiday_1          int64
dtype: object


Sự kết luận

Bằng cách này, chúng tôi đã đi đến cuối chủ đề này. Hãy bình luận bên dưới, trong trường hợp bạn bắt gặp bất kỳ câu hỏi.

Để biết thêm các bài viết như vậy liên quan đến Python, hãy theo dõi và cho đến lúc đó, học hỏi hạnh phúc !! 🙂

Việc sử dụng chức năng ASTYPE là gì?

Phương thức ASTYPE () được sử dụng để đúc một đối tượng gấu trúc vào một DTYPE được chỉ định. Hàm astype () cũng cung cấp khả năng chuyển đổi bất kỳ cột hiện có phù hợp thành loại phân loại. Khung dữ liệu. Hàm astype () rất tiện dụng khi chúng tôi muốn trường hợp một loại dữ liệu cột cụ thể sang kiểu dữ liệu khác.to cast a pandas object to a specified dtype. astype() function also provides the capability to convert any suitable existing column to categorical type. DataFrame. astype() function comes very handy when we want to case a particular column data type to another data type.

Astype float là gì?

hàm asttype () để chuyển đổi cột từ chuỗi/int sang float, bạn có thể áp dụng nó trên một cột cụ thể hoặc trên toàn bộ khung dữ liệu. Để chuyển kiểu dữ liệu lên float có chữ ký 54 bit, bạn có thể sử dụng Numpy. float64, numpy. float_, float, float64 dưới dạng param.to convert column from string/int to float, you can apply this on a specific column or on an entire DataFrame. To cast the data type to 54-bit signed float, you can use numpy. float64 , numpy. float_ , float , float64 as param.

DTYPE ('o') nghĩa là gì?

Nó có nghĩa là: 'o' (python) đối tượng.Nguồn.Ký tự đầu tiên chỉ định loại dữ liệu và các ký tự còn lại chỉ định số byte trên mỗi mục, ngoại trừ Unicode, trong đó nó được hiểu là số lượng ký tự.Kích thước vật phẩm phải tương ứng với một loại hiện có hoặc một lỗi sẽ được nêu ra.'O' (Python) objects. Source. The first character specifies the kind of data and the remaining characters specify the number of bytes per item, except for Unicode, where it is interpreted as the number of characters. The item size must correspond to an existing type, or an error will be raised.

INT64 trong Python là gì?

Bạn sẽ thường thấy loại dữ liệu Int64 trong Python là viết tắt của số nguyên 64 bit.64 đề cập đến bộ nhớ được phân bổ để lưu trữ dữ liệu trong mỗi ô có hiệu quả liên quan đến số lượng nó có thể lưu trữ trong mỗi ô.64 bit integer. The 64 refers to the memory allocated to store data in each cell which effectively relates to how many digits it can store in each “cell”.