Đây là một quy trình khá bắt buộc để sửa đổi dữ liệu chúng tôi có vì máy tính sẽ hiển thị cho bạn lỗi đầu vào không hợp lệ vì không thể xử lý dữ liệu có 'NaN' với nó và thực tế không thể thay đổi thủ công ' . Do đó, để giải quyết vấn đề này, chúng tôi xử lý dữ liệu và sử dụng các chức năng khác nhau để loại bỏ 'NaN' khỏi dữ liệu của chúng tôi và thay thế bằng giá trị trung bình cụ thể và sẵn sàng được xử lý bởi hệ thống Chủ yếu có hai bước để xóa 'NaN' khỏi dữ liệu- - Sử dụng Dataframe. fillna() từ thư viện của gấu trúc
- Sử dụng SimpleImputer từ sklearn. tính (điều này chỉ hữu ích nếu dữ liệu có ở dạng tệp csv)
Sử dụng Dataframe. fillna() từ thư viện của gấu trúcVới sự trợ giúp của Dataframe. fillna() từ thư viện của gấu trúc, chúng ta có thể dễ dàng thay thế 'NaN' trong khung dữ liệu. Thủ tục - Để tính giá trị trung bình (), chúng tôi sử dụng hàm trung bình của cột cụ thể
- Bây giờ với sự trợ giúp của hàm fillna(), chúng tôi sẽ thay đổi tất cả 'NaN' của cột cụ thể mà chúng tôi có ý nghĩa
- Chúng tôi sẽ in cột cập nhật
cú pháp. df. fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs) Tham số - giá trị. Giá trị sử dụng để lấp lỗ
- phương pháp. Phương pháp sử dụng để lấp đầy các lỗ trong phần đệm / điền Sê-ri được lập chỉ mục lại
- trục. {0 hoặc 'chỉ mục'}
- thay thế. Nếu Đúng, hãy điền vào chỗ
- giới hạn. Nếu phương thức được chỉ định, đây là số lượng giá trị NaN liên tiếp tối đa để điền tiến/lùi
- chán nản. dict, mặc định là Không có
ví dụ 1 - Để tính giá trị trung bình (), chúng tôi sử dụng hàm trung bình của cột cụ thể
- Sau đó, áp dụng hàm fillna(), chúng tôi sẽ thay đổi tất cả 'NaN' của cột cụ thể mà chúng tôi có ý nghĩa của nó và in khung dữ liệu được cập nhật
Python3
import numpy as np
import pandas as pd
# A dictionary with list as values
GFG_dict = { ___'G1' numpy as np 0_______1_______1numpy as np 2numpy as np 3numpy as np 2numpy as np 5numpy as np 2numpy as np 7numpy as np 8
numpy as np 9import 0_______1_______0_______0_______2_______0_______3import 4numpy as np 8
numpy as np 9import 7numpy as np 0_______0_______9numpy as np 2pandas as pd 1numpy as np 2pandas as pd 3numpy as np 2pandas as pd 5numpy as np 8
numpy as np 9pandas as pd 8numpy as np 0_______4_______0numpy as np 2 2numpy as np 2 4numpy as np 2import 2 7
9
# A dictionary with list as values 0= # A dictionary with list as values 2
# A dictionary with list as values 4
# A dictionary with list as values 5_______7__________# A dictionary with list as values 7import 0_______5_______9
GFG_dict 1
GFG_dict 2
# A dictionary with list as values 7import 0_______6_______5_______7_______GFG_dict 7= 6_______9= 0
= 1_______7_______2= 3= 0
= 1= 6
đầu ra ví dụ 2 Python3
import pandas as pd
import numpy as np
{ 2= { 4
{ 5{ 6numpy as np 0_______1_______1_______8_______9numpy as np 3numpy as np 2numpy as np 5_______8_______9'G1' 4{ 9
'G1' 6'G1' 7numpy as np 2_______9_______9_______1_______2numpy as np 01{ 9numpy as np 03_______1_______8
numpy as np 05
{ 5numpy as np 07numpy as np 0numpy as np 1_______1_______2numpy as np 3{ 9pandas as pd 5numpy as np 2numpy as np 15{ 9
numpy as np 17_______1_______18numpy as np 2pandas as pd 1_______8_______9import 2numpy as np 2numpy as np 24numpy as np 2numpy as np 26numpy as np 8
numpy as np 05
{ 5numpy as np 30numpy as np 0numpy as np 32numpy as np 2numpy as np 34{ 9
numpy as np 17_______1_______37numpy as np 2numpy as np 34numpy as np 2numpy as np 41numpy as np 42
numpy as np 17_______1_______34numpy as np 2numpy as np 46numpy as np 2numpy as np 46numpy as np 2
numpy as np 17_______1_______51numpy as np 2numpy as np 37numpy as np 2numpy as np 55numpy as np 8
numpy as np 57
numpy as np 59numpy as np 07numpy as np 61numpy as np 62numpy as np 63numpy as np 07numpy as np 65= GFG_dict 9= 0
= 1______1_______70
đầu ra Sử dụng SimpleImputer() từ sklearn. quy tộiChức năng này Biến thế quy nạp để hoàn thành các giá trị còn thiếu cung cấp các chiến lược cơ bản để quy các giá trị còn thiếu. Các giá trị này có thể được gán bằng một giá trị không đổi được cung cấp hoặc sử dụng số liệu thống kê (trung bình, trung bình hoặc thường xuyên nhất) của mỗi cột chứa các giá trị bị thiếu. Lớp này cũng cho phép mã hóa giá trị bị thiếu khác nhau cú pháp. lớp học. quy tội. SimpleImputer(*, missing_values=nan, Strategy=’mean’, fill_value=None, verbose=0, copy=True, add_indicator=False)
Làm cách nào để điền các giá trị còn thiếu bằng trung vị trong gấu trúc?
Sử dụng Phương thức fillna()
. Đây có thể là giá trị trung bình, trung bình, phương thức hoặc bất kỳ giá trị nào khác.
Tôi nên điền NA với giá trị trung bình hay trung bình?
Tốt hơn nên sử dụng giá trị trung bình để quy kết trong trường hợp có giá trị ngoại lai . Bạn có thể sử dụng phương pháp 'fillna' để tính cột 'Khoản_Khoản_Khoản_Khoản' với giá trị trung bình. Trong một số trường hợp, việc gán các giá trị bằng giá trị trước đó thay vì giá trị trung bình, chế độ hoặc trung vị sẽ phù hợp hơn. Điều này được gọi là chuyển tiếp điền.
Làm cách nào để điền các giá trị còn thiếu bằng NaN trong gấu trúc?
Bạn có thể thay thế giá trị còn thiếu ( NaN ) trong pandas. DataFrame và Sê-ri với bất kỳ giá trị nào bằng cách sử dụng phương thức fillna() .
Làm cách nào để thay thế giá trị null bằng giá trị trung bình trong gấu trúc?
Điều này có thể được thực hiện bằng cách sử dụng phương thức fillna() . Hoạt động cơ bản của loạt gấu trúc này. Phương thức fillna() được sử dụng để thay thế các giá trị bị thiếu (Nan hoặc NA) bằng một giá trị được chỉ định. Ban đầu, phương thức xác minh tất cả các giá trị Nan và thay thế chúng bằng giá trị thay thế được chỉ định.
|