Hướng dẫn how does python calculate rows and columns? - python tính toán hàng và cột như thế nào?

Bài viết này mô tả cách lấy số lượng hàng, cột và tổng số phần tử (kích thước) của pandas.DataFrame

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
0.

Show
  • pandas.DataFrame
    • Hiển thị số lượng hàng, cột, v.v .:
      df.info()
      # <class 'pandas.core.frame.DataFrame'>
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      2
    • Nhận số lượng hàng:
      df.info()
      # <class 'pandas.core.frame.DataFrame'>
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      3
    • Nhận số lượng cột:
      df.info()
      # <class 'pandas.core.frame.DataFrame'>
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      4
    • Nhận số lượng hàng và cột:
      df.info()
      # <class 'pandas.core.frame.DataFrame'>
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      5
    • Nhận số lượng các yếu tố:
      df.info()
      # <class 'pandas.core.frame.DataFrame'>
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      6
    • Ghi chú khi chỉ định chỉ số
  • df.info()
    # <class 'pandas.core.frame.DataFrame'>
    # RangeIndex: 891 entries, 0 to 890
    # Data columns (total 12 columns):
    # PassengerId    891 non-null int64
    # Survived       891 non-null int64
    # Pclass         891 non-null int64
    # Name           891 non-null object
    # Sex            891 non-null object
    # Age            714 non-null float64
    # SibSp          891 non-null int64
    # Parch          891 non-null int64
    # Ticket         891 non-null object
    # Fare           891 non-null float64
    # Cabin          204 non-null object
    # Embarked       889 non-null object
    # dtypes: float64(2), int64(5), object(5)
    # memory usage: 83.6+ KB
    
    0
    • Nhận số lượng các yếu tố:
      df.info()
      # <class 'pandas.core.frame.DataFrame'>
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      8,
      df.info()
      # <class 'pandas.core.frame.DataFrame'>
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      9

Ví dụ, sử dụng dữ liệu người sống sót Titanic. Nó có thể được tải xuống từ Kaggle.

import pandas as pd

df = pd.read_csv('data/src/titanic_train.csv')

print(df.head())
#    PassengerId  Survived  Pclass  \
# 0            1         0       3   
# 1            2         1       1   
# 2            3         1       3   
# 3            4         1       1   
# 4            5         0       3   
# 
#                                                 Name     Sex   Age  SibSp  \
# 0                            Braund, Mr. Owen Harris    male  22.0      1   
# 1  Cumings, Mrs. John Bradley (Florence Briggs Th...  female  38.0      1   
# 2                             Heikkinen, Miss. Laina  female  26.0      0   
# 3       Futrelle, Mrs. Jacques Heath (Lily May Peel)  female  35.0      1   
# 4                           Allen, Mr. William Henry    male  35.0      0   
# 
#    Parch            Ticket     Fare Cabin Embarked  
# 0      0         A/5 21171   7.2500   NaN        S  
# 1      0          PC 17599  71.2833   C85        C  
# 2      0  STON/O2. 3101282   7.9250   NaN        S  
# 3      0            113803  53.1000  C123        S  
# 4      0            373450   8.0500   NaN        S  

Nhận số lượng hàng, cột, phần tử của pandas.DataFrame

Hiển thị số lượng hàng, cột, v.v .: df.info() # <class 'pandas.core.frame.DataFrame'> # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 2

Nhận số lượng hàng:

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
3

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB

Nhận số lượng cột:

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
4

Nhận số lượng hàng: df.info() # <class 'pandas.core.frame.DataFrame'> # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 3

Nhận số lượng cột:

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
4

Nhận số lượng hàng và cột:

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
5

Nhận số lượng cột: df.info() # <class 'pandas.core.frame.DataFrame'> # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 4

Nhận số lượng hàng và cột:

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
5

print(len(df.columns))
# 12

Nhận số lượng hàng và cột: df.info() # <class 'pandas.core.frame.DataFrame'> # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 5

Nhận số lượng các yếu tố:

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
6

print(df.shape)
# (891, 12)

print(df.shape[0])
# 891

print(df.shape[1])
# 12

Ghi chú khi chỉ định chỉ số

  • Nhận số lượng các yếu tố:
    df.info()
    # <class 'pandas.core.frame.DataFrame'>
    # RangeIndex: 891 entries, 0 to 890
    # Data columns (total 12 columns):
    # PassengerId    891 non-null int64
    # Survived       891 non-null int64
    # Pclass         891 non-null int64
    # Name           891 non-null object
    # Sex            891 non-null object
    # Age            714 non-null float64
    # SibSp          891 non-null int64
    # Parch          891 non-null int64
    # Ticket         891 non-null object
    # Fare           891 non-null float64
    # Cabin          204 non-null object
    # Embarked       889 non-null object
    # dtypes: float64(2), int64(5), object(5)
    # memory usage: 83.6+ KB
    
    8,
    df.info()
    # <class 'pandas.core.frame.DataFrame'>
    # RangeIndex: 891 entries, 0 to 890
    # Data columns (total 12 columns):
    # PassengerId    891 non-null int64
    # Survived       891 non-null int64
    # Pclass         891 non-null int64
    # Name           891 non-null object
    # Sex            891 non-null object
    # Age            714 non-null float64
    # SibSp          891 non-null int64
    # Parch          891 non-null int64
    # Ticket         891 non-null object
    # Fare           891 non-null float64
    # Cabin          204 non-null object
    # Embarked       889 non-null object
    # dtypes: float64(2), int64(5), object(5)
    # memory usage: 83.6+ KB
    
    9

row, col = df.shape
print(row)
# 891

print(col)
# 12

Nhận số lượng các yếu tố: df.info() # <class 'pandas.core.frame.DataFrame'> # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 6

Ghi chú khi chỉ định chỉ số

print(df.size)
# 10692

print(df.shape[0] * df.shape[1])
# 10692

Ghi chú khi chỉ định chỉ số

Nhận số lượng các yếu tố:

df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
8,
df.info()
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
9

df_multiindex = df.set_index(['Sex', 'Pclass', 'Embarked', 'PassengerId'])

print(len(df_multiindex))
# 891

print(len(df_multiindex.columns))
# 8

print(df_multiindex.shape)
# (891, 8)

print(df_multiindex.size)
# 7128

Ví dụ, sử dụng dữ liệu người sống sót Titanic. Nó có thể được tải xuống từ Kaggle.

  • Nhận số lượng hàng, cột, phần tử của pandas.DataFrame

Phương pháp print(len(df.columns)) # 12 2 của pandas.DataFrame có thể hiển thị thông tin như số lượng hàng và cột, tổng số bộ nhớ, kiểu dữ liệu của mỗi cột và số lượng các phần tử không phải là NAN.

Kết quả là đầu ra tiêu chuẩn và không thể thu được như một giá trị.

s = df['PassengerId']
print(s.head())
# 0    1
# 1    2
# 2    3
# 3    4
# 4    5
# Name: PassengerId, dtype: int64

Số lượng hàng của pandas.DataFrame có thể thu được với hàm tích hợp Python print(len(df.columns)) # 12 6.

Trong ví dụ, nó được hiển thị bằng cách sử dụng

print(len(df.columns))
# 12
7, nhưng
print(len(df.columns))
# 12
6 trả về giá trị số nguyên, do đó nó có thể được gán cho một biến khác hoặc được sử dụng để tính toán.

Số lượng cột của pandas.DataFrame có thể thu được bằng cách áp dụng

print(len(df.columns))
# 12
6 cho thuộc tính
print(df.shape)
# (891, 12)

print(df.shape[0])
# 891

print(df.shape[1])
# 12
2.

print(len(s))
# 891

print(s.size)
# 891

print(s.shape)
# (891,)

Thuộc tính

print(df.shape)
# (891, 12)

print(df.shape[0])
# 891

print(df.shape[1])
# 12
4 của pandas.DataFrame lưu trữ số lượng hàng và cột dưới dạng Tuple
print(df.shape)
# (891, 12)

print(df.shape[0])
# 891

print(df.shape[1])
# 12
6.

Làm thế nào để bạn đếm các hàng trong Python?

Bạn có thể sử dụng Len (df.index) để tìm số lượng hàng trong gấu trúc DataFrame, DF. Chỉ mục trả về phạm vi Index (start = 0, stop = 8, bước = 1) và sử dụng nó trên len () để lấy số lượng.len(df. index) to find the number of rows in pandas DataFrame, df. index returns RangeIndex(start=0, stop=8, step=1) and use it on len() to get the count.

Làm thế nào để gấu trúc tính số lượng hàng?

Làm thế nào để có được số lượng hàng của một gấu trúc DataFrame..
Sử dụng Len () Cách đơn giản và rõ ràng nhất để tính toán số lượng hàng của DataFrame là sử dụng phương thức tích hợp len (): >>> len (df) ....
Sử dụng hình dạng. Ngoài ra, bạn thậm chí có thể sử dụng gấu trúc. ....
Sử dụng đếm ().

Làm thế nào để bạn tính toán một cột trong Python?

Để tính toán giá trị trung bình của toàn bộ các cột trong DataFrame, hãy sử dụng pandas.series.mean () với danh sách các cột DataFrame.Bạn cũng có thể nhận được giá trị trung bình cho tất cả các cột số bằng DataFrame.use pandas. Series. mean() with a list of DataFrame columns. You can also get the mean for all numeric columns using DataFrame.

Làm thế nào để bạn tạo hàng và cột trong Python?

Thêm các hàng và cột mới vào Pandas DataFrame..
Thêm hàng vào DataFrame:.
DataFrame LOC để chèn một hàng ..
DataFrame ILOC để cập nhật hàng tại vị trí chỉ mục ..
Chèn hàng tại vị trí chỉ mục cụ thể ..
DataFrame nối vào để thêm hàng mới ..
Thêm cột mới vào DataFrame ..
Thêm nhiều cột vào DataFrame ..