Hướng dẫn how do i get the average of a column in python csv? - làm cách nào để lấy giá trị trung bình của một cột trong python csv?

3

Mới! Lưu câu hỏi hoặc câu trả lời và sắp xếp nội dung yêu thích của bạn. Tìm hiểu thêm.
Learn more.

import csv with open('Met.csv', 'r') as f: reader = csv.reader(f, delimiter=':', quoting=csv.QUOTE_NONE) for row in reader: print row

Tôi không thể tiếp tục làm thế nào để lấy một cột từ tệp CSV mà tôi đã thử

print row[:column_name] name id name reccla mass (g) fall year GeoLocation Aachen 1 Valid L5 21 Fell 01/01/1880 (50.775000, 6.083330) Aarhus 2 Valid H6 720 Fell 1/1/1951 (53.775000, 6.586560) Abee 6 Valid EH4 -- Fell 1/1/1952 (50.775000, 6.083330) Acapul 10 Valid A 353 Fell 1/1/1952 (50.775000, 6.083330) Acapul 1914 valid A -- Fell 1/1/1952 (50.775000, 6.083330) AdhiK 379 Valid EH4 56655 Fell 1/1/1919 (50.775000, 6.083330)

và tôi muốn avg của khối lượng (g)

Hỏi ngày 28 tháng 1 năm 2016 lúc 8:14Jan 28, 2016 at 8:14

Hari Ramahari RamaHari Rama

Huy hiệu vàng 611 huy hiệu bạc8 huy hiệu đồng1 gold badge1 silver badge8 bronze badges

3

Hãy thử >>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 2 thay vì đọc từ >>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 3

import pandas as pd data = pd.read_csv('Met.csv')

Nó dễ dàng hơn nhiều để lấy các cột và thực hiện các hoạt động bằng cách sử dụng >>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 2. Ở đây tôi đang tải nội dung CSV vào DataFrame.

Dữ liệu được tải: (dữ liệu mẫu) (sample data)

>>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000

Chỉ là cột khối:

Bạn có thể truy cập các cột riêng lẻ dưới dạng dữ liệu ['Tên cột']]

>>> data['mass'] 0 720 1 107000 2 914 3 780 4 4239 5 910 6 30000 Name: mass, dtype: int64

Trung bình của cột khối:

>>> data['mass'].mean() 20651.857142857141

Đã trả lời ngày 28 tháng 1 năm 2016 lúc 8:44Jan 28, 2016 at 8:44

Astrosyamastrosyamastrosyam

8474 Huy hiệu bạc15 Huy hiệu Đồng4 silver badges15 bronze badges

6

Bạn có thể sử dụng >>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 5 thay vì >>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 6. Mã sau đây hoạt động tốt với tôi

import csv mass_list = [] with open("../data/Met.csv", "r") as f: reader = csv.DictReader(f, delimiter="\t") for row in reader: mass = row["mass"] if mass is not None and mass is not "--": mass_list.append(float(row["mass"])) avg_mass = sum(mass_list) / len(mass_list) print "avg of mass: ", avg_mass

Hy vọng nó giúp.

Đã trả lời ngày 28 tháng 1 năm 2016 lúc 9:55Jan 28, 2016 at 9:55

Eric Yangeric YangEric Yang

2.47719 huy hiệu bạc24 Huy hiệu đồng19 silver badges24 bronze badges

4

Đây là một chức năng làm sạch chức năng của bạn, nhưng nó có thể không làm những gì bạn muốn nó làm. Hiện tại, nó đang nhận được trung bình của tất cả các giá trị trong tất cả các cột:

def average_column(csv): f = open(csv, "r") average = 0 Sum = 0 row_count = 0 for row in f: for column in row.split(','): n = float(column) Sum += n row_count += 1 average = Sum / len(column) f.close() return 'The average is:', average

Tôi sẽ sử dụng mô -đun >>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 3 (giúp phân tích cú pháp CSV dễ dàng hơn), với đối tượng >>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 8 để quản lý tổng số cột và trình quản lý bối cảnh để mở tệp (không cần >>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 9):

import csv from collections import Counter def average_column(csv_filepath): column_totals = Counter() with open(csv_filepath, "rb") as f: reader = csv.reader(f) row_count = 0.0 for row in reader: for column_idx, column_value in enumerate(row): try: n = float(column_value) column_totals[column_idx] += n except ValueError: print "Error -- ({}) Column({}) could not be converted to float!".format(column_value, column_idx) row_count += 1.0 # row_count is now 1 too many so decrement it back down row_count -= 1.0 # make sure column index keys are in order column_indexes = column_totals.keys() column_indexes.sort() # calculate per column averages using a list comprehension averages = [column_totals[idx] / row_count for idx in column_indexes ] return averages

Trước hết, như mọi người nói - định dạng CSV trông đơn giản, nhưng nó có thể khá không cần thiết, đặc biệt là một khi các chuỗi vào chơi. Monkut đã cung cấp cho bạn hai giải pháp, phiên bản được làm sạch của mã của bạn và một giải pháp nữa sử dụng thư viện CSV. Tôi sẽ đưa ra một tùy chọn khác: Không có thư viện, nhưng nhiều mã thành ngữ để nhai, cung cấp cho bạn mức trung bình cho tất cả các cột cùng một lúc.

def get_averages(csv): column_sums = None with open(csv) as file: lines = file.readlines() rows_of_numbers = [map(float, line.split(',')) for line in lines] sums = map(sum, zip( * rows_of_numbers)) averages = [sum_item / len(lines) for sum_item in sums] return averages

Điều này chắc chắn làm việc cho tôi!

print row[:column_name] name id name reccla mass (g) fall year GeoLocation Aachen 1 Valid L5 21 Fell 01/01/1880 (50.775000, 6.083330) Aarhus 2 Valid H6 720 Fell 1/1/1951 (53.775000, 6.586560) Abee 6 Valid EH4 -- Fell 1/1/1952 (50.775000, 6.083330) Acapul 10 Valid A 353 Fell 1/1/1952 (50.775000, 6.083330) Acapul 1914 valid A -- Fell 1/1/1952 (50.775000, 6.083330) AdhiK 379 Valid EH4 56655 Fell 1/1/1919 (50.775000, 6.083330) 0

Nếu bạn muốn làm điều đó mà không có mô -đun stdlib vì một số lý do:

print row[:column_name] name id name reccla mass (g) fall year GeoLocation Aachen 1 Valid L5 21 Fell 01/01/1880 (50.775000, 6.083330) Aarhus 2 Valid H6 720 Fell 1/1/1951 (53.775000, 6.586560) Abee 6 Valid EH4 -- Fell 1/1/1952 (50.775000, 6.083330) Acapul 10 Valid A 353 Fell 1/1/1952 (50.775000, 6.083330) Acapul 1914 valid A -- Fell 1/1/1952 (50.775000, 6.083330) AdhiK 379 Valid EH4 56655 Fell 1/1/1919 (50.775000, 6.083330) 1

Tôi hy vọng điều này sẽ giúp bạn ...... một số trợ giúp .... đây là những gì tôi sẽ làm - đó là sử dụng Numpy:

print row[:column_name] name id name reccla mass (g) fall year GeoLocation Aachen 1 Valid L5 21 Fell 01/01/1880 (50.775000, 6.083330) Aarhus 2 Valid H6 720 Fell 1/1/1951 (53.775000, 6.586560) Abee 6 Valid EH4 -- Fell 1/1/1952 (50.775000, 6.083330) Acapul 10 Valid A 353 Fell 1/1/1952 (50.775000, 6.083330) Acapul 1914 valid A -- Fell 1/1/1952 (50.775000, 6.083330) AdhiK 379 Valid EH4 56655 Fell 1/1/1919 (50.775000, 6.083330) 2


Gợi ý: 2

Tôi mới ở Python và tôi đang cố gắng lấy trung bình anycodings_csv của mỗi (cột hoặc hàng) của tệp CSV anyCodings_csv để chọn các giá trị là bất kỳ ). Tệp của tôi có hàng trăm cột anycodings_csv và có các giá trị nổi như sau:, Đây là một chức năng làm sạch chức năng của bạn, nhưng anycodings_python có lẽ nó không làm những gì bạn muốn nó làm bất cứ điều gì. Hiện tại, nó đang nhận được trung bình anycodings_python của tất cả các giá trị trong tất cả các cột:, tôi sẽ sử dụng mô -đun CSV (điều này làm cho anycodings_python CSV phân tích dễ dàng hơn), với một đối tượng Counter .

Tôi mới ở Python và tôi đang cố gắng lấy trung bình anycodings_csv của mỗi (cột hoặc hàng) của tệp CSV anyCodings_csv để chọn các giá trị là bất kỳ ). Tệp của tôi có hàng trăm cột anycodings_csv và có các giá trị nổi như sau:anycodings_csv average of every (column or row) of a csv anycodings_csv file for then select the values that are anycodings_csv higher than the double of the average of its anycodings_csv column (o row). My file have hundreds of anycodings_csv columns, and have float values like these:

print row[:column_name] name id name reccla mass (g) fall year GeoLocation Aachen 1 Valid L5 21 Fell 01/01/1880 (50.775000, 6.083330) Aarhus 2 Valid H6 720 Fell 1/1/1951 (53.775000, 6.586560) Abee 6 Valid EH4 -- Fell 1/1/1952 (50.775000, 6.083330) Acapul 10 Valid A 353 Fell 1/1/1952 (50.775000, 6.083330) Acapul 1914 valid A -- Fell 1/1/1952 (50.775000, 6.083330) AdhiK 379 Valid EH4 56655 Fell 1/1/1919 (50.775000, 6.083330) 3

Tôi đã thử một số thay đổi đối với mã của mình để lấy bất kỳanycodings_csv the average for every column (separately), anycodings_csv but at the moment my code is like this one:

print row[:column_name] name id name reccla mass (g) fall year GeoLocation Aachen 1 Valid L5 21 Fell 01/01/1880 (50.775000, 6.083330) Aarhus 2 Valid H6 720 Fell 1/1/1951 (53.775000, 6.586560) Abee 6 Valid EH4 -- Fell 1/1/1952 (50.775000, 6.083330) Acapul 10 Valid A 353 Fell 1/1/1952 (50.775000, 6.083330) Acapul 1914 valid A -- Fell 1/1/1952 (50.775000, 6.083330) AdhiK 379 Valid EH4 56655 Fell 1/1/1919 (50.775000, 6.083330) 4

Đây là một chức năng làm sạch chức năng của bạn, nhưng anycodings_python có lẽ không làm những gì bạn muốn nó bất cứ điều gì. Hiện tại, nó đang nhận được trung bình anycodings_python của tất cả các giá trị trong tất cả các cột:anycodings_python it probably doesn't do what you want it anycodings_python to do. Currently, it is getting the anycodings_python average of all values in all columns:

def average_column(csv): f = open(csv, "r") average = 0 Sum = 0 row_count = 0 for row in f: for column in row.split(','): n = float(column) Sum += n row_count += 1 average = Sum / len(column) f.close() return 'The average is:', average

Tôi sẽ sử dụng mô -đun CSV (giúp phân tích cú pháp CSV của AnyCodings_Python dễ dàng hơn), với một đối tượng ANTOMODINGS_PYTHON để quản lý tổng số cột và trình quản lý bối cảnh anycodings_python để mở tệp (không cần bất kỳanycodings_python csv parsing easier), with a Counter anycodings_python object to manage the column totals and a anycodings_python context manager to open the file (no anycodings_python need for a close()):

import csv from collections import Counter def average_column(csv_filepath): column_totals = Counter() with open(csv_filepath, "rb") as f: reader = csv.reader(f) row_count = 0.0 for row in reader: for column_idx, column_value in enumerate(row): try: n = float(column_value) column_totals[column_idx] += n except ValueError: print "Error -- ({}) Column({}) could not be converted to float!".format(column_value, column_idx) row_count += 1.0 # row_count is now 1 too many so decrement it back down row_count -= 1.0 # make sure column index keys are in order column_indexes = column_totals.keys() column_indexes.sort() # calculate per column averages using a list comprehension averages = [column_totals[idx] / row_count for idx in column_indexes ] return averages

Trước hết, như mọi người nói - định dạng CSV AnyCodings_Python trông đơn giản, nhưng nó có thể khá bất kỳ Monkut đã cung cấp cho bạn hai giải pháp AnyCodings_Python, phiên bản được làm sạch của AnyCodings_Python mã của bạn và một phiên bản nữa sử dụng thư viện CSV AnyCodings_Python. Tôi sẽ đưa ra một tùy chọn khác: anycodings_python không có thư viện, nhưng rất nhiều mã hóa bất kỳ thành ngữ nào để nhai, cung cấp cho bạn bất kỳ trung bình nào cho tất cả các cột.anycodings_python looks simple, but it can be quite anycodings_python nontrivial, especially once strings anycodings_python enter play. monkut already gave you two anycodings_python solutions, the cleaned-up version of anycodings_python your code, and one more that uses CSV anycodings_python library. I'll give yet another option: anycodings_python no libraries, but plenty of idiomatic anycodings_python code to chew on, which gives you anycodings_python averages for all columns at once.

def get_averages(csv): column_sums = None with open(csv) as file: lines = file.readlines() rows_of_numbers = [map(float, line.split(',')) for line in lines] sums = map(sum, zip( * rows_of_numbers)) averages = [sum_item / len(lines) for sum_item in sums] return averages

Điều này chắc chắn làm việc cho tôi!

print row[:column_name] name id name reccla mass (g) fall year GeoLocation Aachen 1 Valid L5 21 Fell 01/01/1880 (50.775000, 6.083330) Aarhus 2 Valid H6 720 Fell 1/1/1951 (53.775000, 6.586560) Abee 6 Valid EH4 -- Fell 1/1/1952 (50.775000, 6.083330) Acapul 10 Valid A 353 Fell 1/1/1952 (50.775000, 6.083330) Acapul 1914 valid A -- Fell 1/1/1952 (50.775000, 6.083330) AdhiK 379 Valid EH4 56655 Fell 1/1/1919 (50.775000, 6.083330) 0

Nếu bạn muốn làm điều đó mà không có mô -đun stdlib vì một số lý do:anycodings_python modules for some reason:

print row[:column_name] name id name reccla mass (g) fall year GeoLocation Aachen 1 Valid L5 21 Fell 01/01/1880 (50.775000, 6.083330) Aarhus 2 Valid H6 720 Fell 1/1/1951 (53.775000, 6.586560) Abee 6 Valid EH4 -- Fell 1/1/1952 (50.775000, 6.083330) Acapul 10 Valid A 353 Fell 1/1/1952 (50.775000, 6.083330) Acapul 1914 valid A -- Fell 1/1/1952 (50.775000, 6.083330) AdhiK 379 Valid EH4 56655 Fell 1/1/1919 (50.775000, 6.083330) 1

Tôi hy vọng điều này sẽ giúp bạn ...... một số trợ giúp .... đây là những gì tôi sẽ làm - đó là sử dụng Numpy:anycodings_python help....here is what I would do - which anycodings_python is use numpy:

print row[:column_name] name id name reccla mass (g) fall year GeoLocation Aachen 1 Valid L5 21 Fell 01/01/1880 (50.775000, 6.083330) Aarhus 2 Valid H6 720 Fell 1/1/1951 (53.775000, 6.586560) Abee 6 Valid EH4 -- Fell 1/1/1952 (50.775000, 6.083330) Acapul 10 Valid A 353 Fell 1/1/1952 (50.775000, 6.083330) Acapul 1914 valid A -- Fell 1/1/1952 (50.775000, 6.083330) AdhiK 379 Valid EH4 56655 Fell 1/1/1919 (50.775000, 6.083330) 2


Gợi ý: 2

Tôi mới ở Python và tôi đang cố gắng lấy trung bình anycodings_csv của mỗi (cột hoặc hàng) của tệp CSV anyCodings_csv để chọn các giá trị là bất kỳ ). Tệp của tôi có hàng trăm cột anycodings_csv và có các giá trị nổi như sau:, Đây là một chức năng làm sạch chức năng của bạn, nhưng anycodings_python có lẽ nó không làm những gì bạn muốn nó làm bất cứ điều gì. Hiện tại, nó đang nhận được trung bình anycodings_python của tất cả các giá trị trong tất cả các cột:, tôi sẽ sử dụng mô -đun CSV (điều này làm cho anycodings_python CSV phân tích dễ dàng hơn), với một đối tượng Counter .

Dưới đây là một số ví dụ nhanh về cách lấy cột trung bình hoặc trung bình trong Pandas DataFrame.

import pandas as pd data = pd.read_csv('Met.csv') 1

Bây giờ, hãy để Lôi tạo một khung dữ liệu với một vài hàng và cột, thực hiện các ví dụ này và xác nhận kết quả. DataFrame của chúng tôi chứa tên cột >>> data['mass'] 0 720 1 107000 2 914 3 780 4 4239 5 910 6 30000 Name: mass, dtype: int64 0, >>> data['mass'] 0 720 1 107000 2 914 3 780 4 4239 5 910 6 30000 Name: mass, dtype: int64 1, >>> data['mass'] 0 720 1 107000 2 914 3 780 4 4239 5 910 6 30000 Name: mass, dtype: int64 2 và >>> data['mass'] 0 720 1 107000 2 914 3 780 4 4239 5 910 6 30000 Name: mass, dtype: int64 3.

import pandas as pd data = pd.read_csv('Met.csv') 2

3._

import pandas as pd data = pd.read_csv('Met.csv') 3


Gợi ý: 4

1 tuần trước ngày 04 tháng 10 năm 2021 & nbsp; · Trung bình mỗi 40 hàng từ tệp CSV cho đến khi ... Tìm hiểu thêm về Loop, CSV, trung bình, 1 tuần trước ngày 15 tháng 2 năm 2017 & NBSP; · Trong tệp CSV, làm thế nào tôi có thể tính toán Trung bình của các hàng được chọn trong một cột: cột. Nhập Numpy dưới dạng Nhập NP Matplotlib.Pyplot dưới dạng PLT Nhập Pandas dưới dạng PD #Read the, 1 tuần trước Pandas: Tính trung bình của mỗi hàng n từ tệp CSV [Làm đẹp máy tính của bạn: //www.hows.tech/p /reCommended.html] Pandas: Tính trung bình ..., tính trung bình của mỗi n hàng từ tệp CSV

import pandas as pd data = pd.read_csv('Met.csv') 4

import pandas as pd data = pd.read_csv('Met.csv') 5


Gợi ý: 5

Tính trung bình của mỗi n hàng từ tệp CSV, cách tính giá trị trung bình của các cặp hàng khác nhau và xóa các hàng N-1 khỏi DataFrame? GANDAS DATAFRAME Sử dụng các ô từ các hàng khác nhau

Bạn có thể sử dụng phân chia số nguyên bằng >>> data['mass'] 0 720 1 107000 2 914 3 780 4 4239 5 910 6 30000 Name: mass, dtype: int64 4 cho các nhóm liên tiếp và chuyển sang >>> data['mass'] 0 720 1 107000 2 914 3 780 4 4239 5 910 6 30000 Name: mass, dtype: int64 5 cho tổng hợp >>> data['mass'] 0 720 1 107000 2 914 3 780 4 4239 5 910 6 30000 Name: mass, dtype: int64 6:

import pandas as pd data = pd.read_csv('Met.csv') 6

Or:

import pandas as pd data = pd.read_csv('Met.csv') 7

Dữ liệu mẫu:

import pandas as pd data = pd.read_csv('Met.csv') 8

Bạn có thể nhận được có nghĩa là sử dụng >>> data['mass'] 0 720 1 107000 2 914 3 780 4 4239 5 910 6 30000 Name: mass, dtype: int64 7 và sau đó lọc kết quả bằng cách sử dụng cắt lát

import pandas as pd data = pd.read_csv('Met.csv') 9

Nó có thể đơn giản hơn để làm tất cả trong Numpy.

>>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 0

Bản in này:

>>> data name id nametype recclass mass 0 Aarhus 2 Valid H6 720 1 Abee 6 Valid EH4 107000 2 Acapulco 10 Valid Acapulcoite 914 3 Achiras 370 Valid L6 780 4 Adhi Kot 379 Valid EH4 4239 5 Adzhi 390 Valid LL3-6 910 6 Agen 392 Valid H5 30000 1


Làm thế nào để bạn tìm thấy trung bình của một tệp CSV trong Python?

Các bước để tính toán số liệu thống kê từ tệp CSV đã nhập..
Bước 1: Sao chép tập dữ liệu vào tệp CSV. Để bắt đầu, bạn sẽ cần sao chép bộ dữ liệu trên vào tệp CSV. ....
Bước 2: Nhập tệp CSV vào Python. ....
Bước 3: Sử dụng gấu trúc để tính toán số liệu thống kê từ tệp CSV đã nhập ..

Làm thế nào để bạn trung bình một cột trong Python?

Để tính toán giá trị trung bình của toàn bộ các cột trong DataFrame, hãy sử dụng pandas.series.mean () với danh sách các cột DataFrame. Bạn cũng có thể nhận được giá trị trung bình cho tất cả các cột số bằng DataFrame.Mean (), sử dụng đối số Axis = 0 để tính giá trị trung bình của cột của DataFrame.use pandas.Series.mean() with a list of DataFrame columns. You can also get the mean for all numeric columns using DataFrame.mean(), use axis=0 argument to calculate the column-wise mean of the DataFrame.

Làm cách nào để tổng hợp một cột trong CSV Python?

Làm cách nào để tổng hợp một cột trong Python CSV ?..
Nhập Gandas dưới dạng PD ..
Dữ liệu = pd.read_csv ('pandas.csv').
df = pd.DataFrame (dữ liệu).
id_sum = 0 ..
data_sum = 0 ..
Đối với I trong phạm vi (Len (DF)):.
if (i == len (df) -2 hoặc i == len (df) -1):.
id_sum = id_sum + df.ILOC [i] [0].

Làm thế nào để bạn tìm thấy giá trị trung bình của một tệp CSV?

Phương pháp 1: Sử dụng hàm trung bình trong phương thức này để tính giá trị trung bình của cột của tệp CSV, chúng tôi chỉ cần sử dụng hàm trung bình () với tên cột làm tham số của nó và hàm này sẽ trả về giá trị trung bình của cột được cung cấp của CSVtập tin.use the mean() function with the column name as its parameter and this function will be returning the mean of the provided column of the CSV file.

Chủ đề