Hướng dẫn read csv separated by comma python - đọc csv được phân tách bằng python dấu phẩy

Tệp CSV (Giá trị phân tách bằng dấu phẩy) là một tệp có các giá trị được phân tách bởi dấu phẩy. Nó thường được sử dụng để nhập và xuất với cơ sở dữ liệu và bảng tính.

Các giá trị chủ yếu được phân tách bởi dấu phẩy. Đôi khi một nhân vật khác được sử dụng giống như dấu chấm phẩy, ký tự tách biệt được gọi là dấu phân cách.

Khóa học liên quan: Phân tích dữ liệu với gấu trúc và Python Data Analysis with Pandas and Python

Tệp CSV là gì?

Tệp CSV là một loại tệp văn bản đơn giản chứa các giá trị được phân tách bằng dấu phân cách. Tiện ích mở rộng

csvReader = csv.reader(csvfile, delimiter=',')
0 là viết tắt của
csvReader = csv.reader(csvfile, delimiter=',')
1, vì dấu phân cách thường là dấu phẩy.

Excel có thể mở các tệp CSV. Ứng dụng web cho phép xuất dữ liệu vào tệp CSV.

Theo mặc định, một tệp CSV có các hàng và cột, vì nó là một đại diện của dữ liệu bảng. Bạn có thể xem mọi giá trị là một ô và mọi dòng là một hàng.

Tệp mẫu CSV

Bạn có thể biểu diễn một bảng trong tệp CSV (giá trị phân tách bằng dấu phẩy). Văn bản là dữ liệu bảng. Mỗi dòng của tệp CSV là một dòng bên trong bảng, trong đó mọi giá trị (được phân tách bởi dấu phẩy) là một dấu phân cách (dấu phẩy, dấu chấm phẩy hoặc dấu phân cách khác*).

Bởi vì các tệp CSV là dữ liệu văn bản đơn giản, hầu như tất cả các ngôn ngữ lập trình đều hỗ trợ nó. Bạn có thể dễ dàng phân tích nó trong Python.

Bảng dữ liệu

Bạn có thể có bảng này:

TênTuổi tácLương
Chris20 $ 3600
Harry25 $ 3200
Barry30 $ 3000

Dữ liệu CSV

Và biểu thị cùng một dữ liệu như một tệp

csvReader = csv.reader(csvfile, delimiter=',')
0.

Chris,20,3600
Harry,25,3200
Barry,30,3000

Ở đây, mỗi hàng trong tệp khớp với một hàng trong bảng và mỗi giá trị là một ô trong bảng.

Đọc CSV

Trong Python, có hai cách phổ biến để đọc các tệp CSV:

  • Đọc CSV với mô -đun CSVcsv module
  • Đọc CSV với mô -đun Pandas (xem dưới cùng)pandas module (see bottom)

Mô -đun Python CSV

Python đi kèm với một mô -đun để phân tích các tệp CSV, mô -đun

csvReader = csv.reader(csvfile, delimiter=',')
3. Bạn có thể sử dụng mô -đun này để đọc và ghi dữ liệu mà không cần phải thực hiện các hoạt động chuỗi và tương tự.

Đọc tệp CSV

Hãy tìm hiểu cách đọc tệp CSV. Bạn có thể sử dụng mô -đun CSV. Mô -đun đã được cài đặt, chỉ cần nhập nó với

csvReader = csv.reader(csvfile, delimiter=',')
4.how to read a csv file. You can use the csv module. The module is already installed, just import it with
csvReader = csv.reader(csvfile, delimiter=',')
4.

Sau đó, bạn sẽ muốn mở tệp CSV, bạn có thể với:

with open('office.csv') as csvfile:

Sau đó tạo một đối tượng đầu đọc

csvReader = csv.reader(csvfile, delimiter=',')
5 trong đó các tham số là tên tệp và dấu phân cách.

Điều này nghe có vẻ khó, nhưng nó đơn giản như:

csvReader = csv.reader(csvfile, delimiter=',')

Sau đó, bạn có thể lặp qua các hàng và phân tích chúng hoặc hiển thị chúng.

import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)

Khi bạn chạy chương trình, nó sẽ hiển thị cho bạn từng hàng dưới dạng danh sách

➜  ~ python3 program.py
['Chris', '20', '3600']
['Harry', '25', '3200']
['Barry', '30', '3000']

Bởi vì nó là một danh sách, bạn có thể truy cập các ô bằng dấu ngoặc vuông. Ô đầu tiên là

csvReader = csv.reader(csvfile, delimiter=',')
6, ô thứ hai ____27 vvetera.
The first cell is
csvReader = csv.reader(csvfile, delimiter=',')
6, the second cell
csvReader = csv.reader(csvfile, delimiter=',')
7 etcetera.

for row in csvReader:
print(row[0])
print(row[1])

Đọc một CSV như một dict

Nếu bạn muốn đọc dữ liệu vào từ điển thay vì danh sách, bạn có thể làm điều đó. Mô -đun CSV đi kèm với

csvReader = csv.reader(csvfile, delimiter=',')
8. Điều này cho phép bạn đọc một tệp CSV dưới dạng từ điển.
The csv module comes with a
csvReader = csv.reader(csvfile, delimiter=',')
8. This lets you read a csv file as dictionary.

Nếu bạn muốn đọc nó như một từ điển, hãy đảm bảo bao gồm một tiêu đề vì điều đó sẽ được bao gồm trong ánh xạ giá trị khóa.include a header because that will be included in the key-value mapping.

name,age,salary
Chris,20,3600
Harry,25,3200
Barry,30,3000

Sau đó, chương trình của bạn có thể đọc CSV với

csvReader = csv.reader(csvfile, delimiter=',')
9

import csv

csvReader = csv.DictReader(open("students.csv"))
for row in csvReader:
print(row)

Chương trình sau đó xuất ra từ điển:

OrderedDict([('name', 'Chris'), ('age', '20'), ('salary', '3600')])
OrderedDict([('name', 'Harry'), ('age', '25'), ('salary', '3200')])
OrderedDict([('name', 'Barry'), ('age', '30'), ('salary', '3000')])

Một chức năng

import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
0 chính xác giống như bình thường
import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
1.

Khóa học liên quan: Phân tích dữ liệu với gấu trúc và Python Data Analysis with Pandas and Python

Chức năng mô -đun CSV

Mô -đun

csvReader = csv.reader(csvfile, delimiter=',')
3 đi kèm với nhiều chức năng khác nhau:

  • csv.field_size_limit - trả về kích thước trường tối đa
  • csv.get_dialect - Nhận phương ngữ được liên kết với tên
  • CSV.List_Dialects - Hiển thị tất cả các phương ngữ đã đăng ký
  • CSV.Reader - Đọc dữ liệu từ tệp CSV – read data from a csv file
  • CSV.Register_Dialect - Phương ngữ liên kết với tên
  • CSV.Writer - Viết dữ liệu vào tệp CSV
  • csv.unregister_dialect - xóa phương ngữ được liên kết với tên đăng ký phương ngữ
  • csv.quote_all - Trích dẫn mọi thứ, bất kể loại.
  • csv.quote_minimal - các trường trích dẫn với các ký tự đặc biệt
  • csv.quote_nonnumeric - trích dẫn tất cả các trường có giá trị số aren
  • csv.quote_none - don lồng trích dẫn bất cứ điều gì trong đầu ra

Bài viết này chỉ tập trung vào

import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
3, cho phép bạn đọc một tệp.

Đọc CSV với gấu trúc

Hướng dẫn read csv separated by comma python - đọc csv được phân tách bằng python dấu phẩy

Pandas là một thư viện phân tích dữ liệu. Nó thường được sử dụng trong khoa học dữ liệu. Nếu bạn làm việc với dữ liệu rất nhiều, sử dụng mô -đun

import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
4 sẽ tốt hơn. is a data analysis library. It often used in data science. If you work with data a lot, using the
import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
4 module is way better.

Đầu tiên chúng tôi bắt đầu với một số dữ liệu. Giả sử bạn có tệp CSV chứa thống kê quốc gia,

import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
5:

Quốc gia, Thủ đô, Ngôn ngữ, Quốc gia Tiền tệ, Washington, Tiếng Anh, US Bolarcanada, Ottawa, Tiếng Anh và Pháp, Dollargermany của Canada, Berlin, Đức, Euro
United States, Washington, English, US dollar
Canada, Ottawa, English and French, Canadian dollar
Germany, Berlin, German, Euro

Theo mặc định, mô -đun

import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
4 không được cài đặt. Bạn có thể cài đặt nó với Python Gói Manager Pip. Sau khi cài đặt, tải nó như thế này:

import pandas as pd

Pandas có chức năng Đọc các tệp CSV,

import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
7.

Điều này tải tệp CSV vào khung dữ liệu gấu trúc.

with open('office.csv') as csvfile:
0

Pandas làm việc với DataFrames chứa tất cả dữ liệu. Khung dữ liệu là cấu trúc dữ liệu thực sự thú vị, chúng cho phép bạn lấy toàn bộ hàng cùng một lúc, bằng cách sử dụng tên tiêu đề của nó. (Tiêu đề là dòng đầu tiên trong tệp CSV)Data frames are really cool data structures, they let you grab an entire row at once, by using it’s header name. (The header was the first line in the csv file)

with open('office.csv') as csvfile:
1

Thí dụ

Chương trình dưới đây đọc một tệp CSV với gấu trúc .:reads a csv file with pandas.:

with open('office.csv') as csvfile:
2

Điều này xuất ra cả dataFrame

import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
8 và một hàng
import csv

with open('office.csv') as csvfile:
csvReader = csv.reader(csvfile, delimiter=',')
for row in csvReader:
print(row)
9

with open('office.csv') as csvfile:
3

Bạn có thể lặp lại hàng từng hàng như thế này:

with open('office.csv') as csvfile:
4

Phân định

Nếu bạn có một dấu phân cách khác so với dấu phẩy mặc định, hãy nói một đường ống thì bạn sử dụng tham số

➜  ~ python3 program.py
['Chris', '20', '3600']
['Harry', '25', '3200']
['Barry', '30', '3000']
0.

with open('office.csv') as csvfile:
5

Nếu tệp CSV của bạn không bao gồm tiêu đề, bạn có thể xóa nó khỏi tệp hoặc thay đổi chương trình để có tham số

➜  ~ python3 program.py
['Chris', '20', '3600']
['Harry', '25', '3200']
['Barry', '30', '3000']
1.

with open('office.csv') as csvfile:
6

Nếu nó trên một dòng khác (giả sử dòng thứ 2) bạn có thể sử dụng:

with open('office.csv') as csvfile:
7

Tên gấu trúc

Nếu dữ liệu CSV của bạn không có tiêu đề, đừng lo lắng. Bạn có thể xác định các cột trong mã trong khi mở tệp:

with open('office.csv') as csvfile:
8

gấu trúc sử dụng_cols

Nếu bạn chỉ muốn tải các cột cụ thể, bạn có thể chỉ định tham số ________ 42. Điều này rất hữu ích nếu bạn có một CSV lớn với nhiều cột. Bạn có thể xác định một quặng nhiều cột hơn:
This is useful if you have a large csv with a lot of columns. You can define one ore more columns:

with open('office.csv') as csvfile:
9

Khóa học liên quan: Phân tích dữ liệu với gấu trúc và Python Data Analysis with Pandas and Python

Làm cách nào để đọc một tệp CSV phân tách bằng dấu phẩy trong Python?

Các bước để đọc tệp CSV:..
Nhập thư viện CSV. Nhập CSV ..
Mở tệp CSV. Các . ....
Sử dụng đối tượng CSV.Reader để đọc tệp CSV. csvreader = csv.Reader (tệp).
Trích xuất tên trường. Tạo một danh sách trống gọi là tiêu đề. ....
Trích xuất các hàng/hồ sơ. ....
Đóng tệp ..

Làm cách nào để đọc một tệp phân tách bằng dấu phẩy trong Python?

Đọc một tệp CSV bằng Python..
Sử dụng thư viện CSV. Nhập CSV với Open ("./ Bwq.csv", 'r') dưới dạng tệp: csvreader = csv.reader (tệp) cho hàng trong csvreader: in (hàng) ở đây chúng tôi đang nhập thư viện CSV để sử dụng. ....
Sử dụng thư viện Pandas. Nhập gấu trúc dưới dạng dữ liệu PD = pd.Read_CSV ("BWQ.CSV") dữ liệu ..

Làm cách nào để đọc dấu phẩy trong tệp CSV?

Sử dụng tính năng "Từ văn bản" trong Excel Chọn tệp CSV có dữ liệu được phân cụm thành một cột. Chọn Phân đoạn, sau đó đảm bảo nguồn gốc tệp là UNICode UTF-8. Chọn dấu phẩy (đây là bộ phân cách danh sách mặc định của mối quan hệ). Bản xem trước sẽ hiển thị các cột được tách ra. Select the CSV file that has the data clustered into one column. Select Delimited, then make sure the File Origin is Unicode UTF-8. Select Comma (this is Affinity's default list separator). The preview will show the columns being separated.

Làm cách nào để đọc một giá trị ô cụ thể từ tệp CSV trong Python?

Sử dụng độc giả..
Bước 1: Để đọc các hàng trong Python, trước tiên, chúng ta cần tải tệp CSV trong một đối tượng.Vì vậy, để tải tệp CSV vào một đối tượng sử dụng phương thức Open () ..
Bước 2: Tạo đối tượng đầu đọc bằng cách chuyển đối tượng tệp được tạo ở trên cho hàm đầu đọc ..
Bước 3: Sử dụng cho vòng lặp trên đối tượng đầu đọc để có được mỗi hàng ..