CSV (Giá trị được phân tách bằng dấu phẩy) hoặc giá trị được phân tách bằng dấu phẩy) là một định dạng tệp đơn giản được sử dụng để lưu trữ dữ liệu dưới dạng bảng, ví dụ như bảng tính hoặc cơ sở dữ liệu. Tệp CSV lưu trữ định dạng bảng dữ liệu (số và văn bản) ở định dạng văn bản thuần túy. Mỗi dòng của tệp là một bản ghi dữ liệu. Mỗi bản ghi bao gồm một hoặc nhiều trường, được phân tách bằng dấu phẩy. Việc sử dụng dấu phẩy làm dấu phân tách trường là nguồn gốc của tên cho định dạng tệp này
Đối với các tệp CSV đang hoạt động trong python, có sẵn một mô-đun được gọi là csv
Cách đọc tệp CSV trong Python
# nhập mô-đun csv
nhập csv
# tên tệp csv
tên tệp = "aapl. csv"
# khởi tạo danh sách tiêu đề và hàng
trường = []
hàng = []
# đọc tệp csv
với open(filename, 'r') dưới dạng csvfile
# tạo đối tượng trình đọc csv
csvreader = csv. trình đọc (csvfile)
# trích xuất tên trường qua hàng đầu tiên
các trường = tiếp theo (csvreader)
# trích xuất từng hàng dữ liệu một
cho hàng trong csvreader
hàng. nối thêm (hàng)
# lấy tổng số hàng
print("Tổng số không. hàng. %d"%(csvreader. dòng_num))
# in tên trường
print('Tên trường là. ' + ', '. tham gia (trường cho trường trong trường))
# in 5 hàng đầu tiên
print('\5 hàng đầu tiên là. \N')
cho hàng trong hàng [. 5]
# phân tích từng cột của một hàng
cho col trong hàng
in("%10s"%col),
in('\n')
đầu ra
Ví dụ về Tệp CSV trong Python
>>>Xem thêm. Câu lệnh if other trong Python - Tất tần tật về câu lệnh if other trong Python
Cấu hình tạo tệp CSV trong Python
Một tệp CSV bao gồm 3 phần
- First first. tương ứng với cột đầu tiên trong bảng tính, biểu thị tên của các cột, mỗi cột được ngăn cách nhau bởi dấu phẩy
- Phần thứ 2. tương ứng với cột cuối cùng trong bảng tính
- Phần thứ 3. bao gồm các dòng có cấu trúc tương đương nhau, tương ứng với nội dung của các cột giá trị trong bảng tính. Lưu ý, mỗi dòng của văn bản là một dòng có giá trị khác nhau trên bảng tính.
Cách đọc tệp CSV trong Python
Có nhiều cách khác nhau để đọc tệp CSV bằng cách sử dụng mô-đun csv hoặc thư viện pandas trong Python
- Mô đun csv. Mô-đun CSV là một trong các mô-đun bằng Python cung cấp các lớp để đọc và ghi thông tin dưới dạng bảng ở định dạng tệp CSV
- pandas thư viện. Thư viện pandas là một trong những mã nguồn mở Python của thư viện cung cấp cấu trúc dữ liệu thuận tiện, hiệu suất cao và các công cụ và kỹ thuật phân tích dữ liệu để lập trình Python
File CSV bên dưới có tên 'Giants. CSV'
Ví dụ về đọc tệp CSV trong Python
>>>Tham khảo. Key learning set Python
Use csv. người đọc ()
Lúc đầu, tệp CSV được mở bằng phương thức open() mở chế độ 'r' (chỉ định chế độ đọc trong khi mở tệp) trả về đối tượng tệp sau đó nó được đọc bằng cách sử dụng phương thức .
Lưu ý. Các từ khóa ' with' được sử dụng tương tự với các phương pháp mở () vì nó đơn giản hóa việc xử lý ngoại lệ và tự động đóng các tệp CSV.
nhập csv
# mở tệp CSV
với open('Giants. csv', mode ='r') dưới dạng tệp.
# đọc tệp CSV
csvFile = csv. người đọc (tập tin)
# hiển thị nội dung của tệp CSV
cho các dòng trong tệp csv.
in (dòng)
Đầu ra nhận được
['Tổ chức', 'Giám đốc điều hành', 'Thành lập']
['Bảng chữ cái', 'Sundar Pichai', '02-Oct-15']
['Microsoft', 'Satya Nadella', '04-Apr-75']
['Amazon', 'Jeff Bezos', '05-Jul-94']
Trong chương trình trên, phương thức reader() được sử dụng để đọc tệp Giants. csv ánh xạ dữ liệu vào danh sách
Use layer csv. DictReader ()
Tương tự như phương pháp trước, tệp CSV lần đầu tiên được mở bằng phương thức open() này sau đó được đọc bằng cách sử dụng DictReader, lớp mô-đun csv hoạt động giống như một trình đọc thông thường nhưng ánh xạ thông tin . Dòng đầu tiên của bao gồm các từ điển từ khóa
nhập csv
# mở tệp CSV
với open('Giants. csv', mode ='r') dưới dạng tệp
# đọc tệp CSV
csvFile = csv. DictReader(tệp)
# hiển thị nội dung của tệp CSV
cho các dòng trong tệp csv
in (dòng)
đầu ra
OrderedDict([('Organiztion', 'Alphabet'), ('CEO', 'Sundar Pichai'), ('Thành lập', '02-Oct-15′)])
OrderedDict([('Tổ chức', 'Microsoft'), ('CEO', 'Satya Nadella'), ('Thành lập', '04-Apr-75′)])
OrderedDict([('Tổ chức', 'Aamzon'), ('CEO', 'Jeff Bezos'), ('Thành lập', '05-Jul-94′)])
Use pandas method. read_csv (). Rất dễ dàng và đơn giản để đọc tệp CSV bằng các pandas thư viện hàm. Ở đây, phương thức read_csv() trong thư viện Pandas được sử dụng để đọc dữ liệu từ tệp CSV
gấu trúc nhập khẩu
# đọc tệp CSV
csvFile = gấu trúc. read_csv('Người khổng lồ. csv')
# hiển thị nội dung của tệp CSV
in (csvFile)
đầu ra
Tổ chức Giám đốc điều hành được thành lập
0 Bảng chữ cái Sundar Pichai 02-Oct-15
1 Microsoft Satya Nadella 04-Apr-75
2 Aamzon Jeff Bezos 05-Jul-94
Kết luận. Bài viết trên đã giúp bạn tìm hiểu về tệp CSV trong Python. Có rất nhiều trang web cung cấp dữ liệu của họ ở định dạng này và tệp CSV cũng được sử dụng rất nhiều trong thế giới kinh doanh. Hy vọng các kiến thức về CSV sẽ hữu ích với bạn trong quá trình học lập trình. Tìm hiểu thêm về ngôn ngữ lập trình thông qua các từ khóa học lập trình bổ ích tại T3H bạn nhé