Hướng dẫn python read csv xlsx - python đọc csv xlsx

Trong hướng dẫn python lần trước, chúng tôi đã nghiên cứu  Cách làm việc với Cơ sở dữ liệu quan hệ với Python . Trong hướng dẫn này, chúng tôi sẽ thảo luận về các loại Định dạng tệp dữ liệu Python khác nhau: Python CSV, JSON và XLS. Hơn nữa, chúng ta sẽ thảo luận về cách đọc các tệp CSV, JSON, XLS bằng Ngôn ngữ lập trình Python .

Show

Vì vậy, hãy xem Định dạng tệp dữ liệu Python.

Các bài viết liên quan:

  • Định dạng tệp dữ liệu Python
  • Chuẩn bị thư viện
  • Làm thế nào để đọc tệp CSV bằng Python?
  • Làm thế nào để đọc tệp JSON bằng Python?
  • Làm thế nào để đọc tệp XLS bằng Python?
  • Kết luận

Định dạng tệp dữ liệu Python

Chuẩn bị thư viện

Làm thế nào để đọc tệp CSV bằng Python?

Làm thế nào để đọc tệp JSON bằng Python?

Làm thế nào để đọc tệp XLS bằng Python?

Kết luận

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Đầu tiên chúng ta hãy tìm hiểu một chút về các định dạng Tệp dữ liệu Python mà chúng ta sẽ xử lý.

Định dạng tệp dữ liệu Python – Python CSV

Dữ liệu CSV trong Python là cơ bản với khoa học dữ liệu. Tệp Giá trị được Phân tách bằng Dấu phẩy sử dụng dấu phẩy để phân tách các giá trị. Bạn có thể xem nó như một tệp văn bản được phân tách chứa dữ liệu dạng bảng dưới dạng văn bản thuần túy. Một vấn đề với điều này có thể phát sinh khi dữ liệu mà nó lưu giữ chứa dấu phẩy hoặc dấu ngắt dòng – chúng ta có thể sử dụng các dấu phân cách khác như dấu dừng tab. Định dạng tệp dữ liệu Python này tỏ ra hữu ích trong việc trao đổi dữ liệu và di chuyển dữ liệu dạng bảng giữa các chương trình. Phần mở rộng cho tệp CSV là .csv.

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Đây là tệp CSV Python mà chúng tôi sẽ sử dụng cho bản demo

Chúng tôi đã lưu mục này dưới dạng schedule.csv trên Máy tính để bàn của mình. Nhớ lưu dưới dạng Tất cả các tệp (*. *) . Khi chúng tôi mở tệp này, nó sẽ mở trong Microsoft Excel theo mặc định trên Windows-

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Xem thêm Xuất dữ liệu trong R sang các định dạng file khác

Định dạng tệp dữ liệu Python – Python JSON

JSON là viết tắt của JavaScript Object Notation và là một định dạng tệp tiêu chuẩn mở. Trong khi nó chứa các cặp thuộc tính-giá trị và kiểu dữ liệu mảng, nó sử dụng văn bản mà con người có thể đọc được cho việc này. Định dạng tệp dữ liệu Python này không phụ thuộc vào ngôn ngữ và chúng tôi có thể sử dụng nó trong giao tiếp máy chủ-trình duyệt không đồng bộ. Phần mở rộng cho tệp JSON Python là .json.

Hướng dẫn python read csv xlsx - python đọc csv xlsx
Hướng dẫn python read csv xlsx - python đọc csv xlsx

Hãy khám phá Python Zipfile – Lợi ích, Mô-đun, Đối tượng

Đây là tệp JSON bằng Python mà chúng tôi sẽ sử dụng cho bản demo-

Chúng tôi lưu nó dưới dạng Schedule.json trên Desktop.

Chuẩn bị thư viện

Làm thế nào để đọc tệp CSV bằng Python?

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Làm thế nào để đọc tệp JSON bằng Python?

Làm thế nào để đọc tệp CSV bằng Python?

Làm thế nào để đọc tệp JSON bằng Python?

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Làm thế nào để đọc tệp XLS bằng Python?

Kết luận

import pandas #sử dụng thư viện pandas
import os #sử dụng thư viện os
os.chdir('C:\\Users\\admin\\Desktop') #khai báo thư mục đường dẫn
print(pandas.read_csv('schedule.csv')) # dọc file schedulte.csv

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Đầu tiên chúng ta hãy tìm hiểu một chút về các định dạng Tệp dữ liệu Python mà chúng ta sẽ xử lý.

Định dạng tệp dữ liệu Python – Python CSV

data=pandas.read_csv('schedule.csv') #đọc file csv
print(data[0:3]['title']) #in ra giá trị cột title hàng index 0 đến 3

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Dữ liệu CSV trong Python là cơ bản với khoa học dữ liệu. Tệp Giá trị được Phân tách bằng Dấu phẩy sử dụng dấu phẩy để phân tách các giá trị. Bạn có thể xem nó như một tệp văn bản được phân tách chứa dữ liệu dạng bảng dưới dạng văn bản thuần túy. Một vấn đề với điều này có thể phát sinh khi dữ liệu mà nó lưu giữ chứa dấu phẩy hoặc dấu ngắt dòng – chúng ta có thể sử dụng các dấu phân cách khác như dấu dừng tab. Định dạng tệp dữ liệu Python này tỏ ra hữu ích trong việc trao đổi dữ liệu và di chuyển dữ liệu dạng bảng giữa các chương trình. Phần mở rộng cho tệp CSV là .csv.

Đây là tệp CSV Python mà chúng tôi sẽ sử dụng cho bản demo

data=pandas.read_csv('schedule.csv') #đọc file CSV
print(data.loc[:,['title','rating']]) # in ra 2 cột title và rating

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Chúng tôi đã lưu mục này dưới dạng schedule.csv trên Máy tính để bàn của mình. Nhớ lưu dưới dạng Tất cả các tệp (*. *) . Khi chúng tôi mở tệp này, nó sẽ mở trong Microsoft Excel theo mặc định trên Windows-

Xem thêm Xuất dữ liệu trong R sang các định dạng file khác

>>> data=pandas.read_csv('schedule.csv') #đọc file CSV
>>> print(data.loc[[1,3],['title','rating']]) # in ra 2 cột title và rating hàng 1 và 3

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Định dạng tệp dữ liệu Python – Python JSON

JSON là viết tắt của JavaScript Object Notation và là một định dạng tệp tiêu chuẩn mở. Trong khi nó chứa các cặp thuộc tính-giá trị và kiểu dữ liệu mảng, nó sử dụng văn bản mà con người có thể đọc được cho việc này. Định dạng tệp dữ liệu Python này không phụ thuộc vào ngôn ngữ và chúng tôi có thể sử dụng nó trong giao tiếp máy chủ-trình duyệt không đồng bộ. Phần mở rộng cho tệp JSON Python là .json.

data=pandas.read_csv('schedule.csv') #đọc file CSV
>>> print(data.loc[1:3,['title','rating']])# in ra 2 cột title và rating hàng 1 đến 3

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Hãy khám phá Python Zipfile – Lợi ích, Mô-đun, Đối tượng

Đây là tệp JSON bằng Python mà chúng tôi sẽ sử dụng cho bản demo-

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Làm thế nào để đọc tệp JSON bằng Python?

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Làm thế nào để đọc tệp XLS bằng Python?

Kết luận

Đầu tiên chúng ta hãy tìm hiểu một chút về các định dạng Tệp dữ liệu Python mà chúng ta sẽ xử lý.

Định dạng tệp dữ liệu Python – Python CSV

import pandas
print(pandas.read_csv('schedule.csv'))

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Dữ liệu CSV trong Python là cơ bản với khoa học dữ liệu. Tệp Giá trị được Phân tách bằng Dấu phẩy sử dụng dấu phẩy để phân tách các giá trị. Bạn có thể xem nó như một tệp văn bản được phân tách chứa dữ liệu dạng bảng dưới dạng văn bản thuần túy. Một vấn đề với điều này có thể phát sinh khi dữ liệu mà nó lưu giữ chứa dấu phẩy hoặc dấu ngắt dòng – chúng ta có thể sử dụng các dấu phân cách khác như dấu dừng tab. Định dạng tệp dữ liệu Python này tỏ ra hữu ích trong việc trao đổi dữ liệu và di chuyển dữ liệu dạng bảng giữa các chương trình. Phần mở rộng cho tệp CSV là .csv.

Đây là tệp CSV Python mà chúng tôi sẽ sử dụng cho bản demo

Chúng tôi đã lưu mục này dưới dạng schedule.csv trên Máy tính để bàn của mình. Nhớ lưu dưới dạng Tất cả các tệp (*. *) . Khi chúng tôi mở tệp này, nó sẽ mở trong Microsoft Excel theo mặc định trên Windows-

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Xem thêm Xuất dữ liệu trong R sang các định dạng file khác

Định dạng tệp dữ liệu Python – Python JSON

data=pandas.read_csv('schedule.csv')
print(data.to_json(orient='records',lines=True))

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Làm thế nào để đọc tệp XLS bằng Python?

Kết luận

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Đầu tiên chúng ta hãy tìm hiểu một chút về các định dạng Tệp dữ liệu Python mà chúng ta sẽ xử lý.

Định dạng tệp dữ liệu Python – Python CSV

import pandas #import thư viện
print(pandas.read_excel('schedule.xlsx'))#đọc file xlsx

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Dữ liệu CSV trong Python là cơ bản với khoa học dữ liệu. Tệp Giá trị được Phân tách bằng Dấu phẩy sử dụng dấu phẩy để phân tách các giá trị. Bạn có thể xem nó như một tệp văn bản được phân tách chứa dữ liệu dạng bảng dưới dạng văn bản thuần túy. Một vấn đề với điều này có thể phát sinh khi dữ liệu mà nó lưu giữ chứa dấu phẩy hoặc dấu ngắt dòng – chúng ta có thể sử dụng các dấu phân cách khác như dấu dừng tab. Định dạng tệp dữ liệu Python này tỏ ra hữu ích trong việc trao đổi dữ liệu và di chuyển dữ liệu dạng bảng giữa các chương trình. Phần mở rộng cho tệp CSV là .csv.

C:\Users\admin>pip install xlrd

Dữ liệu CSV trong Python là cơ bản với khoa học dữ liệu. Tệp Giá trị được Phân tách bằng Dấu phẩy sử dụng dấu phẩy để phân tách các giá trị. Bạn có thể xem nó như một tệp văn bản được phân tách chứa dữ liệu dạng bảng dưới dạng văn bản thuần túy. Một vấn đề với điều này có thể phát sinh khi dữ liệu mà nó lưu giữ chứa dấu phẩy hoặc dấu ngắt dòng – chúng ta có thể sử dụng các dấu phân cách khác như dấu dừng tab. Định dạng tệp dữ liệu Python này tỏ ra hữu ích trong việc trao đổi dữ liệu và di chuyển dữ liệu dạng bảng giữa các chương trình. Phần mở rộng cho tệp CSV là .csv.

Khi bạn chỉ muốn tìm nạp một số hàng và cột nhất định, bạn có thể sử dụng phương thức .loc ().

data=pandas.read_csv('schedule.csv') #đọc file csv
print(data[0:3]['title']) #in ra giá trị cột title hàng index 0 đến 3
0

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Đọc nhiều hơn một trang sheet

data=pandas.read_csv('schedule.csv') #đọc file csv
print(data[0:3]['title']) #in ra giá trị cột title hàng index 0 đến 3
1

Hướng dẫn python read csv xlsx - python đọc csv xlsx
Hướng dẫn python read csv xlsx - python đọc csv xlsx

Sử dụng mô-đun Python XLRD

Hướng dẫn python read csv xlsx - python đọc csv xlsx

Vì vậy, đây là tất cả về Định dạng tệp dữ liệu Python. Hy vọng bạn thích giải thích của chúng tôi.

Kết luận

Do đó, trong hướng dẫn này, chúng tôi đã thảo luận về các loại Định dạng tệp dữ liệu Python khác nhau. Ngoài ra, chúng tôi cũng đã học cách xử lý / đọc các định dạng như tệp CSV, JSON và XLS bằng Python. Hãy để lại ý kiến ​​của bạn bên dưới và đừng quên truy cập lại để xem một bài hướng dẫn khác vào ngày mai.

Xem thêm Định dạng Number trong SAS