Hướng dẫn read csv python pandas with header - đọc csv python gấu trúc với tiêu đề

pandas.read_csv (filepath_or_buffer, *, sep = _nodefault.no_default, delimiter = none Đúng, dtype = none, động cơ = không, bộ chuyển đổi = none, true_values = none verbose = false, skip_blank_lines = true, parse_dates = none, infer_dateTime_format = false, keep_date_col = false, date_parser = none decimal = '.', lineterminator = none, quotechar = '"', trích dẫn = 0, doublequote = true WARN_BAD_LINES = Không, on_bad_lines = none, delim_whitespace = false, low_memory = true, memory_map = falseread_csv(filepath_or_buffer, *, sep=_NoDefault.no_default, delimiter=None, header='infer', names=_NoDefault.no_default, index_col=None, usecols=None, squeeze=None, prefix=_NoDefault.no_default, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=None, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression='infer', thousands=None, decimal='.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, encoding_errors='strict', dialect=None, error_bad_lines=None, warn_bad_lines=None, on_bad_lines=None, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None, storage_options=None)[source]#

Đọc một tệp giá trị được phân tách bằng dấu phẩy (CSV) vào DataFrame.

Nội dung chính Show

Làm thế nào để bạn đọc một tệp CSV trong một python tiêu đề?
Làm cách nào để đọc tệp CSV trong Pandas Python?
Làm cách nào để đọc một cột dữ liệu khôn ngoan từ tệp CSV trong Python?
Làm cách nào để đọc một tệp CSV liên tiếp trong Python?

Cũng hỗ trợ tùy chọn lặp hoặc phá tệp thành các phần.

Trợ giúp bổ sung có thể được tìm thấy trong các tài liệu trực tuyến cho các công cụ IO.

ParameterSfilePath_or_bufferstr, đối tượng đường dẫn hoặc đối tượng giống như tệpfilepath_or_bufferstr, path object or file-like object

Bất kỳ đường dẫn chuỗi hợp lệ đều được chấp nhận. Chuỗi có thể là một url. Các sơ đồ URL hợp lệ bao gồm HTTP, FTP, S3, GS và FILE. Đối với URL tệp, một máy chủ được dự kiến. Một tệp cục bộ có thể là: Tệp: //localhost/path/to/table.csv.

Nếu bạn muốn vượt qua trong một đối tượng đường dẫn, Pandas chấp nhận bất kỳ os.PathLike nào.

Theo đối tượng giống như tệp, chúng tôi đề cập đến các đối tượng bằng phương thức read(), chẳng hạn như xử lý tệp (ví dụ: thông qua hàm tích hợp open) hoặc StringIO.

SEPSTR, mặc định ‘,str, default ‘,’

Phân định để sử dụng. Nếu SEP không có, động cơ C không thể tự động phát hiện bộ phân cách, nhưng công cụ phân tích cú pháp Python có thể, nghĩa là cái sau sẽ được sử dụng và tự động phát hiện bộ tách bằng công cụ Sniffer tích hợp Python, csv.Sniffer. Ngoài ra, các dấu phân cách dài hơn 1 ký tự và khác với '\s+' sẽ được hiểu là biểu thức thông thường và cũng sẽ buộc sử dụng công cụ phân tích cú pháp Python. Lưu ý rằng các phân định Regex có xu hướng bỏ qua dữ liệu được trích dẫn. Ví dụ Regex: '\r\t'.

Delimiterstr, mặc định Nonestr, default None

Bí danh cho sep.

headerint, danh sách int, none, mặc định ‘suy raint, list of int, None, default ‘infer’

(Các) số hàng để sử dụng làm tên cột và bắt đầu dữ liệu. Hành vi mặc định là suy ra tên cột: Nếu không có tên nào được truyền thì hành vi giống hệt với header=0 và tên cột được suy ra từ dòng đầu tiên của tệp, nếu tên cột được truyền rõ ràng thì hành vi này giống hệt với ____10. Vượt qua rõ ràng header=0 để có thể thay thế các tên hiện có. Tiêu đề có thể là một danh sách các số nguyên chỉ định các vị trí hàng cho một số chỉ số trên các cột, ví dụ: [0,1,3]. Các hàng can thiệp không được chỉ định sẽ bị bỏ qua (ví dụ: 2 trong ví dụ này được bỏ qua). Lưu ý rằng tham số này bỏ qua các dòng được bình luận và các dòng trống nếu os.PathLike2, do đó header=0 biểu thị dòng dữ liệu đầu tiên thay vì dòng đầu tiên của tệp.

Tên giống như, tùy chọnarray-like, optional

Danh sách các tên cột để sử dụng. Nếu tệp chứa hàng tiêu đề, thì bạn nên vượt qua rõ ràng header=0 để ghi đè tên cột. Sao chép trong danh sách này không được phép.

index_colint, str, chuỗi int / str hoặc false, tùy chọn, mặc định Noneint, str, sequence of int / str, or False, optional, default None

(Các) cột để sử dụng làm nhãn hàng của os.PathLike6, được đưa ra dưới dạng tên chuỗi hoặc chỉ mục cột. Nếu một chuỗi int / str được đưa ra, một đa dạng được sử dụng.

Lưu ý: os.PathLike7 có thể được sử dụng để buộc gấu trúc không sử dụng cột đầu tiên làm chỉ mục, ví dụ: Khi bạn có một tệp bị dị dạng với các dấu phân cách ở cuối mỗi dòng.

usecolslist giống như hoặc có thể gọi, tùy chọnlist-like or callable, optional

Trả về một tập hợp con của các cột. Nếu giống như danh sách, tất cả các phần tử phải là vị trí (nghĩa là các chỉ số số nguyên vào các cột tài liệu) hoặc các chuỗi tương ứng với tên cột được người dùng cung cấp trong tên hoặc suy ra từ (các) hàng tiêu đề tài liệu. Nếu os.PathLike8 được đưa ra, (các) hàng tiêu đề tài liệu không được tính đến. Ví dụ: tham số Usecols giống như danh sách hợp lệ sẽ là os.PathLike9 hoặc read()0. Thứ tự phần tử bị bỏ qua, vì vậy read()1 giống như read()2. Để khởi tạo DataFrame từ read()3 với phần tử được bảo tồn sử dụng read()4 cho các cột theo thứ tự read()5 hoặc read()6 cho đơn đặt hàng read()7.

Nếu có thể gọi được, hàm có thể gọi sẽ được đánh giá theo tên cột, trả về các tên trong đó hàm có thể gọi được đánh giá là true. Một ví dụ về một đối số có thể gọi hợp lệ sẽ là read()8. Sử dụng tham số này dẫn đến thời gian phân tích nhanh hơn nhiều và sử dụng bộ nhớ thấp hơn.

Squeezebool, mặc định saibool, default False

Nếu dữ liệu được phân tích cú pháp chỉ chứa một cột thì hãy trả về một chuỗi.

Đã không dùng nữa kể từ phiên bản 1.4.0: Phụ lục read()9 vào cuộc gọi đến open0 để bóp dữ liệu.Append read()9 to the call to open0 to squeeze the data.

tiền tố, tùy chọnstr, optional

Tiền tố để thêm vào số cột khi không có tiêu đề, ví dụ: ‘X, cho x0, x1,

Đã không dùng nữa kể từ phiên bản 1.4.0: Sử dụng danh sách hiểu trên các cột DataFrame sau khi gọi open0.Use a list comprehension on the DataFrame’s columns after calling open0.

manggle_dupe_colsbool, mặc định đúngbool, default True

Các cột trùng lặp sẽ được chỉ định là ‘X,‘ X.1 ,, Truyền sai sẽ khiến dữ liệu bị ghi đè nếu có tên trùng lặp trong các cột.

Đã không dùng nữa kể từ phiên bản 1.5.0: Không được triển khai và một đối số mới để chỉ định mẫu cho tên của các cột trùng lặp sẽ được thêm vào thay thếNot implemented, and a new argument to specify the pattern for the names of duplicated columns will be added instead

Tên DTYPETYPE hoặc DIGNT CỦA Cột -> Loại, Tùy chọnType name or dict of column -> type, optional

Kiểu dữ liệu cho dữ liệu hoặc cột. Ví dụ. {’A, Nếu các bộ chuyển đổi được chỉ định, chúng sẽ được áp dụng thay vì chuyển đổi DTYPE.

Mới trong phiên bản 1.5.0: Hỗ trợ cho DefaultDict đã được thêm vào. Chỉ định một mặc định là đầu vào trong đó mặc định xác định DTYPE của các cột không được liệt kê rõ ràng.Support for defaultdict was added. Specify a defaultdict as input where the default determines the dtype of the columns which are not explicitly listed.

Động cơ {‘C,‘ Python, ‘Pyarrow,}, tùy chọn{‘c’, ‘python’, ‘pyarrow’}, optional

Động cơ phân tích cú pháp để sử dụng. Các động cơ C và Pyarrow nhanh hơn, trong khi động cơ Python hiện đang hoàn thành tính năng hơn. MultiThreading hiện chỉ được hỗ trợ bởi động cơ Pyarrow.

Mới trong phiên bản 1.4.0: Động cơ của Py Pyarrow đã được thêm vào dưới dạng động cơ thử nghiệm và một số tính năng không được hỗ trợ hoặc không hoạt động chính xác với động cơ này.The “pyarrow” engine was added as an experimental engine, and some features are unsupported, or may not work correctly, with this engine.

ConvertersDict, tùy chọndict, optional

Diễn ngôn của các chức năng để chuyển đổi các giá trị trong các cột nhất định. Các phím có thể là số nguyên hoặc nhãn cột.

true_valuesList, tùy chọnlist, optional

Giá trị để xem là đúng.

false_valuesList, tùy chọnlist, optional

Giá trị để coi là sai.

SkipinitialSpacebool, mặc định saibool, default False

Bỏ qua không gian sau khi phân trang.

SkipRowsList giống như, int hoặc có thể gọi, tùy chọnlist-like, int or callable, optional

Số dòng để bỏ qua (0 chỉ số) hoặc số dòng để bỏ qua (int) khi bắt đầu tệp.

Nếu có thể gọi được, hàm có thể gọi sẽ được đánh giá theo các chỉ số hàng, trả về đúng nếu hàng nên được bỏ qua và sai. Một ví dụ về một đối số có thể gọi hợp lệ sẽ là open2.

Skipfooterint, mặc định 0int, default 0

Số lượng dòng ở dưới cùng của tệp để bỏ qua (không được hỗ trợ với động cơ = xông C,).

NrowsInt, tùy chọnint, optional

Số lượng hàng của tập tin để đọc. Hữu ích cho việc đọc các mảnh của các tập tin lớn.

NA_VALUESSCALAR, STR, DANH SÁCH, HOẶC QUỐCscalar, str, list-like, or dict, optional

Các chuỗi bổ sung để nhận ra là NA/NAN. Nếu Dict vượt qua, các giá trị NA mỗi cột cụ thể. Theo mặc định, các giá trị sau được hiểu là nan: '', '#n/a', '#n/a n/a', '#na', '-1.#Ind', '-1.#Qnan', '-Nan', '-nan', '1.#ind', '1.#qnan', '', 'n/a', 'na', 'null', 'nan', 'n/a' , 'nan', 'null'.

keep_default_nabool, mặc định đúngbool, default True

Có hay không bao gồm các giá trị NAN mặc định khi phân tích dữ liệu. Tùy thuộc vào việc NA_Values được thông qua, hành vi như sau:

Nếu keep_default_na là đúng và na_values được chỉ định, na_values được thêm vào các giá trị NAN mặc định được sử dụng để phân tích cú pháp.
Nếu keep_default_na là đúng và na_values không được chỉ định, chỉ có các giá trị NAN mặc định được sử dụng để phân tích cú pháp.
Nếu keep_default_na là sai và na_values được chỉ định, chỉ có các giá trị nan được chỉ định na_values được sử dụng để phân tích cú pháp.
Nếu keep_default_na là sai và na_values không được chỉ định, không có chuỗi nào được phân tích cú pháp là nan.

Lưu ý rằng nếu Na_Filter được truyền dưới dạng sai, các tham số keep_default_na và na_values sẽ bị bỏ qua.

na_filterbool, mặc định đúngbool, default True

Phát hiện các điểm đánh dấu giá trị bị thiếu (chuỗi trống và giá trị của NA_Values). Trong dữ liệu mà không có NAS, việc truyền Na_Filter = Sai có thể cải thiện hiệu suất của việc đọc một tệp lớn.

verbosebool, mặc định saibool, default False

Chỉ ra số lượng giá trị Na được đặt trong các cột không phải là số.

skip_blank_linesbool, mặc định đúngbool, default True

Nếu đúng, hãy bỏ qua các dòng trống thay vì diễn giải như các giá trị NAN.

parse_datesbool hoặc danh sách int hoặc tên hoặc danh sách danh sách hoặc dict, mặc định saibool or list of int or names or list of lists or dict, default False

Hành vi như sau:

Boolean. Nếu đúng -> thử phân tích cú pháp chỉ mục.
Danh sách INT hoặc tên. ví dụ. Nếu [1, 2, 3] -> thử phân tích các cột 1, 2, 3 mỗi cột là một cột ngày riêng biệt.
Danh sách danh sách. ví dụ. Nếu [[1, 3]] -> Kết hợp các cột 1 và 3 và phân tích cú pháp là một cột ngày duy nhất.
Diễn ngôn, ví dụ: {‘Foo,

Nếu một cột hoặc chỉ mục không thể được biểu diễn dưới dạng một mảng các dữ liệu, hãy nói vì giá trị không thể ghi hoặc hỗn hợp của múi giờ, cột hoặc chỉ mục sẽ được trả về không thay đổi dưới dạng loại dữ liệu đối tượng. Đối với phân tích dữ liệu không chuẩn, sử dụng open3 sau open4. Để phân tích một chỉ mục hoặc cột có hỗn hợp thời gian, chỉ định open5 là một open6 được áp dụng một phần với open7. Xem phân tích CSV với thời gian hỗn hợp để biết thêm.Parsing a CSV with mixed timezones for more.

Lưu ý: Một đường dẫn nhanh tồn tại trong các ngày được định dạng ISO8601.

Infer_datetime_formatbool, mặc định saibool, default False

Nếu true và parse_dates được bật, gấu trúc sẽ cố gắng suy ra định dạng của chuỗi DateTime trong các cột và nếu nó có thể được suy ra, hãy chuyển sang phương pháp phân tích nhanh hơn. Trong một số trường hợp, điều này có thể tăng tốc độ phân tích cú pháp thêm 5-10 lần.

keep_date_colbool, mặc định saibool, default False

Nếu true và parse_dates chỉ định kết hợp nhiều cột thì hãy giữ các cột gốc.

date_parserfunction, tùy chọnfunction, optional

Chức năng sử dụng để chuyển đổi một chuỗi các cột chuỗi thành một mảng các phiên bản DateTime. Mặc định sử dụng open8 để thực hiện chuyển đổi. Pandas sẽ cố gắng gọi DATE_PARSER theo ba cách khác nhau, tiến sang cách tiếp theo nếu xảy ra ngoại lệ: 1) Truyền một hoặc nhiều mảng (theo định nghĩa của parse_dates) làm đối số; 2) Concatenate (hàng khôn ngoan) Các giá trị chuỗi từ các cột được xác định bởi parse_dates thành một mảng duy nhất và truyền cái đó; và 3) CALL DATE_PARSER một lần cho mỗi hàng bằng một hoặc nhiều chuỗi (tương ứng với các cột được xác định bởi parse_dates) làm đối số.

dayfirstbool, mặc định saibool, default False

Ngày định dạng DD/mm, định dạng quốc tế và châu Âu.

cache_datesbool, mặc định đúngbool, default True

Nếu đúng, hãy sử dụng bộ nhớ cache của ngày duy nhất, được chuyển đổi để áp dụng chuyển đổi DateTime. Có thể tạo ra tốc độ tăng tốc đáng kể khi phân tích các chuỗi ngày trùng lặp, đặc biệt là các chuỗi có thời gian bù thời gian.

Mới trong phiên bản 0.25.0.

iteratorbool, mặc định saibool, default False

Trả về TextFileReader Object cho Lặp lại hoặc nhận các khối với open9.

Thay đổi trong phiên bản 1.2: StringIO0 là người quản lý ngữ cảnh.StringIO0 is a context manager.

Chunksizeint, tùy chọnint, optional

Trả về đối tượng textfileReader cho lặp. Xem tài liệu Công cụ IO để biết thêm thông tin về StringIO1 và StringIO2.

Thay đổi trong phiên bản 1.2: StringIO0 là người quản lý ngữ cảnh.StringIO0 is a context manager.

Chunksizeint, tùy chọnstr or dict, default ‘infer’

Trả về đối tượng textfileReader cho lặp. Xem tài liệu Công cụ IO để biết thêm thông tin về StringIO1 và StringIO2.

CompressionStr hoặc dict, mặc định ‘suy raAdded support for .tar files.

Cho việc giải nén dữ liệu trên đĩa. Nếu 'suy luận' và 'filepath_or_buffer' giống như đường dẫn, thì hãy phát hiện nén từ các phần mở rộng sau: '.gz', '.bz2', '.zip', '.xz', '.zst', '.tar' , '.tar.gz', '.tar.xz' hoặc '.tar.bz2' (nếu không thì không nén). Nếu sử dụng ‘zip, hoặc‘ tar, tệp zip phải chỉ chứa một tệp dữ liệu được đọc. Đặt thành None để không giải nén. Cũng có thể là một dict với khóa StringIO5 được đặt thành một trong {StringIO6, StringIO7, StringIO8, StringIO9, csv.Sniffer0} và các cặp giá trị khóa khác được chuyển tiếp đến csv.Sniffer1, csv.Sniffer2, csv.Sniffer3, csv.Sniffer4 hoặc ____. Ví dụ, những điều sau đây có thể được thông qua để giải nén Zstandard bằng cách sử dụng từ điển nén tùy chỉnh: csv.Sniffer6.Zstandard support.

Mới trong phiên bản 1.5.0: Đã thêm hỗ trợ cho các tệp .tar.str, optional

Đã thay đổi trong phiên bản 1.4.0: Hỗ trợ Zstandard.

Hàng ngàn, tùy chọnstr, default ‘.’

Hàng ngàn người phân tách.

DecimalStr, mặc định ‘.str (length 1), optional

Ký tự để nhận ra là dấu thập phân (ví dụ: sử dụng ‘, cho dữ liệu châu Âu).

lineterminatorstr (chiều dài 1), tùy chọnstr (length 1), optional

Ký tự để phá vỡ tệp thành các dòng. Chỉ hợp lệ với trình phân tích cú pháp C.

quotecharstr (chiều dài 1), tùy chọnint or csv.QUOTE_* instance, default 0

Nhân vật được sử dụng để biểu thị sự khởi đầu và kết thúc của một mục được trích dẫn. Các mục được trích dẫn có thể bao gồm dấu phân cách và nó sẽ bị bỏ qua.

trích dẫn hoặc csv.quote_* phiên bản, mặc định 0bool, default csv.Sniffer8

Kiểm soát trường trích dẫn hành vi trên các hằng số csv.Sniffer7. Sử dụng một trong quote_minimal (0), quote_all (1), quote_nonnumeric (2) hoặc quote_none (3).

doublequotebool, mặc định csv.Sniffer8str (length 1), optional

Khi Quotechar được chỉ định và trích dẫn không phải là csv.Sniffer9, cho biết có nên giải thích hai phần tử Quotechar liên tiếp trong một trường dưới dạng một phần tử '\s+'0 hay không.

escapecharstr (chiều dài 1), tùy chọnstr, optional

Chuỗi một ký tự được sử dụng để thoát khỏi các ký tự khác.

bình luận, tùy chọnstr, optional

Chỉ ra phần còn lại của dòng không nên được phân tích cú pháp. Nếu được tìm thấy ở đầu một dòng, dòng sẽ bị bỏ qua hoàn toàn. Tham số này phải là một ký tự duy nhất. Giống như các dòng trống (miễn là os.PathLike2), các dòng được nhận xét đầy đủ bị bỏ qua bởi tiêu đề tham số nhưng không phải bằng cách bỏ qua. Ví dụ, nếu '\s+'2, phân tích cú pháp '\s+'3 với header=0 sẽ dẫn đến ‘A, B, C, được coi là tiêu đề.

EncodingTr, tùy chọnWhen '\s+'5 is None, '\s+'7 is passed to '\s+'8. Otherwise, '\s+'9 is passed to '\s+'8. This behavior was previously only the case for '\r\t'1.

Mã hóa để sử dụng cho UTF khi đọc/viết (ví dụ: UTF-8,). Danh sách mã hóa tiêu chuẩn Python.'\r\t'2 is a new argument. '\s+'5 has no longer an influence on how encoding errors are handled.

Đã thay đổi trong phiên bản 1.2: Khi '\s+'5 là None, '\s+'7 được chuyển sang '\s+'8. Nếu không, '\s+'9 được truyền đến '\s+'8. Hành vi này trước đây chỉ là trường hợp cho '\r\t'1.str, optional, default “strict”

Thay đổi trong phiên bản 1.3.0: '\r\t'2 là một đối số mới. '\s+'5 không còn ảnh hưởng đến cách xử lý lỗi mã hóa.

Encoding_errorsstr, tùy chọn, mặc định là nghiêm ngặt

Cách xử lý lỗi mã hóa. Danh sách các giá trị có thể.str or csv.Dialect, optional

Nếu được cung cấp, tham số này sẽ ghi đè các giá trị (mặc định hoặc không) cho các tham số sau: Delimiter, DoubleQuote, Escapechar, SkipinitialSpace, Quotechar và trích dẫn. Nếu cần phải ghi đè các giá trị, phân tích cú pháp sẽ được phát hành. Xem tài liệu CSV.Dialect để biết thêm chi tiết.

ERROR_BAD_LINESBOOL, Tùy chọn, mặc định Nonebool, optional, default None

Các dòng có quá nhiều trường (ví dụ: dòng CSV có quá nhiều dấu phẩy) theo mặc định sẽ gây ra một ngoại lệ được nêu ra và sẽ không có DataFrame nào được trả về. Nếu sai, thì những dòng xấu của người Viking này sẽ bị loại khỏi khung dữ liệu được trả về.

Thay vào đó, không dùng nữa vì phiên bản 1.3.0: Tham số '\r\t'5 nên được sử dụng thay vào đó để chỉ định hành vi khi gặp phải một dòng xấu thay thế.The '\r\t'5 parameter should be used instead to specify behavior upon encountering a bad line instead.

WARN_BAD_LINESBOOL, Tùy chọn, mặc định Nonebool, optional, default None

Nếu ERROR_BAD_LINES là sai và WARN_BAD_LINES là đúng, một cảnh báo cho mỗi dòng xấu của người Hồi giáo sẽ là đầu ra.

WARN_BAD_LINESBOOL, Tùy chọn, mặc định None{‘error’, ‘warn’, ‘skip’} or callable, default ‘error’

Nếu ERROR_BAD_LINES là sai và WARN_BAD_LINES là đúng, một cảnh báo cho mỗi dòng xấu của người Hồi giáo sẽ là đầu ra.

on_bad_lines {‘lỗi,‘ warn, ‘bỏ qua} hoặc có thể gọi được, mặc định‘ lỗi
Chỉ định những gì cần làm khi gặp một dòng xấu (một dòng có quá nhiều trường). Giá trị được phép là:
‘Lỗi, nâng cao một ngoại lệ khi gặp phải một dòng xấu.

‘Cảnh báo, hãy đưa ra một cảnh báo khi gặp phải một dòng xấu và bỏ qua dòng đó.

Bỏ qua, bỏ qua các dòng xấu mà không nêu ra hoặc cảnh báo khi chúng gặp phải.

Mới trong phiên bản 1.3.0.

Mới trong phiên bản 1.4.0:bool, default False

Có thể gọi, chức năng với chữ ký '\r\t'8 sẽ xử lý một dòng xấu duy nhất. '\r\t'9 là danh sách các chuỗi được phân chia bởi None0. Nếu hàm trả về None, dòng xấu sẽ bị bỏ qua. Nếu hàm trả về một danh sách các chuỗi mới với nhiều yếu tố hơn dự kiến, None2 sẽ được phát ra trong khi giảm các yếu tố bổ sung. Chỉ được hỗ trợ khi '\r\t'1

delim_whitespaceBool, mặc định saibool, default True

Chỉ định xem có phải khoảng trắng hay không (ví dụ: None4 hay None5) sẽ được sử dụng làm SEP. Tương đương với cài đặt None6. Nếu tùy chọn này được đặt thành True, không có gì nên được truyền cho tham số None7.

low_memorybool, mặc định đúngbool, default False

Trong nội bộ xử lý tệp trong các khối, dẫn đến sử dụng bộ nhớ thấp hơn trong khi phân tích cú pháp, nhưng có thể là loại suy luận hỗn hợp. Để đảm bảo không có loại hỗn hợp nào được đặt sai hoặc chỉ định loại với tham số DTYPE. Lưu ý rằng toàn bộ tệp được đọc vào một khung dữ liệu duy nhất bất kể, sử dụng tham số chunksize hoặc iterator để trả về dữ liệu trong các khối. (Chỉ hợp lệ với trình phân tích cú pháp C).

memory_mapbool, mặc định saistr, optional

Nếu FilePath được cung cấp cho FilePath_or_buffer, hãy ánh xạ trực tiếp đối tượng tệp lên bộ nhớ và truy cập dữ liệu trực tiếp từ đó. Sử dụng tùy chọn này có thể cải thiện hiệu suất vì không còn bất kỳ chi phí I/O nào nữa.

float_preciststr, tùy chọn

Chỉ định bộ chuyển đổi động cơ C nào nên sử dụng cho các giá trị dấu phẩy động. Các tùy chọn là None hoặc ’cao cho bộ chuyển đổi thông thường,‘ di sản cho bộ chuyển đổi Pandas chính xác thấp hơn và ‘Round_Trip, cho bộ chuyển đổi Trip Trip.dict, optional

Đã thay đổi trong phiên bản 1.2.

Storage_OptionsDict, Tùy chọn

Các tùy chọn bổ sung có ý nghĩa cho một kết nối lưu trữ cụ thể, ví dụ: máy chủ, cổng, tên người dùng, mật khẩu, v.v. cho URL HTTP (s), các cặp giá trị khóa được chuyển tiếp đến None9 dưới dạng tùy chọn tiêu đề. Đối với các URL khác (ví dụ: bắt đầu với S3: //, và GC GCS: //), các cặp giá trị khóa được chuyển tiếp đến header=00. Vui lòng xem header=01 và header=02 để biết thêm chi tiết và để biết thêm ví dụ về các tùy chọn lưu trữ, hãy tham khảo tại đây.

Mới trong phiên bản 1.2.

ReturnSdatAframe hoặc textParser

header=03

Một tệp các giá trị được phân tách bằng dấu phẩy (CSV) được trả về dưới dạng cấu trúc dữ liệu hai chiều với các trục được dán nhãn.

open0

Xem thêm

header=05

Viết DataFrame vào tệp Giá trị được phân tách bằng dấu phẩy (CSV).

Đọc một tệp giá trị được phân tách bằng dấu phẩy (CSV) vào DataFrame.

>>> pd.read_csv('data.csv')

Làm thế nào để bạn đọc một tệp CSV trong một python tiêu đề?

Đọc CSV bằng mô -đun sẵn có của Python có tên CSV bằng CSV ...

Nhập thư viện CSV. Nhập CSV ..

Mở tệp CSV. Các . ....

Sử dụng đối tượng CSV.Reader để đọc tệp CSV. csvreader = csv.Reader (tệp).

Trích xuất tên trường. Tạo một danh sách trống gọi là tiêu đề. ....

Trích xuất các hàng/hồ sơ. ....

Đóng tệp ..

Làm cách nào để đọc tệp CSV trong Pandas Python?

Đọc tệp CSV..

Tải CSV vào DataFrame: Nhập Pandas dưới dạng PD. df = pd.read_csv ('data.csv') ....

In DataFrame mà không cần phương thức TO_STRING (): Nhập gấu trúc dưới dạng pd. ....

Kiểm tra số lượng các hàng được trả lại tối đa: nhập pandas dưới dạng PD. ....

Tăng số lượng hàng tối đa để hiển thị toàn bộ DataFrame: Nhập Pandas dưới dạng PD ..

Làm cách nào để đọc một cột dữ liệu khôn ngoan từ tệp CSV trong Python?

Python3. Trong phương thức này, chúng tôi sẽ nhập thư viện CSV và mở tệp ở chế độ đọc, sau đó chúng tôi sẽ sử dụng hàm dictreader () để đọc dữ liệu của tệp CSV. Hàm này giống như một người đọc thông thường, nhưng nó ánh xạ thông tin đến một từ điển có các khóa được đưa ra bởi các tên cột và tất cả các giá trị dưới dạng các khóa.use the DictReader() function to read the data of the CSV file. This function is like a regular reader, but it maps the information to a dictionary whose keys are given by the column names and all the values as keys.

Làm cách nào để đọc một tệp CSV liên tiếp trong Python?

Bước 1: Để đọc các hàng trong Python, trước tiên, chúng ta cần tải tệp CSV trong một đối tượng.Vì vậy, để tải tệp CSV vào một đối tượng sử dụng phương thức Open ().Bước 2: Tạo một đối tượng đầu đọc bằng cách chuyển đối tượng tệp được tạo ở trên cho hàm đầu đọc.Bước 3: Sử dụng cho vòng lặp trên đối tượng đầu đọc để có được mỗi hàng.