Hướng dẫn how read and write csv file in python pandas? - làm thế nào để đọc và ghi tệp csv trong python pandas?

Xem bây giờ hướng dẫn này có một khóa học video liên quan được tạo bởi nhóm Python thực sự. Xem cùng với hướng dẫn bằng văn bản để hiểu sâu hơn về sự hiểu biết của bạn: Đọc và viết các tập tin bằng gấu trúc This tutorial has a related video course created by the Real Python team. Watch it together with the written tutorial to deepen your understanding: Reading and Writing Files With Pandas

Show

Pandas là một gói Python mạnh mẽ và linh hoạt cho phép bạn làm việc với dữ liệu chuỗi thời gian và được dán nhãn. Nó cũng cung cấp các phương pháp thống kê, cho phép âm mưu, và nhiều hơn nữa. Một tính năng quan trọng của gấu trúc là khả năng viết và đọc Excel, CSV và nhiều loại tệp khác. Các chức năng như phương pháp Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 cho phép bạn làm việc với các tệp một cách hiệu quả. Bạn có thể sử dụng chúng để lưu dữ liệu và nhãn từ các đối tượng Pandas vào một tệp và tải chúng sau đó dưới dạng các phiên bản Pandas
$ pip install xlwt openpyxl xlsxwriter xlrd
0 hoặc
$ pip install xlwt openpyxl xlsxwriter xlrd
1.
is a powerful and flexible Python package that allows you to work with labeled and time series data. It also provides statistics methods, enables plotting, and more. One crucial feature of Pandas is its ability to write and read Excel, CSV, and many other types of files. Functions like the Pandas
>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 method enable you to work with files effectively. You can use them to save the data and labels from Pandas objects to a file and load them later as Pandas
$ pip install xlwt openpyxl xlsxwriter xlrd
0 or
$ pip install xlwt openpyxl xlsxwriter xlrd
1 instances.

Trong hướng dẫn này, bạn sẽ học:

  • API công cụ pandas io là gìPandas IO tools API is
  • Cách đọc và ghi dữ liệu đến và từ các tệpread and write data to and from files
  • Cách làm việc với các định dạng tệp khác nhaufile formats
  • Cách làm việc với dữ liệu lớn một cách hiệu quảbig data efficiently

Hãy bắt đầu đọc và viết tập tin!

Cài đặt gấu trúc

Mã trong hướng dẫn này được thực thi với CPython 3.7.4 và Pandas 0,25.1. Sẽ có lợi khi đảm bảo bạn có các phiên bản Python và Pandas mới nhất trên máy của bạn. Bạn có thể muốn tạo một môi trường ảo mới và cài đặt các phụ thuộc cho hướng dẫn này.

Đầu tiên, bạn sẽ cần Thư viện Pandas. Bạn có thể đã có nó được cài đặt. Nếu bạn không có, thì bạn có thể cài đặt nó với PIP:

Sau khi quá trình cài đặt hoàn tất, bạn nên cài đặt gấu trúc và sẵn sàng.

Anaconda là một bản phân phối Python tuyệt vời đi kèm với Python, nhiều gói hữu ích như Pandas, và một người quản lý gói và môi trường có tên là Conda. Để tìm hiểu thêm về Anaconda, hãy xem thiết lập Python để học máy trên Windows. is an excellent Python distribution that comes with Python, many useful packages like Pandas, and a package and environment manager called Conda. To learn more about Anaconda, check out Setting Up Python for Machine Learning on Windows.

Nếu bạn không có gấu trúc trong môi trường ảo của mình, thì bạn có thể cài đặt nó với Conda:

Conda mạnh mẽ vì nó quản lý các phụ thuộc và phiên bản của họ. Để tìm hiểu thêm về việc làm việc với Conda, bạn có thể xem tài liệu chính thức.

Chuẩn bị dữ liệu

Trong hướng dẫn này, bạn sẽ sử dụng dữ liệu liên quan đến 20 quốc gia. Tại đây, một cái nhìn tổng quan về dữ liệu và nguồn mà bạn sẽ làm việc với:

  • Quốc gia được ký hiệu là tên quốc gia. Mỗi quốc gia nằm trong danh sách top 10 cho dân số, khu vực hoặc tổng sản phẩm quốc nội (GDP). Các nhãn hàng cho bộ dữ liệu là mã quốc gia ba chữ cái được xác định trong ISO 3166-1. Nhãn cột cho bộ dữ liệu là

    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    2. is denoted by the country name. Each country is in the top 10 list for either population, area, or gross domestic product (GDP). The row labels for the dataset are the three-letter country codes defined in ISO 3166-1. The column label for the dataset is
    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    2.

  • Dân số được thể hiện bằng hàng triệu. Dữ liệu đến từ một danh sách các quốc gia và sự phụ thuộc của dân số trên Wikipedia. Nhãn cột cho bộ dữ liệu là

    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    3. is expressed in millions. The data comes from a list of countries and dependencies by population on Wikipedia. The column label for the dataset is
    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    3.

  • Khu vực được thể hiện bằng hàng ngàn km bình phương. Dữ liệu đến từ một danh sách các quốc gia và sự phụ thuộc theo khu vực trên Wikipedia. Nhãn cột cho bộ dữ liệu là

    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    4. is expressed in thousands of kilometers squared. The data comes from a list of countries and dependencies by area on Wikipedia. The column label for the dataset is
    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    4.

  • Tổng sản phẩm quốc nội được thể hiện bằng hàng triệu đô la Mỹ, theo dữ liệu của Liên Hợp Quốc năm 2017. Bạn có thể tìm thấy dữ liệu này trong danh sách các quốc gia của GDP danh nghĩa trên Wikipedia. Nhãn cột cho bộ dữ liệu là

    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    5. is expressed in millions of U.S. dollars, according to the United Nations data for 2017. You can find this data in the list of countries by nominal GDP on Wikipedia. The column label for the dataset is
    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    5.

  • Lục địa là Châu Phi, Châu Á, Châu Đại Dương, Châu Âu, Bắc Mỹ hoặc Nam Mỹ. Bạn cũng có thể tìm thấy thông tin này trên Wikipedia. Nhãn cột cho bộ dữ liệu là

    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    6. is either Africa, Asia, Oceania, Europe, North America, or South America. You can find this information on Wikipedia as well. The column label for the dataset is
    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    6.

  • Ngày quốc khánh là một ngày kỷ niệm sự độc lập của một quốc gia. Dữ liệu đến từ danh sách các ngày độc lập quốc gia trên Wikipedia. Các ngày được hiển thị ở định dạng ISO 8601. Bốn chữ số đầu tiên đại diện cho năm, hai số tiếp theo là tháng và hai con số cuối cùng là cho ngày của tháng. Nhãn cột cho bộ dữ liệu là

    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    7. is a date that commemorates a nation’s independence. The data comes from the list of national independence days on Wikipedia. The dates are shown in ISO 8601 format. The first four digits represent the year, the next two numbers are the month, and the last two are for the day of the month. The column label for the dataset is
    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    7.

Đây là cách dữ liệu trông như một bảng:

QUỐC GIANHẠC POPDIỆN TÍCHGDPContIND_DAY
CHN Trung Quốc1398.72 9596.96 12234.78 Châu Á
Ind Ấn Độ1351.16 3287.26 2575.67 Châu ÁInd
Ấn Độ 1947-08-15329.74 9833.52 19485.39 Hoa KỳCHÚNG TA
N.America 1776-07-04268.07 1910.93 1015.54 Châu ÁInd
Ấn Độ 1947-08-15210.32 8515.77 2055.51 Hoa KỳCHÚNG TA
N.America 1776-07-04205.71 881.91 302.14 Châu ÁInd
Ấn Độ 1947-08-15200.96 923.77 375.77 Hoa KỳCHÚNG TA
N.America 1776-07-04167.09 147.57 245.63 Châu ÁInd
Ấn Độ 1947-08-15146.79 17098.25 1530.75 Hoa Kỳ
CHÚNG TA N.America126.58 1964.38 1158.23 Hoa KỳCHÚNG TA
N.America 1776-07-04126.22 377.97 4872.42 Châu Á
Ind Ấn Độ83.02 357.11 3693.20 1947-08-15
Hoa Kỳ CHÚNG TA67.02 640.68 2582.49 1947-08-15Hoa Kỳ
CHÚNG TA N.America66.44 242.50 2631.23 1947-08-15
Hoa Kỳ CHÚNG TA60.36 301.34 1943.84 1947-08-15
Hoa Kỳ CHÚNG TA44.94 2780.40 637.49 Hoa KỳCHÚNG TA
N.America 1776-07-0443.38 2381.74 167.56 Hoa KỳCHÚNG TA
N.America 1776-07-0437.59 9984.67 1647.12 Hoa KỳCHÚNG TA
N.America 1776-07-0425.47 7692.02 1408.68 Idn
Indonesia 1945-08-1718.53 2724.90 159.41 Châu ÁInd

Ấn Độ

Bạn có thể sắp xếp dữ liệu này bằng Python bằng cách sử dụng từ điển lồng nhau:

data = {
    'CHN': {'COUNTRY': 'China', 'POP': 1_398.72, 'AREA': 9_596.96,
            'GDP': 12_234.78, 'CONT': 'Asia'},
    'IND': {'COUNTRY': 'India', 'POP': 1_351.16, 'AREA': 3_287.26,
            'GDP': 2_575.67, 'CONT': 'Asia', 'IND_DAY': '1947-08-15'},
    'USA': {'COUNTRY': 'US', 'POP': 329.74, 'AREA': 9_833.52,
            'GDP': 19_485.39, 'CONT': 'N.America',
            'IND_DAY': '1776-07-04'},
    'IDN': {'COUNTRY': 'Indonesia', 'POP': 268.07, 'AREA': 1_910.93,
            'GDP': 1_015.54, 'CONT': 'Asia', 'IND_DAY': '1945-08-17'},
    'BRA': {'COUNTRY': 'Brazil', 'POP': 210.32, 'AREA': 8_515.77,
            'GDP': 2_055.51, 'CONT': 'S.America', 'IND_DAY': '1822-09-07'},
    'PAK': {'COUNTRY': 'Pakistan', 'POP': 205.71, 'AREA': 881.91,
            'GDP': 302.14, 'CONT': 'Asia', 'IND_DAY': '1947-08-14'},
    'NGA': {'COUNTRY': 'Nigeria', 'POP': 200.96, 'AREA': 923.77,
            'GDP': 375.77, 'CONT': 'Africa', 'IND_DAY': '1960-10-01'},
    'BGD': {'COUNTRY': 'Bangladesh', 'POP': 167.09, 'AREA': 147.57,
            'GDP': 245.63, 'CONT': 'Asia', 'IND_DAY': '1971-03-26'},
    'RUS': {'COUNTRY': 'Russia', 'POP': 146.79, 'AREA': 17_098.25,
            'GDP': 1_530.75, 'IND_DAY': '1992-06-12'},
    'MEX': {'COUNTRY': 'Mexico', 'POP': 126.58, 'AREA': 1_964.38,
            'GDP': 1_158.23, 'CONT': 'N.America', 'IND_DAY': '1810-09-16'},
    'JPN': {'COUNTRY': 'Japan', 'POP': 126.22, 'AREA': 377.97,
            'GDP': 4_872.42, 'CONT': 'Asia'},
    'DEU': {'COUNTRY': 'Germany', 'POP': 83.02, 'AREA': 357.11,
            'GDP': 3_693.20, 'CONT': 'Europe'},
    'FRA': {'COUNTRY': 'France', 'POP': 67.02, 'AREA': 640.68,
            'GDP': 2_582.49, 'CONT': 'Europe', 'IND_DAY': '1789-07-14'},
    'GBR': {'COUNTRY': 'UK', 'POP': 66.44, 'AREA': 242.50,
            'GDP': 2_631.23, 'CONT': 'Europe'},
    'ITA': {'COUNTRY': 'Italy', 'POP': 60.36, 'AREA': 301.34,
            'GDP': 1_943.84, 'CONT': 'Europe'},
    'ARG': {'COUNTRY': 'Argentina', 'POP': 44.94, 'AREA': 2_780.40,
            'GDP': 637.49, 'CONT': 'S.America', 'IND_DAY': '1816-07-09'},
    'DZA': {'COUNTRY': 'Algeria', 'POP': 43.38, 'AREA': 2_381.74,
            'GDP': 167.56, 'CONT': 'Africa', 'IND_DAY': '1962-07-05'},
    'CAN': {'COUNTRY': 'Canada', 'POP': 37.59, 'AREA': 9_984.67,
            'GDP': 1_647.12, 'CONT': 'N.America', 'IND_DAY': '1867-07-01'},
    'AUS': {'COUNTRY': 'Australia', 'POP': 25.47, 'AREA': 7_692.02,
            'GDP': 1_408.68, 'CONT': 'Oceania'},
    'KAZ': {'COUNTRY': 'Kazakhstan', 'POP': 18.53, 'AREA': 2_724.90,
            'GDP': 159.41, 'CONT': 'Asia', 'IND_DAY': '1991-12-16'}
}

columns = ('COUNTRY', 'POP', 'AREA', 'GDP', 'CONT', 'IND_DAY')

Mỗi hàng của bảng được viết dưới dạng từ điển bên trong có các khóa là tên và giá trị cột là dữ liệu tương ứng. Các từ điển này sau đó được thu thập dưới dạng các giá trị trong từ điển

$ pip install xlwt openpyxl xlsxwriter xlrd
8 bên ngoài. Các khóa tương ứng cho
$ pip install xlwt openpyxl xlsxwriter xlrd
8 là mã quốc gia ba chữ cái.

Bạn có thể sử dụng

$ pip install xlwt openpyxl xlsxwriter xlrd
8 này để tạo một thể hiện của gấu trúc
$ pip install xlwt openpyxl xlsxwriter xlrd
1. Đầu tiên, bạn cần nhập gấu trúc:

>>>

>>> import pandas as pd

Bây giờ bạn đã nhập gấu trúc, bạn có thể sử dụng hàm tạo

$ pip install xlwt openpyxl xlsxwriter xlrd
1 và
$ pip install xlwt openpyxl xlsxwriter xlrd
8 để tạo đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1.

$ pip install xlwt openpyxl xlsxwriter xlrd
8 được tổ chức theo cách mà các mã quốc gia tương ứng với các cột. Bạn có thể đảo ngược các hàng và cột của
$ pip install xlwt openpyxl xlsxwriter xlrd
1 với thuộc tính
$ conda install xlwt openpyxl xlsxwriter xlrd
7:

>>>

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16

Bây giờ bạn đã nhập gấu trúc, bạn có thể sử dụng hàm tạo

$ pip install xlwt openpyxl xlsxwriter xlrd
1 và
$ pip install xlwt openpyxl xlsxwriter xlrd
8 để tạo đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1.

$ pip install xlwt openpyxl xlsxwriter xlrd
8 được tổ chức theo cách mà các mã quốc gia tương ứng với các cột. Bạn có thể đảo ngược các hàng và cột của
$ pip install xlwt openpyxl xlsxwriter xlrd
1 với thuộc tính
$ conda install xlwt openpyxl xlsxwriter xlrd
7:

>>>

>>> df = pd.DataFrame(data=data, index=columns).T

Bây giờ bạn đã nhập gấu trúc, bạn có thể sử dụng hàm tạo

$ pip install xlwt openpyxl xlsxwriter xlrd
1 và
$ pip install xlwt openpyxl xlsxwriter xlrd
8 để tạo đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1.

$ pip install xlwt openpyxl xlsxwriter xlrd 8 được tổ chức theo cách mà các mã quốc gia tương ứng với các cột. Bạn có thể đảo ngược các hàng và cột của $ pip install xlwt openpyxl xlsxwriter xlrd 1 với thuộc tính $ conda install xlwt openpyxl xlsxwriter xlrd 7:

Bây giờ bạn có đối tượng

$ pip install xlwt openpyxl xlsxwriter xlrd
1 của bạn có dữ liệu về mỗi quốc gia.

Các phiên bản của Python cũ hơn 3,6 không đảm bảo thứ tự các khóa trong từ điển. Để đảm bảo thứ tự các cột được duy trì cho các phiên bản cũ của Python và Pandas, bạn có thể chỉ định $ conda install xlwt openpyxl xlsxwriter xlrd 9:

Bây giờ bạn đã chuẩn bị dữ liệu của mình, bạn đã sẵn sàng để bắt đầu làm việc với các tệp!

>>>

>>> df.to_csv('data.csv')

Bây giờ bạn đã nhập gấu trúc, bạn có thể sử dụng hàm tạo

$ pip install xlwt openpyxl xlsxwriter xlrd
1 và
$ pip install xlwt openpyxl xlsxwriter xlrd
8 để tạo đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1.

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16

$ pip install xlwt openpyxl xlsxwriter xlrd
8 được tổ chức theo cách mà các mã quốc gia tương ứng với các cột. Bạn có thể đảo ngược các hàng và cột của
$ pip install xlwt openpyxl xlsxwriter xlrd
1 với thuộc tính
$ conda install xlwt openpyxl xlsxwriter xlrd
7:commas. The first column contains the row labels. In some cases, you’ll find them irrelevant. If you don’t want to keep them, then you can pass the argument
>>> df.to_excel('data.xlsx')
6 to
>>> df.to_excel('data.xlsx')
1.

Bây giờ bạn có đối tượng $ pip install xlwt openpyxl xlsxwriter xlrd 1 của bạn có dữ liệu về mỗi quốc gia.

Các phiên bản của Python cũ hơn 3,6 không đảm bảo thứ tự các khóa trong từ điển. Để đảm bảo thứ tự các cột được duy trì cho các phiên bản cũ của Python và Pandas, bạn có thể chỉ định

$ conda install xlwt openpyxl xlsxwriter xlrd
9:

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16

Bây giờ bạn đã nhập gấu trúc, bạn có thể sử dụng hàm tạo

$ pip install xlwt openpyxl xlsxwriter xlrd
1 và
$ pip install xlwt openpyxl xlsxwriter xlrd
8 để tạo đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1.

$ pip install xlwt openpyxl xlsxwriter xlrd
8 được tổ chức theo cách mà các mã quốc gia tương ứng với các cột. Bạn có thể đảo ngược các hàng và cột của
$ pip install xlwt openpyxl xlsxwriter xlrd
1 với thuộc tính
$ conda install xlwt openpyxl xlsxwriter xlrd
7:

Bây giờ bạn có đối tượng

$ pip install xlwt openpyxl xlsxwriter xlrd
1 của bạn có dữ liệu về mỗi quốc gia.

Các phiên bản của Python cũ hơn 3,6 không đảm bảo thứ tự các khóa trong từ điển. Để đảm bảo thứ tự các cột được duy trì cho các phiên bản cũ của Python và Pandas, bạn có thể chỉ định $ conda install xlwt openpyxl xlsxwriter xlrd 9:

Bây giờ bạn đã chuẩn bị dữ liệu của mình, bạn đã sẵn sàng để bắt đầu làm việc với các tệp!

  • Sử dụng các chức năng
    >>> df = pd.read_csv('data.csv', index_col=0)
    >>> df
            COUNTRY      POP      AREA       GDP       CONT     IND_DAY
    CHN       China  1398.72   9596.96  12234.78       Asia         NaN
    IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
    USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
    IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
    BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
    NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
    MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
    JPN       Japan   126.22    377.97   4872.42       Asia         NaN
    DEU     Germany    83.02    357.11   3693.20     Europe         NaN
    FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.50   2631.23     Europe         NaN
    ITA       Italy    60.36    301.34   1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
    DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
    CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
    AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
    
    9 và
    >>> df.to_excel('data.xlsx')
    
    1
  • Tệp giá trị phân tách bằng dấu phẩy (CSV) là tệp rõ ràng với tiện ích mở rộng
    >>> df.to_excel('data.xlsx')
    
    2 chứa dữ liệu bảng. Đây là một trong những định dạng tệp phổ biến nhất để lưu trữ một lượng lớn dữ liệu. Mỗi hàng của tệp CSV đại diện cho một hàng bảng duy nhất. Các giá trị trong cùng một hàng theo mặc định được phân tách bằng dấu phẩy, nhưng bạn có thể thay đổi dấu phân cách thành dấu chấm phẩy, tab, không gian hoặc một số ký tự khác.
  • Viết tệp CSV

Bạn có thể lưu gấu trúc của mình

$ pip install xlwt openpyxl xlsxwriter xlrd
1 dưới dạng tệp CSV với
>>> df.to_excel('data.xlsx')
1:

$ pip install xlwt openpyxl xlsxwriter xlrd

Đó là nó! Bạn đã tạo tệp

>>> df.to_excel('data.xlsx')
5 trong thư mục làm việc hiện tại của bạn. Bạn có thể mở rộng khối mã bên dưới để xem tệp CSV của bạn sẽ trông như thế nào:

$ conda install xlwt openpyxl xlsxwriter xlrd

Tệp văn bản này chứa dữ liệu được phân tách bằng dấu phẩy. Cột đầu tiên chứa các nhãn hàng. Trong một số trường hợp, bạn sẽ thấy chúng không liên quan. Nếu bạn không muốn giữ chúng, thì bạn có thể chuyển đối số

>>> df.to_excel('data.xlsx')
6 cho
>>> df.to_excel('data.xlsx')
1.

Đọc tệp CSV

Khi dữ liệu của bạn được lưu trong tệp CSV, bạn có thể muốn tải và sử dụng dữ liệu theo thời gian. Bạn có thể làm điều đó với chức năng Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9:

>>>

>>> df.to_excel('data.xlsx')

Trong trường hợp này, hàm gấu trúc

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 trả về một
$ pip install xlwt openpyxl xlsxwriter xlrd
1 mới với dữ liệu và nhãn từ tệp
>>> df.to_excel('data.xlsx')
5, mà bạn đã chỉ định với đối số đầu tiên. Chuỗi này có thể là bất kỳ đường dẫn hợp lệ, bao gồm các URL.

Hướng dẫn how read and write csv file in python pandas? - làm thế nào để đọc và ghi tệp csv trong python pandas?

Tham số

>>> import pandas as pd
02 Chỉ định cột từ tệp CSV chứa các nhãn hàng. Bạn gán một chỉ mục cột dựa trên không cho tham số này. Bạn nên xác định giá trị của
>>> import pandas as pd
02 khi tệp CSV chứa các nhãn hàng để tránh tải chúng dưới dạng dữ liệu.

Bạn sẽ tìm hiểu thêm về việc sử dụng gấu trúc với các tệp CSV sau này trong hướng dẫn này. Bạn cũng có thể kiểm tra đọc và viết các tệp CSV bằng Python để xem cách xử lý các tệp CSV với thư viện Python tích hợp CSV.

Sử dụng gấu trúc để viết và đọc các tệp excel

>>>

>>> import pandas as pd
0

Microsoft Excel có lẽ là phần mềm bảng tính được sử dụng rộng rãi nhất. Trong khi các phiên bản cũ hơn sử dụng các tệp nhị phân

>>> import pandas as pd
04, Excel 2007 đã giới thiệu tệp
>>> import pandas as pd
05 dựa trên XML mới. Bạn có thể đọc và viết các tệp Excel trong gấu trúc, tương tự như các tệp CSV. Tuy nhiên, bạn sẽ cần cài đặt các gói Python sau đây trước:

Bạn sẽ tìm hiểu thêm về việc làm việc với các tệp Excel sau này trong hướng dẫn này. Bạn cũng có thể kiểm tra bằng cách sử dụng gấu trúc để đọc các tệp excel lớn trong Python.

Hiểu API Pandas IO

Công cụ Pandas IO là API cho phép bạn lưu nội dung của các đối tượng

$ pip install xlwt openpyxl xlsxwriter xlrd
0 và
$ pip install xlwt openpyxl xlsxwriter xlrd
1 vào bảng tạm, đối tượng hoặc tệp thuộc nhiều loại khác nhau. Nó cũng cho phép tải dữ liệu từ bảng tạm, đối tượng hoặc tệp.
is the API that allows you to save the contents of
$ pip install xlwt openpyxl xlsxwriter xlrd
0 and
$ pip install xlwt openpyxl xlsxwriter xlrd
1 objects to the clipboard, objects, or files of various types. It also enables loading data from the clipboard, objects, or files.

Viết tập tin

Đối tượng

$ pip install xlwt openpyxl xlsxwriter xlrd
0 và
$ pip install xlwt openpyxl xlsxwriter xlrd
1 có các phương thức cho phép ghi dữ liệu và nhãn vào bảng tạm hoặc tệp. Họ có tên với mẫu
>>> import pandas as pd
25, trong đó
>>> import pandas as pd
26 là loại tệp đích.
>>> import pandas as pd
25
, where
>>> import pandas as pd
26 is the type of the target file.

Bạn đã học về

>>> df.to_excel('data.xlsx')
1 và
>>> import pandas as pd
12, nhưng có những người khác, bao gồm:

  • >>> import pandas as pd
    
    29
  • >>> import pandas as pd
    
    30
  • >>> import pandas as pd
    
    31
  • >>> import pandas as pd
    
    32

Vẫn còn nhiều loại tệp mà bạn có thể viết, vì vậy danh sách này không đầy đủ.

Các phương thức này có các tham số chỉ định đường dẫn tệp đích nơi bạn đã lưu dữ liệu và nhãn. Đây là bắt buộc trong một số trường hợp và tùy chọn ở những trường hợp khác. Nếu tùy chọn này có sẵn và bạn chọn bỏ qua nó, thì các phương thức sẽ trả về các đối tượng (như chuỗi hoặc iterables) với nội dung của các phiên bản

$ pip install xlwt openpyxl xlsxwriter xlrd
1.

Tham số tùy chọn

>>> import pandas as pd
34 quyết định làm thế nào để nén tệp với dữ liệu và nhãn. Bạn sẽ tìm hiểu thêm về nó sau này. Có một vài tham số khác, nhưng chúng chủ yếu là cụ thể cho một hoặc một số phương thức. Bạn đã giành chiến thắng đi vào họ một cách chi tiết ở đây.

Đọc tệp

Các chức năng của gấu trúc để đọc nội dung của các tệp được đặt tên bằng cách sử dụng mẫu

>>> import pandas as pd
35, trong đó
>>> import pandas as pd
26 chỉ ra loại tệp cần đọc. Bạn đã thấy các chức năng của Pandas
>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 và
>>> import pandas as pd
15. Đây là một vài người khác:
>>> import pandas as pd
35
, where
>>> import pandas as pd
26 indicates the type of the file to read. You’ve already seen the Pandas
>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 and
>>> import pandas as pd
15 functions. Here are a few others:

  • >>> import pandas as pd
    
    39
  • >>> import pandas as pd
    
    40
  • >>> import pandas as pd
    
    41
  • >>> import pandas as pd
    
    42

Các chức năng này có một tham số chỉ định đường dẫn tệp đích. Nó có thể là bất kỳ chuỗi hợp lệ nào đại diện cho đường dẫn, trên máy cục bộ hoặc trong URL. Các đối tượng khác cũng được chấp nhận tùy thuộc vào loại tệp.

Tham số tùy chọn

>>> import pandas as pd
34 xác định loại giải nén sẽ sử dụng cho các tệp được nén. Bạn sẽ tìm hiểu về nó sau này trong hướng dẫn này. Có các tham số khác, nhưng chúng cụ thể cho một hoặc một số chức năng. Bạn đã giành chiến thắng đi vào họ một cách chi tiết ở đây.

Làm việc với các loại tệp khác nhau

Thư viện Pandas cung cấp một loạt các khả năng để lưu dữ liệu của bạn vào các tệp và tải dữ liệu từ các tệp. Trong phần này, bạn sẽ tìm hiểu thêm về việc làm việc với các tệp CSV và Excel. Bạn cũng sẽ thấy cách sử dụng các loại tệp khác, như JSON, trang web, cơ sở dữ liệu và tệp Python Pickle.

Tệp CSV

Bạn đã học cách đọc và viết các tệp CSV. Bây giờ, hãy để đào sâu hơn một chút vào các chi tiết. Khi bạn sử dụng

>>> df.to_excel('data.xlsx')
1 để lưu
$ pip install xlwt openpyxl xlsxwriter xlrd
1 của mình, bạn có thể cung cấp một đối số cho tham số
>>> import pandas as pd
46 để chỉ định đường dẫn, tên và mở rộng của tệp đích.

>>> import pandas as pd
46 là đối số đầu tiên
>>> df.to_excel('data.xlsx')
1 sẽ nhận được. Nó có thể là bất kỳ chuỗi nào đại diện cho một đường dẫn tệp hợp lệ bao gồm tên tệp và phần mở rộng của nó. Bạn đã thấy điều này trong một ví dụ trước. Tuy nhiên, nếu bạn bỏ qua
>>> import pandas as pd
46, thì
>>> df.to_excel('data.xlsx')
1 đã giành được bất kỳ tệp nào. Thay vào đó, nó sẽ trả về chuỗi tương ứng:

>>>

>>> import pandas as pd
1

Bây giờ bạn có chuỗi

>>> import pandas as pd
51 thay vì tệp CSV. Bạn cũng có một số giá trị bị thiếu trong đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1 của bạn. Ví dụ, lục địa Nga và thời độc lập của một số quốc gia (Trung Quốc, Nhật Bản, v.v.) không có sẵn. Trong khoa học dữ liệu và học máy, bạn phải xử lý cẩn thận các giá trị bị thiếu. Pandas xuất sắc ở đây! Theo mặc định, Pandas sử dụng giá trị NAN để thay thế các giá trị bị thiếu.missing values in your
$ pip install xlwt openpyxl xlsxwriter xlrd
1 object. For example, the continent for Russia and the independence days for several countries (China, Japan, and so on) are not available. In data science and machine learning, you must handle missing values carefully. Pandas excels here! By default, Pandas uses the NaN value to replace the missing values.

Lục địa tương ứng với Nga trong

>>> import pandas as pd
53 là
>>> import pandas as pd
54:

>>>

>>> import pandas as pd
2

Bây giờ bạn có chuỗi

>>> import pandas as pd
51 thay vì tệp CSV. Bạn cũng có một số giá trị bị thiếu trong đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1 của bạn. Ví dụ, lục địa Nga và thời độc lập của một số quốc gia (Trung Quốc, Nhật Bản, v.v.) không có sẵn. Trong khoa học dữ liệu và học máy, bạn phải xử lý cẩn thận các giá trị bị thiếu. Pandas xuất sắc ở đây! Theo mặc định, Pandas sử dụng giá trị NAN để thay thế các giá trị bị thiếu.

Lục địa tương ứng với Nga trong

>>> import pandas as pd
53 là
>>> import pandas as pd
54:

>>>

>>> import pandas as pd
3

Bây giờ bạn có chuỗi

>>> import pandas as pd
51 thay vì tệp CSV. Bạn cũng có một số giá trị bị thiếu trong đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1 của bạn. Ví dụ, lục địa Nga và thời độc lập của một số quốc gia (Trung Quốc, Nhật Bản, v.v.) không có sẵn. Trong khoa học dữ liệu và học máy, bạn phải xử lý cẩn thận các giá trị bị thiếu. Pandas xuất sắc ở đây! Theo mặc định, Pandas sử dụng giá trị NAN để thay thế các giá trị bị thiếu.

>>> import pandas as pd
4

Lục địa tương ứng với Nga trong

>>> import pandas as pd
53 là
>>> import pandas as pd
54:

Ví dụ này sử dụng

>>> import pandas as pd
55 để lấy dữ liệu với tên hàng và cột được chỉ định.

  • >>> import pandas as pd
    
    66
  • >>> import pandas as pd
    
    67
  • >>> import pandas as pd
    
    68
  • >>> import pandas as pd
    
    69
  • >>> import pandas as pd
    
    70
  • >>> import pandas as pd
    
    71

Khi bạn lưu

$ pip install xlwt openpyxl xlsxwriter xlrd
1 của mình vào tệp CSV, các chuỗi trống (
>>> import pandas as pd
57) sẽ đại diện cho dữ liệu bị thiếu. Bạn có thể thấy điều này cả trong tệp của mình
>>> df.to_excel('data.xlsx')
5 và trong chuỗi
>>> import pandas as pd
51. Nếu bạn muốn thay đổi hành vi này, thì hãy sử dụng tham số tùy chọn
>>> import pandas as pd
60:

>>>

>>> import pandas as pd
5

Tại đây, bạn đã đánh dấu chuỗi

>>> import pandas as pd
62 là một nhãn dữ liệu bị thiếu mới và gấu trúc đã thay thế nó bằng
>>> import pandas as pd
54 khi đọc tệp.

Khi bạn tải dữ liệu từ một tệp, gấu trúc gán các loại dữ liệu cho các giá trị của mỗi cột theo mặc định. Bạn có thể kiểm tra các loại này với

>>> import pandas as pd
77:

>>>

>>> import pandas as pd
6

Các cột có chuỗi và ngày (

>>> import pandas as pd
78,
>>> import pandas as pd
79 và
>>> import pandas as pd
80) có loại dữ liệu
>>> import pandas as pd
81. Trong khi đó, các cột số chứa số điểm nổi 64 bit (
>>> import pandas as pd
82).

Bạn có thể sử dụng tham số

>>> import pandas as pd
83 để chỉ định các loại dữ liệu mong muốn và
>>> import pandas as pd
84 để buộc sử dụng các dữ liệu:

>>>

>>> import pandas as pd
7

Bây giờ, bạn có số điểm nổi 32 bit (

>>> import pandas as pd
85) như được chỉ định với
>>> import pandas as pd
83. Chúng khác một chút so với các số 64 bit ban đầu vì độ chính xác nhỏ hơn. Các giá trị trong cột cuối cùng được coi là ngày và có loại dữ liệu
>>> import pandas as pd
87. Đó là lý do tại sao các giá trị
>>> import pandas as pd
88 trong cột này được thay thế bằng
>>> import pandas as pd
89.precision. The values in the last column are considered as dates and have the data type
>>> import pandas as pd
87. That’s why the
>>> import pandas as pd
88 values in this column are replaced with
>>> import pandas as pd
89.

Bây giờ bạn có ngày thực sự, bạn có thể lưu chúng theo định dạng bạn thích:

>>>

>>> import pandas as pd
8

Ở đây, bạn đã chỉ định tham số

>>> import pandas as pd
90 là
>>> import pandas as pd
91. Bạn có thể mở rộng khối mã bên dưới để xem tệp kết quả:

>>> import pandas as pd
9

Định dạng của ngày bây giờ là khác nhau. Định dạng

>>> import pandas as pd
91 có nghĩa là ngày đầu tiên sẽ hiển thị tên đầy đủ của tháng, sau đó là ngày tiếp theo là dấu phẩy và cuối cùng cả năm.

Có một số tham số tùy chọn khác mà bạn có thể sử dụng với

>>> df.to_excel('data.xlsx')
1:

  • >>> import pandas as pd
    
    94 biểu thị một dấu phân cách giá trị.
    denotes a values separator.
  • >>> import pandas as pd
    
    95 chỉ ra một dấu phân cách thập phân.
    indicates a decimal separator.
  • >>> import pandas as pd
    
    96 Đặt mã hóa tệp.
    sets the file encoding.
  • >>> import pandas as pd
    
    97 Chỉ định xem bạn có muốn viết nhãn cột trong tệp không.
    specifies whether you want to write column labels in the file.

Tại đây, cách bạn sẽ vượt qua các đối số cho

>>> import pandas as pd
94 và
>>> import pandas as pd
97:

>>>

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
0

Dữ liệu được phân tách bằng dấu chấm phẩy (

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
00) vì bạn đã chỉ định
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
01. Ngoài ra, vì bạn đã vượt qua
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
02, bạn thấy dữ liệu của bạn mà không có hàng tiêu đề của tên cột.

Hàm Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 có nhiều tùy chọn bổ sung để quản lý dữ liệu bị thiếu, làm việc với ngày và thời gian, trích dẫn, mã hóa, xử lý lỗi, v.v. Chẳng hạn, nếu bạn có một tệp có một cột dữ liệu và muốn nhận đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
0 thay vì
$ pip install xlwt openpyxl xlsxwriter xlrd
1, thì bạn có thể chuyển
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
06 đến
>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9. Bạn sẽ học sau này về việc nén dữ liệu và giải nén, cũng như cách bỏ qua các hàng và cột.

Tệp JSON

JSON là viết tắt của ký hiệu đối tượng JavaScript. Các tệp JSON là các tệp plaintext được sử dụng để trao đổi dữ liệu và con người có thể đọc chúng một cách dễ dàng. Họ tuân theo các tiêu chuẩn ISO/IEC 21778: 2017 và ECMA-404 và sử dụng tiện ích mở rộng

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
08. Python và Pandas hoạt động tốt với các tệp JSON, vì thư viện Python xông JSON cung cấp hỗ trợ tích hợp cho chúng.

Bạn có thể lưu dữ liệu từ

$ pip install xlwt openpyxl xlsxwriter xlrd
1 của mình vào tệp JSON với
>>> import pandas as pd
29. Bắt đầu bằng cách tạo một đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1 một lần nữa. Sử dụng từ điển
$ pip install xlwt openpyxl xlsxwriter xlrd
8 chứa dữ liệu về các quốc gia và sau đó áp dụng
>>> import pandas as pd
29:

>>>

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
1

Mã này tạo ra tệp

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
14. Bạn có thể mở rộng khối mã bên dưới để xem tệp này sẽ trông như thế nào:

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
2

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
14 có một từ điển lớn với các nhãn cột là các khóa và từ điển bên trong tương ứng làm giá trị.

Bạn có thể nhận được một cấu trúc tệp khác nếu bạn vượt qua một đối số cho tham số tùy chọn

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
16:

>>>

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
3

Tham số

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
16 mặc định là
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
18. Ở đây, bạn đã đặt nó thành
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
19.

Bạn sẽ nhận được một tệp mới

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
20. Bạn có thể mở rộng khối mã bên dưới để xem các thay đổi:

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
4

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
20 cũng có một từ điển lớn, nhưng lần này các nhãn hàng là các khóa và từ điển bên trong là các giá trị.

Có một vài lựa chọn khác cho

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
16. Một trong số đó là
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
23:

>>>

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
5

Mã này sẽ mang lại tệp

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
24. Bạn có thể mở rộng khối mã bên dưới để xem nội dung:

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
6

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
24 giữ một danh sách với một từ điển cho mỗi hàng. Các nhãn hàng không được viết.

Bạn có thể nhận được một cấu trúc tệp thú vị khác với

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
26:

>>>

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
7

Tệp kết quả là

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
27. Bạn có thể mở rộng khối mã bên dưới để xem tệp này sẽ trông như thế nào:

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
8

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
27 chứa một từ điển giữ các danh sách sau:

  • Tên của các cột of the columns
  • Nhãn của các hàng of the rows
  • Danh sách bên trong (chuỗi hai chiều) giữ các giá trị dữ liệu (two-dimensional sequence) that hold data values

Nếu bạn không cung cấp giá trị cho tham số tùy chọn

>>> import pandas as pd
46 xác định đường dẫn tệp, thì
>>> import pandas as pd
29 sẽ trả về chuỗi JSON thay vì ghi kết quả vào tệp. Hành vi này phù hợp với
>>> df.to_excel('data.xlsx')
1.

Có các tham số tùy chọn khác bạn có thể sử dụng. Chẳng hạn, bạn có thể đặt

>>> df.to_excel('data.xlsx')
6 để từ bỏ các nhãn hàng lưu. Bạn có thể thao tác độ chính xác với
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
33 và ngày với
>>> import pandas as pd
90 và
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
35. Hai tham số cuối cùng này đặc biệt quan trọng khi bạn có chuỗi thời gian giữa dữ liệu của mình:

>>>

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
9

Trong ví dụ này, bạn đã tạo ra

$ pip install xlwt openpyxl xlsxwriter xlrd
1 từ từ điển
$ pip install xlwt openpyxl xlsxwriter xlrd
8 và được sử dụng
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
38 để chuyển đổi các giá trị trong cột cuối cùng thành
>>> import pandas as pd
87. Bạn có thể mở rộng khối mã bên dưới để xem tệp kết quả:

>>> df = pd.DataFrame(data=data, index=columns).T
0

Trong tập tin này, bạn có số nguyên lớn thay vì ngày cho những ngày độc lập. Điều đó bởi vì giá trị mặc định của tham số tùy chọn

>>> import pandas as pd
90 là
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
41 bất cứ khi nào
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
16 isn
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
43. Hành vi mặc định này biểu thị ngày là một kỷ nguyên tính bằng mili giây so với nửa đêm vào ngày 1 tháng 1 năm 1970.

Tuy nhiên, nếu bạn vượt qua

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
44, thì bạn sẽ nhận được ngày ở định dạng ISO 8601. Ngoài ra,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
35 quyết định các đơn vị thời gian:

>>>

>>> df = pd.DataFrame(data=data, index=columns).T
1

Mã này tạo ra tệp JSON sau:

>>> df = pd.DataFrame(data=data, index=columns).T
2

Các ngày trong tệp kết quả ở định dạng ISO 8601.

Bạn có thể tải dữ liệu từ tệp JSON với

>>> import pandas as pd
39:

>>>

>>> df = pd.DataFrame(data=data, index=columns).T
3

Tham số

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
47 có mục đích tương tự như
>>> import pandas as pd
84 khi bạn sử dụng nó để đọc các tệp CSV. Tham số tùy chọn
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
16 rất quan trọng vì nó chỉ định cách gấu trúc hiểu được cấu trúc của tệp.

Có các tham số tùy chọn khác mà bạn cũng có thể sử dụng:

  • Đặt mã hóa với
    >>> import pandas as pd
    
    96.
    with
    >>> import pandas as pd
    
    96.
  • Thao tác ngày với
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    47 và
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    52.
    with
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    47 and
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    52.
  • Độ chính xác tác động với
    >>> import pandas as pd
    
    83 và
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    54.
    with
    >>> import pandas as pd
    
    83 and
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    54.
  • Giải mã dữ liệu số trực tiếp đến các mảng numpy với
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    55.
    directly to NumPy arrays with
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    55.

Lưu ý rằng bạn có thể mất thứ tự các hàng và cột khi sử dụng định dạng JSON để lưu trữ dữ liệu của bạn.

Tệp HTML

HTML là một tệp văn bản sử dụng ngôn ngữ đánh dấu siêu văn bản để giúp trình duyệt hiển thị các trang web. Các tiện ích mở rộng cho các tệp HTML là

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
56 và
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
57. Bạn cần phải cài đặt thư viện phân tích cú pháp HTML như LXML hoặc HTML5LIB để có thể làm việc với các tệp HTML:

>>> df = pd.DataFrame(data=data, index=columns).T
4

Bạn cũng có thể sử dụng Conda để cài đặt các gói tương tự:

>>> df = pd.DataFrame(data=data, index=columns).T
5

Khi bạn có các thư viện này, bạn có thể lưu nội dung của

$ pip install xlwt openpyxl xlsxwriter xlrd
1 dưới dạng tệp HTML với
>>> import pandas as pd
30:

>>>

>>> df = pd.DataFrame(data=data, index=columns).T
6

Mã này tạo ra một tệp

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
60. Bạn có thể mở rộng khối mã bên dưới để xem tệp này sẽ trông như thế nào:

>>> df = pd.DataFrame(data=data, index=columns).T
7

Tệp này hiển thị nội dung

$ pip install xlwt openpyxl xlsxwriter xlrd
1 độc đáo. Tuy nhiên, lưu ý rằng bạn đã có được toàn bộ trang web. Bạn chỉ cần xuất dữ liệu tương ứng với
>>> import pandas as pd
53 ở định dạng HTML.

>>> import pandas as pd
30 won Tạo một tệp nếu bạn không cung cấp tham số tùy chọn
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
64, biểu thị bộ đệm để ghi vào. Nếu bạn bỏ tham số này, thì mã của bạn sẽ trả về một chuỗi như đã làm với
>>> df.to_excel('data.xlsx')
1 và
>>> import pandas as pd
29.

Dưới đây là một số tham số tùy chọn khác:

  • >>> import pandas as pd
    
    97 Xác định có lưu tên cột hay không.
    determines whether to save the column names.
  • >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    19 Xác định xem có lưu nhãn hàng hay không.
    determines whether to save the row labels.
  • >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    69 gán các lớp biểu định Cascading Style (CSS).
    assigns cascading style sheet (CSS) classes.
  • >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    70 Chỉ định có chuyển đổi URL thành liên kết HTML hay không.
    specifies whether to convert URLs to HTML links.
  • >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    71 gán CSS
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    72 cho thẻ
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    73.
    assigns the CSS
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    72 to the
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    73 tag.
  • >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    74 quyết định có nên chuyển đổi các ký tự
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    75,
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    76 và
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    77 sang chuỗi an toàn HTML.
    decides whether to convert the characters
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    75,
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    76, and
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    77 to HTML-safe strings.

Bạn sử dụng các tham số như thế này để chỉ định các khía cạnh khác nhau của các tệp hoặc chuỗi kết quả.

Bạn có thể tạo đối tượng

$ pip install xlwt openpyxl xlsxwriter xlrd
1 từ tệp HTML phù hợp bằng cách sử dụng
>>> import pandas as pd
40, sẽ trả về một thể hiện
$ pip install xlwt openpyxl xlsxwriter xlrd
1 hoặc danh sách chúng:

>>>

>>> df = pd.DataFrame(data=data, index=columns).T
8

Điều này rất giống với những gì bạn đã làm khi đọc các tệp CSV. Bạn cũng có các tham số giúp bạn làm việc với ngày, các giá trị bị thiếu, độ chính xác, mã hóa, trình phân tích cú pháp HTML, v.v.

Các tập tin Excel

Bạn đã học được cách đọc và viết các tệp Excel bằng gấu trúc. Tuy nhiên, có một vài lựa chọn đáng để xem xét. Đối với một, khi bạn sử dụng

>>> import pandas as pd
12, bạn có thể chỉ định tên của bảng tính đích với tham số tùy chọn
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82:

>>>

>>> df = pd.DataFrame(data=data, index=columns).T
9

Tại đây, bạn tạo một tệp

>>> import pandas as pd
14 với một bảng tính có tên
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
84 lưu trữ dữ liệu. Chuỗi
>>> import pandas as pd
13 là đối số cho tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
86 xác định tên của tệp excel hoặc đường dẫn của nó.

Các tham số tùy chọn

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
87 và
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
88 đều mặc định là
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
89 và cho biết ô trên bên trái nhất nơi dữ liệu sẽ bắt đầu được ghi:

>>>

>>> df.to_csv('data.csv')
0

Ở đây, bạn chỉ định rằng bảng sẽ bắt đầu ở hàng thứ ba và cột thứ năm. Bạn cũng đã sử dụng lập chỉ mục dựa trên không, do đó hàng thứ ba được ký hiệu là

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
90 và cột thứ năm bằng
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
91.

Bây giờ bảng tính kết quả trông như thế này:

Hướng dẫn how read and write csv file in python pandas? - làm thế nào để đọc và ghi tệp csv trong python pandas?

Như bạn có thể thấy, bảng bắt đầu ở hàng thứ ba

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
90 và cột thứ năm
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
93.

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
94 cũng có tham số tùy chọn
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 chỉ định bảng tính nào cần đọc khi tải dữ liệu. Nó có thể đảm nhận một trong các giá trị sau:

  • Chỉ số dựa trên không dựa trên bảng tính of the worksheet
  • Tên của bảng tính of the worksheet
  • Danh sách các chỉ số hoặc tên để đọc nhiều tờ of indices or names to read multiple sheets
  • Giá trị
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    96 để đọc tất cả các tờ
    to read all sheets

Tại đây, cách bạn sẽ sử dụng tham số này trong mã của mình:

>>>

>>> df.to_csv('data.csv')
1

Cả hai câu trên đều tạo ra cùng một

$ pip install xlwt openpyxl xlsxwriter xlrd
1 vì các tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 có cùng giá trị. Trong cả hai trường hợp,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
99 và
>>> df = pd.DataFrame(data=data, index=columns).T
00 đề cập đến cùng một bảng tính. Đối số
>>> df = pd.DataFrame(data=data, index=columns).T
01 bảo Pandas cố gắng xem xét các giá trị trong cột này là ngày hoặc thời gian.

Có các tham số tùy chọn khác mà bạn có thể sử dụng với

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
94 và
>>> import pandas as pd
12 để xác định động cơ Excel, mã hóa, cách xử lý các giá trị và thông tin thiếu, phương thức ghi tên cột và nhãn hàng, v.v.

Tệp SQL

Công cụ Pandas IO cũng có thể đọc và viết cơ sở dữ liệu. Trong ví dụ tiếp theo này, bạn sẽ viết dữ liệu của mình vào cơ sở dữ liệu có tên là

>>> df = pd.DataFrame(data=data, index=columns).T
04. Để bắt đầu, bạn sẽ cần gói sqlalchemy. Để tìm hiểu thêm về nó, bạn có thể đọc hướng dẫn ORM chính thức. Bạn cũng sẽ cần trình điều khiển cơ sở dữ liệu. Python có một trình điều khiển tích hợp cho SQLite.

Bạn có thể cài đặt SQLalchemy với PIP:

Bạn cũng có thể cài đặt nó với Conda:

>>> df.to_csv('data.csv')
2

Khi bạn đã cài đặt SQLalchemy, nhập

>>> df = pd.DataFrame(data=data, index=columns).T
05 và tạo một công cụ cơ sở dữ liệu:

>>>

>>> df.to_csv('data.csv')
3

Cả hai câu trên đều tạo ra cùng một

$ pip install xlwt openpyxl xlsxwriter xlrd
1 vì các tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 có cùng giá trị. Trong cả hai trường hợp,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
99 và
>>> df = pd.DataFrame(data=data, index=columns).T
00 đề cập đến cùng một bảng tính. Đối số
>>> df = pd.DataFrame(data=data, index=columns).T
01 bảo Pandas cố gắng xem xét các giá trị trong cột này là ngày hoặc thời gian.

>>>

>>> df.to_csv('data.csv')
4

Cả hai câu trên đều tạo ra cùng một

$ pip install xlwt openpyxl xlsxwriter xlrd
1 vì các tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 có cùng giá trị. Trong cả hai trường hợp,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
99 và
>>> df = pd.DataFrame(data=data, index=columns).T
00 đề cập đến cùng một bảng tính. Đối số
>>> df = pd.DataFrame(data=data, index=columns).T
01 bảo Pandas cố gắng xem xét các giá trị trong cột này là ngày hoặc thời gian.

Có các tham số tùy chọn khác mà bạn có thể sử dụng với

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
94 và
>>> import pandas as pd
12 để xác định động cơ Excel, mã hóa, cách xử lý các giá trị và thông tin thiếu, phương thức ghi tên cột và nhãn hàng, v.v.

>>>

>>> df.to_csv('data.csv')
5

Cả hai câu trên đều tạo ra cùng một

$ pip install xlwt openpyxl xlsxwriter xlrd
1 vì các tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 có cùng giá trị. Trong cả hai trường hợp,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
99 và
>>> df = pd.DataFrame(data=data, index=columns).T
00 đề cập đến cùng một bảng tính. Đối số
>>> df = pd.DataFrame(data=data, index=columns).T
01 bảo Pandas cố gắng xem xét các giá trị trong cột này là ngày hoặc thời gian.

Có các tham số tùy chọn khác mà bạn có thể sử dụng với

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
94 và
>>> import pandas as pd
12 để xác định động cơ Excel, mã hóa, cách xử lý các giá trị và thông tin thiếu, phương thức ghi tên cột và nhãn hàng, v.v.

Hướng dẫn how read and write csv file in python pandas? - làm thế nào để đọc và ghi tệp csv trong python pandas?

Tệp SQL

Công cụ Pandas IO cũng có thể đọc và viết cơ sở dữ liệu. Trong ví dụ tiếp theo này, bạn sẽ viết dữ liệu của mình vào cơ sở dữ liệu có tên là

>>> df = pd.DataFrame(data=data, index=columns).T
04. Để bắt đầu, bạn sẽ cần gói sqlalchemy. Để tìm hiểu thêm về nó, bạn có thể đọc hướng dẫn ORM chính thức. Bạn cũng sẽ cần trình điều khiển cơ sở dữ liệu. Python có một trình điều khiển tích hợp cho SQLite.

  • Bạn có thể cài đặt SQLalchemy với PIP: raises a ValueError and is the default.
  • Bạn cũng có thể cài đặt nó với Conda: drops the table and inserts new values.
  • Khi bạn đã cài đặt SQLalchemy, nhập
    >>> df = pd.DataFrame(data=data, index=columns).T
    
    05 và tạo một công cụ cơ sở dữ liệu:
    inserts new values into the table.

Bây giờ bạn đã thiết lập mọi thứ, bước tiếp theo là tạo một đối tượng

$ pip install xlwt openpyxl xlsxwriter xlrd
1. Nó thuận tiện để chỉ định các loại dữ liệu và áp dụng
>>> import pandas as pd
31.

>>>

>>> df.to_csv('data.csv')
6

Cả hai câu trên đều tạo ra cùng một

$ pip install xlwt openpyxl xlsxwriter xlrd
1 vì các tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 có cùng giá trị. Trong cả hai trường hợp,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
99 và
>>> df = pd.DataFrame(data=data, index=columns).T
00 đề cập đến cùng một bảng tính. Đối số
>>> df = pd.DataFrame(data=data, index=columns).T
01 bảo Pandas cố gắng xem xét các giá trị trong cột này là ngày hoặc thời gian.

>>>

>>> df.to_csv('data.csv')
7

Cả hai câu trên đều tạo ra cùng một

$ pip install xlwt openpyxl xlsxwriter xlrd
1 vì các tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 có cùng giá trị. Trong cả hai trường hợp,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
99 và
>>> df = pd.DataFrame(data=data, index=columns).T
00 đề cập đến cùng một bảng tính. Đối số
>>> df = pd.DataFrame(data=data, index=columns).T
01 bảo Pandas cố gắng xem xét các giá trị trong cột này là ngày hoặc thời gian.

Có các tham số tùy chọn khác mà bạn có thể sử dụng với

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
94 và
>>> import pandas as pd
12 để xác định động cơ Excel, mã hóa, cách xử lý các giá trị và thông tin thiếu, phương thức ghi tên cột và nhãn hàng, v.v.

>>>

>>> df.to_csv('data.csv')
8

Cả hai câu trên đều tạo ra cùng một

$ pip install xlwt openpyxl xlsxwriter xlrd
1 vì các tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 có cùng giá trị. Trong cả hai trường hợp,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
99 và
>>> df = pd.DataFrame(data=data, index=columns).T
00 đề cập đến cùng một bảng tính. Đối số
>>> df = pd.DataFrame(data=data, index=columns).T
01 bảo Pandas cố gắng xem xét các giá trị trong cột này là ngày hoặc thời gian.

Có các tham số tùy chọn khác mà bạn có thể sử dụng với

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
94 và
>>> import pandas as pd
12 để xác định động cơ Excel, mã hóa, cách xử lý các giá trị và thông tin thiếu, phương thức ghi tên cột và nhãn hàng, v.v.

Tệp SQL

Công cụ Pandas IO cũng có thể đọc và viết cơ sở dữ liệu. Trong ví dụ tiếp theo này, bạn sẽ viết dữ liệu của mình vào cơ sở dữ liệu có tên là >>> df = pd.DataFrame(data=data, index=columns).T 04. Để bắt đầu, bạn sẽ cần gói sqlalchemy. Để tìm hiểu thêm về nó, bạn có thể đọc hướng dẫn ORM chính thức. Bạn cũng sẽ cần trình điều khiển cơ sở dữ liệu. Python có một trình điều khiển tích hợp cho SQLite.

Bạn có thể cài đặt SQLalchemy với PIP:

Bạn cũng có thể cài đặt nó với Conda:

>>>

>>> df.to_csv('data.csv')
9

Cả hai câu trên đều tạo ra cùng một

$ pip install xlwt openpyxl xlsxwriter xlrd
1 vì các tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 có cùng giá trị. Trong cả hai trường hợp,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
99 và
>>> df = pd.DataFrame(data=data, index=columns).T
00 đề cập đến cùng một bảng tính. Đối số
>>> df = pd.DataFrame(data=data, index=columns).T
01 bảo Pandas cố gắng xem xét các giá trị trong cột này là ngày hoặc thời gian.

Có các tham số tùy chọn khác mà bạn có thể sử dụng với

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
94 và
>>> import pandas as pd
12 để xác định động cơ Excel, mã hóa, cách xử lý các giá trị và thông tin thiếu, phương thức ghi tên cột và nhãn hàng, v.v.

>>>

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16
0

Cả hai câu trên đều tạo ra cùng một

$ pip install xlwt openpyxl xlsxwriter xlrd
1 vì các tham số
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
82 có cùng giá trị. Trong cả hai trường hợp,
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
99 và
>>> df = pd.DataFrame(data=data, index=columns).T
00 đề cập đến cùng một bảng tính. Đối số
>>> df = pd.DataFrame(data=data, index=columns).T
01 bảo Pandas cố gắng xem xét các giá trị trong cột này là ngày hoặc thời gian.

>>>

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16
1

Có các tham số tùy chọn khác mà bạn có thể sử dụng với

>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
94 và
>>> import pandas as pd
12 để xác định động cơ Excel, mã hóa, cách xử lý các giá trị và thông tin thiếu, phương thức ghi tên cột và nhãn hàng, v.v.

Tệp SQLThis can be dangerous! When you unpickle an untrustworthy file, it could execute arbitrary code on your machine, gain remote access to your computer, or otherwise exploit your device in other ways.

Làm việc với dữ liệu lớn

Nếu các tệp của bạn quá lớn để lưu hoặc xử lý, thì có một số cách tiếp cận bạn có thể thực hiện để giảm không gian đĩa cần thiết:

  • Nén các tập tin của bạn your files
  • Chỉ chọn các cột bạn muốn only the columns you want
  • Bỏ qua các hàng bạn không cần the rows you don’t need
  • Buộc sử dụng các loại dữ liệu ít chính xác hơn the use of less precise data types
  • Chia dữ liệu thành các khối the data into chunks

Bạn sẽ lần lượt xem từng kỹ thuật này.

Tệp nén và giải nén

Bạn có thể tạo một tệp lưu trữ giống như bạn sẽ có một tệp thông thường, với việc bổ sung một hậu tố tương ứng với loại nén mong muốn:

  • >>> df = pd.DataFrame(data=data, index=columns).T
    
    53
  • >>> df = pd.DataFrame(data=data, index=columns).T
    
    54
  • >>> df = pd.DataFrame(data=data, index=columns).T
    
    55
  • >>> df = pd.DataFrame(data=data, index=columns).T
    
    56

Gấu trúc có thể tự suy ra loại nén:

>>>

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16
2

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

Bạn có thể mở tệp nén này như bình thường với chức năng Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9:

>>>

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16
3

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

Bạn có thể mở tệp nén này như bình thường với chức năng Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9:

  • >>> df = pd.DataFrame(data=data, index=columns).T
    
    63
  • >>> df = pd.DataFrame(data=data, index=columns).T
    
    64
  • >>> df = pd.DataFrame(data=data, index=columns).T
    
    65
  • >>> df = pd.DataFrame(data=data, index=columns).T
    
    66
  • >>> df = pd.DataFrame(data=data, index=columns).T
    
    67
  • >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    96

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 giải nén tệp trước khi đọc nó thành
$ pip install xlwt openpyxl xlsxwriter xlrd
1.

Bạn có thể chỉ định loại nén với tham số tùy chọn

>>> import pandas as pd
34, có thể đảm nhận bất kỳ giá trị nào sau đây:

>>>

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16
4

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

>>>

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16
5

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

Bạn có thể mở tệp nén này như bình thường với chức năng Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9:

>>> df = pd.read_csv('data.csv', index_col=0) >>> df COUNTRY POP AREA GDP CONT IND_DAY CHN China 1398.72 9596.96 12234.78 Asia NaN IND India 1351.16 3287.26 2575.67 Asia 1947-08-15 USA US 329.74 9833.52 19485.39 N.America 1776-07-04 IDN Indonesia 268.07 1910.93 1015.54 Asia 1945-08-17 BRA Brazil 210.32 8515.77 2055.51 S.America 1822-09-07 PAK Pakistan 205.71 881.91 302.14 Asia 1947-08-14 NGA Nigeria 200.96 923.77 375.77 Africa 1960-10-01 BGD Bangladesh 167.09 147.57 245.63 Asia 1971-03-26 RUS Russia 146.79 17098.25 1530.75 NaN 1992-06-12 MEX Mexico 126.58 1964.38 1158.23 N.America 1810-09-16 JPN Japan 126.22 377.97 4872.42 Asia NaN DEU Germany 83.02 357.11 3693.20 Europe NaN FRA France 67.02 640.68 2582.49 Europe 1789-07-14 GBR UK 66.44 242.50 2631.23 Europe NaN ITA Italy 60.36 301.34 1943.84 Europe NaN ARG Argentina 44.94 2780.40 637.49 S.America 1816-07-09 DZA Algeria 43.38 2381.74 167.56 Africa 1962-07-05 CAN Canada 37.59 9984.67 1647.12 N.America 1867-07-01 AUS Australia 25.47 7692.02 1408.68 Oceania NaN KAZ Kazakhstan 18.53 2724.90 159.41 Asia 1991-12-16 9 giải nén tệp trước khi đọc nó thành $ pip install xlwt openpyxl xlsxwriter xlrd 1.

Bạn có thể chỉ định loại nén với tham số tùy chọn

>>> import pandas as pd
34, có thể đảm nhận bất kỳ giá trị nào sau đây:

>>>

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16
6

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

Bạn có thể mở tệp nén này như bình thường với chức năng Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9:

>>>

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16
7

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16

Bạn có thể mở tệp nén này như bình thường với chức năng Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9:

  • >>> df = pd.read_csv('data.csv', index_col=0)
    >>> df
            COUNTRY      POP      AREA       GDP       CONT     IND_DAY
    CHN       China  1398.72   9596.96  12234.78       Asia         NaN
    IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
    USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
    IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
    BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
    NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
    MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
    JPN       Japan   126.22    377.97   4872.42       Asia         NaN
    DEU     Germany    83.02    357.11   3693.20     Europe         NaN
    FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.50   2631.23     Europe         NaN
    ITA       Italy    60.36    301.34   1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
    DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
    CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
    AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
    
    9 giải nén tệp trước khi đọc nó thành
    $ pip install xlwt openpyxl xlsxwriter xlrd
    
    1.index
    >>> df = pd.DataFrame(data=data).T
    >>> df
            COUNTRY      POP     AREA      GDP       CONT     IND_DAY
    CHN       China  1398.72  9596.96  12234.8       Asia         NaN
    IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
    USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
    IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
    BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
    PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
    NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
    BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
    RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
    MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
    JPN       Japan   126.22   377.97  4872.42       Asia         NaN
    DEU     Germany    83.02   357.11   3693.2     Europe         NaN
    FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
    GBR          UK    66.44    242.5  2631.23     Europe         NaN
    ITA       Italy    60.36   301.34  1943.84     Europe         NaN
    ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
    DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
    CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
    AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
    KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
    
    89
    contains the row labels.
  • Bạn có thể chỉ định loại nén với tham số tùy chọn
    >>> import pandas as pd
    
    34, có thể đảm nhận bất kỳ giá trị nào sau đây:index
    >>> df = pd.DataFrame(data=data, index=columns).T
    
    80
    contains the country names.
  • Giá trị mặc định
    >>> df = pd.DataFrame(data=data, index=columns).T
    
    69 chỉ ra rằng gấu trúc nên suy ra loại nén từ phần mở rộng tệp.index
    >>> df = pd.DataFrame(data=data, index=columns).T
    
    81
    contains the areas.

Tại đây, cách bạn sẽ nén một tệp dưa chua:

>>>

,COUNTRY,POP,AREA,GDP,CONT,IND_DAY
CHN,China,1398.72,9596.96,12234.78,Asia,
IND,India,1351.16,3287.26,2575.67,Asia,1947-08-15
USA,US,329.74,9833.52,19485.39,N.America,1776-07-04
IDN,Indonesia,268.07,1910.93,1015.54,Asia,1945-08-17
BRA,Brazil,210.32,8515.77,2055.51,S.America,1822-09-07
PAK,Pakistan,205.71,881.91,302.14,Asia,1947-08-14
NGA,Nigeria,200.96,923.77,375.77,Africa,1960-10-01
BGD,Bangladesh,167.09,147.57,245.63,Asia,1971-03-26
RUS,Russia,146.79,17098.25,1530.75,,1992-06-12
MEX,Mexico,126.58,1964.38,1158.23,N.America,1810-09-16
JPN,Japan,126.22,377.97,4872.42,Asia,
DEU,Germany,83.02,357.11,3693.2,Europe,
FRA,France,67.02,640.68,2582.49,Europe,1789-07-14
GBR,UK,66.44,242.5,2631.23,Europe,
ITA,Italy,60.36,301.34,1943.84,Europe,
ARG,Argentina,44.94,2780.4,637.49,S.America,1816-07-09
DZA,Algeria,43.38,2381.74,167.56,Africa,1962-07-05
CAN,Canada,37.59,9984.67,1647.12,N.America,1867-07-01
AUS,Australia,25.47,7692.02,1408.68,Oceania,
KAZ,Kazakhstan,18.53,2724.9,159.41,Asia,1991-12-16
9

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

Bạn có thể mở tệp nén này như bình thường với chức năng Pandas >>> df = pd.read_csv('data.csv', index_col=0) >>> df COUNTRY POP AREA GDP CONT IND_DAY CHN China 1398.72 9596.96 12234.78 Asia NaN IND India 1351.16 3287.26 2575.67 Asia 1947-08-15 USA US 329.74 9833.52 19485.39 N.America 1776-07-04 IDN Indonesia 268.07 1910.93 1015.54 Asia 1945-08-17 BRA Brazil 210.32 8515.77 2055.51 S.America 1822-09-07 PAK Pakistan 205.71 881.91 302.14 Asia 1947-08-14 NGA Nigeria 200.96 923.77 375.77 Africa 1960-10-01 BGD Bangladesh 167.09 147.57 245.63 Asia 1971-03-26 RUS Russia 146.79 17098.25 1530.75 NaN 1992-06-12 MEX Mexico 126.58 1964.38 1158.23 N.America 1810-09-16 JPN Japan 126.22 377.97 4872.42 Asia NaN DEU Germany 83.02 357.11 3693.20 Europe NaN FRA France 67.02 640.68 2582.49 Europe 1789-07-14 GBR UK 66.44 242.50 2631.23 Europe NaN ITA Italy 60.36 301.34 1943.84 Europe NaN ARG Argentina 44.94 2780.40 637.49 S.America 1816-07-09 DZA Algeria 43.38 2381.74 167.56 Africa 1962-07-05 CAN Canada 37.59 9984.67 1647.12 N.America 1867-07-01 AUS Australia 25.47 7692.02 1408.68 Oceania NaN KAZ Kazakhstan 18.53 2724.90 159.41 Asia 1991-12-16 9:

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 giải nén tệp trước khi đọc nó thành
$ pip install xlwt openpyxl xlsxwriter xlrd
1.

  • Bạn có thể chỉ định loại nén với tham số tùy chọn
    >>> import pandas as pd
    
    34, có thể đảm nhận bất kỳ giá trị nào sau đây:
    either the number of rows to skip at the beginning of the file if it’s an integer, or the zero-based indices of the rows to skip if it’s a list-like object
  • Giá trị mặc định
    >>> df = pd.DataFrame(data=data, index=columns).T
    
    69 chỉ ra rằng gấu trúc nên suy ra loại nén từ phần mở rộng tệp.
    the number of rows to skip at the end of the file
  • Tại đây, cách bạn sẽ nén một tệp dưa chua: the number of rows to read

Bạn nên lấy tệp

>>> df = pd.DataFrame(data=data, index=columns).T
70 mà sau này bạn có thể giải nén và đọc:

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
0

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

Bạn có thể mở tệp nén này như bình thường với chức năng Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9:

>>> df = pd.read_csv('data.csv', index_col=0) >>> df COUNTRY POP AREA GDP CONT IND_DAY CHN China 1398.72 9596.96 12234.78 Asia NaN IND India 1351.16 3287.26 2575.67 Asia 1947-08-15 USA US 329.74 9833.52 19485.39 N.America 1776-07-04 IDN Indonesia 268.07 1910.93 1015.54 Asia 1945-08-17 BRA Brazil 210.32 8515.77 2055.51 S.America 1822-09-07 PAK Pakistan 205.71 881.91 302.14 Asia 1947-08-14 NGA Nigeria 200.96 923.77 375.77 Africa 1960-10-01 BGD Bangladesh 167.09 147.57 245.63 Asia 1971-03-26 RUS Russia 146.79 17098.25 1530.75 NaN 1992-06-12 MEX Mexico 126.58 1964.38 1158.23 N.America 1810-09-16 JPN Japan 126.22 377.97 4872.42 Asia NaN DEU Germany 83.02 357.11 3693.20 Europe NaN FRA France 67.02 640.68 2582.49 Europe 1789-07-14 GBR UK 66.44 242.50 2631.23 Europe NaN ITA Italy 60.36 301.34 1943.84 Europe NaN ARG Argentina 44.94 2780.40 637.49 S.America 1816-07-09 DZA Algeria 43.38 2381.74 167.56 Africa 1962-07-05 CAN Canada 37.59 9984.67 1647.12 N.America 1867-07-01 AUS Australia 25.47 7692.02 1408.68 Oceania NaN KAZ Kazakhstan 18.53 2724.90 159.41 Asia 1991-12-16 9 giải nén tệp trước khi đọc nó thành $ pip install xlwt openpyxl xlsxwriter xlrd 1.

Bạn có thể chỉ định loại nén với tham số tùy chọn

>>> import pandas as pd
34, có thể đảm nhận bất kỳ giá trị nào sau đây:

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
1

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
2

Tại đây, bạn tạo một tệp

>>> df.to_excel('data.xlsx')
2 nén dưới dạng Lưu trữ. Kích thước của tệp
>>> df.to_excel('data.xlsx')
2 thông thường là 1048 byte, trong khi tệp nén chỉ có 766 byte.

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
3

Ví dụ này cho thấy cách bạn có thể kết hợp các cột số

>>> df.to_csv('data.csv')
13,
>>> df.to_csv('data.csv')
14 và
>>> df.to_csv('data.csv')
15 để nhận được tổng yêu cầu bộ nhớ của chúng. Đối số
>>> df.to_excel('data.xlsx')
6 loại trừ dữ liệu cho các nhãn hàng từ đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
0 kết quả. Đối với ba cột này, bạn sẽ cần 480 byte.

Bạn cũng có thể trích xuất các giá trị dữ liệu dưới dạng một mảng numpy với

>>> df.to_csv('data.csv')
18 hoặc
>>> df.to_csv('data.csv')
19. Sau đó, sử dụng thuộc tính
>>> df.to_csv('data.csv')
20 để lấy tổng số byte được tiêu thụ bởi các mục của mảng:

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
4

Kết quả là cùng 480 byte. Vì vậy, làm thế nào để bạn lưu bộ nhớ?

Trong trường hợp này, bạn có thể chỉ định rằng các cột số của bạn

>>> df.to_csv('data.csv')
13,
>>> df.to_csv('data.csv')
14 và
>>> df.to_csv('data.csv')
15 nên có loại
>>> import pandas as pd
85. Sử dụng tham số tùy chọn
>>> import pandas as pd
83 để làm điều này:

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
5

Từ điển

>>> df.to_csv('data.csv')
26 chỉ định các loại dữ liệu mong muốn cho mỗi cột. Nó đã chuyển cho chức năng Pandas
>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 như là đối số tương ứng với tham số
>>> import pandas as pd
83.

Bây giờ bạn có thể xác minh rằng mỗi cột số cần 80 byte hoặc 4 byte cho mỗi mục:

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
6

Mỗi giá trị là một số điểm nổi là 32 bit hoặc 4 byte. Ba cột số chứa 20 mục. Tổng cộng, bạn sẽ cần 240 byte bộ nhớ khi bạn làm việc với loại

>>> import pandas as pd
85. Đây là một nửa kích thước của 480 byte mà bạn cần phải làm việc với
>>> import pandas as pd
82.

Ngoài việc lưu bộ nhớ, bạn có thể giảm đáng kể thời gian cần thiết để xử lý dữ liệu bằng cách sử dụng

>>> import pandas as pd
85 thay vì
>>> import pandas as pd
82 trong một số trường hợp.

Sử dụng các khối để lặp lại thông qua các tệp

Một cách khác để đối phó với các bộ dữ liệu rất lớn là chia dữ liệu thành các khối nhỏ hơn và xử lý một khối tại một thời điểm. Nếu bạn sử dụng

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9,
>>> import pandas as pd
39 hoặc
>>> import pandas as pd
41, thì bạn có thể chỉ định tham số tùy chọn
>>> df.to_csv('data.csv')
36:chunks and process one chunk at a time. If you use
>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9,
>>> import pandas as pd
39 or
>>> import pandas as pd
41, then you can specify the optional parameter
>>> df.to_csv('data.csv')
36:

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
7

>>> df.to_csv('data.csv')
36 mặc định là
>>> df = pd.DataFrame(data=data).T
>>> df
        COUNTRY      POP     AREA      GDP       CONT     IND_DAY
CHN       China  1398.72  9596.96  12234.8       Asia         NaN
IND       India  1351.16  3287.26  2575.67       Asia  1947-08-15
USA          US   329.74  9833.52  19485.4  N.America  1776-07-04
IDN   Indonesia   268.07  1910.93  1015.54       Asia  1945-08-17
BRA      Brazil   210.32  8515.77  2055.51  S.America  1822-09-07
PAK    Pakistan   205.71   881.91   302.14       Asia  1947-08-14
NGA     Nigeria   200.96   923.77   375.77     Africa  1960-10-01
BGD  Bangladesh   167.09   147.57   245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.2  1530.75        NaN  1992-06-12
MEX      Mexico   126.58  1964.38  1158.23  N.America  1810-09-16
JPN       Japan   126.22   377.97  4872.42       Asia         NaN
DEU     Germany    83.02   357.11   3693.2     Europe         NaN
FRA      France    67.02   640.68  2582.49     Europe  1789-07-14
GBR          UK    66.44    242.5  2631.23     Europe         NaN
ITA       Italy    60.36   301.34  1943.84     Europe         NaN
ARG   Argentina    44.94   2780.4   637.49  S.America  1816-07-09
DZA     Algeria    43.38  2381.74   167.56     Africa  1962-07-05
CAN      Canada    37.59  9984.67  1647.12  N.America  1867-07-01
AUS   Australia    25.47  7692.02  1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.9   159.41       Asia  1991-12-16
96 và có thể nhận được giá trị số nguyên cho biết số lượng mục trong một khối. Khi
>>> df.to_csv('data.csv')
36 là một số nguyên,
>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 trả về một số lượng mà bạn có thể sử dụng trong vòng lặp
>>> df.to_csv('data.csv')
41 để lấy và chỉ xử lý một đoạn của bộ dữ liệu trong mỗi lần lặp:

>>>

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
8

Trong ví dụ này,

>>> df.to_csv('data.csv')
36 là
>>> df.to_csv('data.csv')
43. Lần lặp đầu tiên của vòng lặp
>>> df.to_csv('data.csv')
41 trả về
$ pip install xlwt openpyxl xlsxwriter xlrd
1 chỉ với tám hàng đầu tiên của bộ dữ liệu. Lần lặp thứ hai trả về một
$ pip install xlwt openpyxl xlsxwriter xlrd
1 khác với tám hàng tiếp theo. Lần lặp thứ ba và cuối cùng trả về bốn hàng còn lại.

Trong mỗi lần lặp, bạn nhận được và xử lý

$ pip install xlwt openpyxl xlsxwriter xlrd
1 với số lượng hàng bằng
>>> df.to_csv('data.csv')
36. Nó có thể có ít hàng hơn giá trị của
>>> df.to_csv('data.csv')
36 trong lần lặp cuối cùng. Bạn có thể sử dụng chức năng này để kiểm soát lượng bộ nhớ cần thiết để xử lý dữ liệu và giữ số tiền đó nhỏ một cách hợp lý.

Sự kết luận

Bây giờ bạn đã biết cách lưu dữ liệu và nhãn từ các đối tượng Pandas

$ pip install xlwt openpyxl xlsxwriter xlrd
1 sang các loại tệp khác nhau. Bạn cũng biết cách tải dữ liệu của mình từ các tệp và tạo các đối tượng
$ pip install xlwt openpyxl xlsxwriter xlrd
1.save the data and labels from Pandas
$ pip install xlwt openpyxl xlsxwriter xlrd
1 objects to different kinds of files. You also know how to load your data from files and create
$ pip install xlwt openpyxl xlsxwriter xlrd
1 objects.

Bạn đã sử dụng các phương thức Pandas

>>> df = pd.read_csv('data.csv', index_col=0)
>>> df
        COUNTRY      POP      AREA       GDP       CONT     IND_DAY
CHN       China  1398.72   9596.96  12234.78       Asia         NaN
IND       India  1351.16   3287.26   2575.67       Asia  1947-08-15
USA          US   329.74   9833.52  19485.39  N.America  1776-07-04
IDN   Indonesia   268.07   1910.93   1015.54       Asia  1945-08-17
BRA      Brazil   210.32   8515.77   2055.51  S.America  1822-09-07
PAK    Pakistan   205.71    881.91    302.14       Asia  1947-08-14
NGA     Nigeria   200.96    923.77    375.77     Africa  1960-10-01
BGD  Bangladesh   167.09    147.57    245.63       Asia  1971-03-26
RUS      Russia   146.79  17098.25   1530.75        NaN  1992-06-12
MEX      Mexico   126.58   1964.38   1158.23  N.America  1810-09-16
JPN       Japan   126.22    377.97   4872.42       Asia         NaN
DEU     Germany    83.02    357.11   3693.20     Europe         NaN
FRA      France    67.02    640.68   2582.49     Europe  1789-07-14
GBR          UK    66.44    242.50   2631.23     Europe         NaN
ITA       Italy    60.36    301.34   1943.84     Europe         NaN
ARG   Argentina    44.94   2780.40    637.49  S.America  1816-07-09
DZA     Algeria    43.38   2381.74    167.56     Africa  1962-07-05
CAN      Canada    37.59   9984.67   1647.12  N.America  1867-07-01
AUS   Australia    25.47   7692.02   1408.68    Oceania         NaN
KAZ  Kazakhstan    18.53   2724.90    159.41       Asia  1991-12-16
9 và
>>> df.to_excel('data.xlsx')
1 để đọc và viết các tệp CSV. Bạn cũng đã sử dụng các phương thức tương tự để đọc và viết các tệp Excel, JSON, HTML, SQL và Pickle. Các chức năng này rất thuận tiện và được sử dụng rộng rãi. Chúng cho phép bạn lưu hoặc tải dữ liệu của bạn trong một cuộc gọi chức năng hoặc phương thức.

Bạn cũng đã học cách tiết kiệm thời gian, bộ nhớ và không gian đĩa khi làm việc với các tệp dữ liệu lớn:

  • Nén hoặc giải nén các tệp or decompress files
  • Chọn các hàng và cột bạn muốn tải the rows and columns you want to load
  • Sử dụng các loại dữ liệu ít chính xác hơn less precise data types
  • Chia dữ liệu thành các khối và xử lý từng cái một data into chunks and process them one by one

Bạn đã thành thạo một bước quan trọng trong quá trình học máy và khoa học dữ liệu! Nếu bạn có bất kỳ câu hỏi hoặc nhận xét, sau đó xin vui lòng đặt chúng vào phần bình luận bên dưới.

Xem bây giờ hướng dẫn này có một khóa học video liên quan được tạo bởi nhóm Python thực sự. Xem cùng với hướng dẫn bằng văn bản để hiểu sâu hơn về sự hiểu biết của bạn: Đọc và viết các tập tin bằng gấu trúc This tutorial has a related video course created by the Real Python team. Watch it together with the written tutorial to deepen your understanding: Reading and Writing Files With Pandas

Làm thế nào để bạn đọc và viết tệp CSV bằng Python bằng gấu trúc?

Pandas: Cách đọc và ghi tệp..
Cài đặt gấu trúc ..
Chuẩn bị dữ liệu ..
Sử dụng các hàm pandas read_csv () và .to_csv (). Viết tệp CSV. ....
Sử dụng gấu trúc để viết và đọc các tệp excel. Viết một tệp excel. ....
Hiểu API PANDAS IO. Viết tập tin. ....
Làm việc với các loại tệp khác nhau. Tệp CSV. ....
Làm việc với dữ liệu lớn. ....
Conclusion..

Làm thế nào đọc và viết cho CSV Python?

2.1 Sử dụng CSV.Reader..
Nhập thư viện CSV. Nhập CSV ..
Mở tệp CSV. Phương thức .Open () trong Python được sử dụng để mở các tệp và trả về một đối tượng tệp. ....
Sử dụng đối tượng CSV.Reader để đọc tệp CSV.csvreader = csv.Reader (tệp).
Trích xuất tên trường.....
Trích xuất các hàng/hồ sơ.....
Đóng tệp ..

Làm cách nào để ghi vào tệp CSV trong Python?

Python viết tệp CSV..
Đầu tiên, hãy mở tệp CSV để ghi (chế độ W) bằng cách sử dụng hàm Open () ..
Thứ hai, tạo đối tượng người viết CSV bằng cách gọi hàm writer () của mô -đun CSV ..
Thứ ba, ghi dữ liệu vào tệp CSV bằng cách gọi phương thức Writerow () hoặc Writerows () của đối tượng người viết CSV ..

Làm thế nào để bạn đọc và viết tệp excel bằng python bằng gấu trúc?

Để làm điều đó, chúng tôi bắt đầu bằng cách nhập mô -đun Pandas.Sau đó, chúng tôi sử dụng phương thức read_excel của Pandas để đọc trong dữ liệu từ tệp Excel.Cách dễ nhất để gọi phương thức này là chuyển tên tệp.Nếu không có tên trang tính được chỉ định thì nó sẽ đọc bảng đầu tiên trong chỉ mục (như hiển thị bên dưới).