Hướng dẫn dùng pandas dates python

Trụ sở chính:

Văn phòng: Số 27-3RD, Sunrise D, The Manor Central Park, đường Nguyễn Xiển, phường Đại Kim, quận Hoàng Mai, TP. Hà Nội.

Liên hệ truyền thông: 0929.536.185

Email: [email protected]

Chịu trách nhiệm nội dung: Ông Trần Anh Tú

TEK4.VN giữ bản quyền nội dung trên website này. Cấm sao chép dưới mọi hình thức nếu không có sự chấp thuận bằng văn bản.

Pandas to_datetime () phương thức giúp chúng ta chuyển đổi chuỗi Ngày giờ thành đối tượng Ngày giờ trong Python để các hoạt động có thể được thực hiện mà không gặp bất kỳ sự cố nào. Pandas to_datetime () rất hữu ích nếu chúng ta đang làm việc trên các tập dữ liệu có liên quan đến yếu tố thời gian.

Nội dung chính

  • Thông số
  • Giá trị trả lại
  • Chương trình ví dụ trên Pandas to_datetime ()
  • Chuỗi gấu trúc to_dataframe ()Pandas DataFrame head ()Gấu trúc độc nhất vô nhị ()Pandas DataFrame description ()Pandas ExcelWriter ()

Khi chúng tôi làm việc trên các tập dữ liệu như vậy, thời gian thường được đề cập đến dưới dạng một Chuỗi. Vì vậy, để thực hiện các hoạt động thời gian như tính toán chênh lệch thời gian là không thể trên chuỗi. Vì vậy, nó trở nên cần thiết để chuyển đổi kiểu chuỗi thành định dạng ngày và kiểu.

  • Cú pháp
  • Thông số
  • Giá trị trả lại
  • Chương trình ví dụ trên Pandas to_datetime ()
    • Đầu ra

Cú pháp

pandas.to_datetime(arg, errors=’raise’,dayfirst=False, yearfirst=False, utc=None, box=True, 
format=None, exact=True, unit=None, infer_datetime_format=False, origin=’unix’, cache=False)

Thông số

Hàm to_datetime () có các tham số sau.

  1. tranh luận: Nó thường là một int, float, string, datetime, list, tuple, 1D array, Series. Nó là đối tượng được chuyển đổi thành ngày giờ.
  2. sai sót: Nó có thể có 3 giá trị thứ nhất là ‘bỏ qua’ thứ 2 là ‘nâng cao’ thứ 3 là ‘ép buộc’. Theo mặc định, giá trị của nó là ‘tăng. Nếu giá trị của tham số này được đặt thành ‘bỏ qua’ thì quá trình phân tích cú pháp không hợp lệ sẽ trả về đầu vào. Nếu ‘nuôi‘, khi đó phân tích cú pháp không hợp lệ sẽ nâng cao ngoại lệ. Nếu ‘ép buộc‘thì phân tích cú pháp không hợp lệ sẽ được đặt thành NaT.
  3. ngày đầu tiên: Nó chấp nhận một giá trị Boolean; nó đặt ngày đầu tiên nếu giá trị của tham số này là thật.
  4. đầu năm: Nó đồng ý với một giá trị Boolean; nó đặt năm đầu tiên nếu giá trị của tham số này là thật.
  5. UTC: Nó cũng là một giá trị Boolean, nó trả về thời gian ở định dạng UTC nếu giá trị được đặt thành thật.
  6. định dạng: Đây là một đầu vào chuỗi cho biết vị trí của ngày, tháng và năm.
  7. chính xác: Đây cũng là giá trị Boolean nếu true yêu cầu khớp định dạng chính xác, nếu không thì cho phép định dạng khớp với bất kỳ vị trí nào trong chuỗi đích.
  8. đơn vị: Là một chuỗi với các đối số đơn vị (D, s, ms, us, ns) biểu thị đơn vị, là số nguyên hoặc số thực. Theo mặc định, nó là ‘ns’.
  9. inv_datetime_format: Đây là giá trị boolean nếu nó là true và không có định dạng dữ liệu nào được đưa ra; nó cố gắng suy ra định dạng của chuỗi ngày giờ.
  10. Nguồn gốc: Nó được sử dụng để xác định ngày tham chiếu.
  11. bộ nhớ đệm: Nó là một giá trị Boolean; nếu nó là thậtnó sử dụng một bộ nhớ cache các ngày đã chuyển đổi, duy nhất để áp dụng các chuyển đổi theo ngày giờ.

Giá trị trả lại

Nếu quá trình phân tích cú pháp thành công. Loại trả lại phụ thuộc vào đầu vào:

  1. danh sáchgiống: DatetimeIndex
  2. Loạt: Chuỗi loại datetime64
  3. Vô hướng: Dấu thời gian

Về cơ bản, nó trả về ngày giờ loạt đối tượng.

Chương trình ví dụ trên Pandas to_datetime ()

Viết chương trình để hiển thị hoạt động của to_datetime ().

import pandas as pd

data = pd.DataFrame({'year': [2015, 2016, 2017, 2018, 2019, 2020],
                     'month': [2, 3, 4, 5, 6, 7],
                     'day': [4, 5, 6, 7, 8, 9]})
print(data)
print("nn")

x = pd.to_datetime(data)
print(x)

Đầu ra

year  month  day
0  2015      2    4
1  2016      3    5
2  2017      4    6
3  2018      5    7
4  2019      6    8
5  2020      7    9


0   2015-02-04
1   2016-03-05
2   2017-04-06
3   2018-05-07
4   2019-06-08
5   2020-07-09
dtype: datetime64[ns]

Ở đây trong ví dụ trên, chúng ta có thể thấy rằng chúng ta đã tạo một DataFrame bằng cách sử dụng gấu trúc, có các giá trị là năm, tháng và ngày. Sau đó, chúng tôi đã sử dụng hàm to_datetime () để chuyển đổi nó ở định dạng ngày tháng, sau đó chúng tôi lưu trữ nó trong một DataFrame khác và cuối cùng in DataFrame mong muốn.

Nếu ngày không đáp ứng giới hạn dấu thời gianđi qua lỗi = ‘bỏ qua’ sẽ trả về một đầu vào ban đầu thay vì đưa ra một ngoại lệ.

Vượt qua lỗi = ‘coerce’ sẽ buộc ngày vượt quá giới hạn NaTngoài việc buộc những ngày không phải ngày tháng (hoặc những ngày không thể phân tích cú pháp) phải NaT.

Chuỗi gấu trúc to_dataframe ()Pandas DataFrame head ()Gấu trúc độc nhất vô nhị ()Pandas DataFrame description ()Pandas ExcelWriter ()