Những người đồng sáng lập DataCamp, Jonathan Cornelissen và Martijn Theuwissen phân tích các xu hướng dữ liệu hàng đầu mà họ đang thấy trong không gian dữ liệu ngày nay, cũng như dự đoán của họ về tương lai của ngành dữ liệu Show
Deepanshu thành lập ListenData với một mục tiêu đơn giản - Làm cho các phân tích trở nên dễ hiểu và dễ theo dõi. Ông có hơn 10 năm kinh nghiệm trong lĩnh vực khoa học dữ liệu. Trong nhiệm kỳ của mình, ông đã làm việc với các khách hàng toàn cầu trong nhiều lĩnh vực khác nhau như Ngân hàng, Bảo hiểm, Cổ phần tư nhân, Viễn thông và Nhân sự Không phải lúc nào cũng có thể lấy tập dữ liệu ở định dạng CSV. Vì vậy, Pandas cung cấp cho chúng ta các chức năng để chuyển đổi bộ dữ liệu ở các định dạng khác sang Data frame. Một tệp excel có một ‘. định dạng xlsx. Trước khi bắt đầu, chúng ta cần cài đặt một số thư viện. pip install pandas pip install xlrd Để nhập tệp Excel vào Python bằng Pandas, chúng tôi phải sử dụng gấu trúc. hàm read_excel()
Giả sử tệp Excel trông như thế này Bây giờ, chúng ta có thể đi sâu vào mã. ví dụ 1. Đọc một tệp Excel Python3
đầu ra ví dụ 2. Để chọn một cột cụ thể, chúng ta có thể truyền tham số “index_col“. Python3
đầu ra ví dụ 3. Trong trường hợp bạn không thích tiêu đề ban đầu của các cột, bạn có thể thay đổi nó thành chỉ mục bằng cách sử dụng tham số “tiêu đề” Python3
đầu ra Ví dụ 4. Nếu bạn muốn thay đổi kiểu dữ liệu của một cột cụ thể, bạn có thể thực hiện bằng cách sử dụng tham số “dtype“ Python3
đầu ra Ví dụ 5. Trong trường hợp bạn có các giá trị không xác định, thì bạn có thể xử lý nó bằng tham số “na_values“. Nó sẽ chuyển đổi các giá trị chưa biết đã đề cập thành “NaN” Bạn có thể dễ dàng nhập tệp Excel vào Python bằng Pandas. Để hoàn thành mục tiêu này, bạn sẽ cần sử dụng read_excel import pandas as pd df = pd.read_excel(r'Path where the Excel file is stored\File name.xlsx') print(df) Lưu ý rằng đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls' Và nếu bạn có một trang tính Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng import pandas as pd df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name') print(df) Bây giờ hãy xem lại một ví dụ bao gồm dữ liệu được nhập vào Python Dữ liệu được nhập vào PythonGiả sử rằng bạn có bảng sau được lưu trữ trong Excel (trong đó tên tệp Excel là 'sản phẩm') product_namepricecomputer700tablet250printer120laptop1200keyboard100Sau đó, bạn có thể làm theo các bước bên dưới để nhập tệp Excel vào Python Các bước để nhập tệp Excel vào Python bằng PandasBước 1. Chụp đường dẫn tập tinTrước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn Ví dụ: giả sử tệp Excel được lưu trữ theo đường dẫn sau C. \Users\Ron\Desktop\ sản phẩm. xlsx Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn Đừng quên bao gồm tên tệp (trong ví dụ của chúng tôi, đó là ‘ products ‘ được đánh dấu bằng màu xanh lam). Bạn cũng cần bao gồm phần mở rộng tệp Excel (trong trường hợp của chúng tôi, đó là ‘ . xlsx ‘ như được đánh dấu bằng màu xanh lục). Bước 2. Áp dụng mã PythonĐây là mã Python cho ví dụ của chúng tôi import pandas as pd df = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx') print(df) Lưu ý rằng bạn nên đặt “r” trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\’. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + ‘. xlsx’ Bước 3. Chạy mã Python để nhập tệp ExcelChạy mã Python (được điều chỉnh theo đường dẫn của bạn) và bạn sẽ nhận được tập dữ liệu sau
Lưu ý rằng bạn đã nhận được kết quả giống như kết quả được lưu trữ trong tệp Excel Ghi chú. bạn sẽ phải cài đặt gói bổ sung nếu gặp lỗi sau khi chạy mã Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd' Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt openpyxl cho. tập tin xlsx pip install openpyxl Bước tùy chọn. Chọn tập hợp con của các cộtBây giờ nếu bạn muốn chọn một cột hoặc nhiều cột cụ thể từ tệp Excel thì sao? Ví dụ: nếu bạn chỉ muốn chọn cột product_name thì sao? import pandas as pd data = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx') df = pd.DataFrame(data, columns=['product_name']) print(df) Chạy mã (sau khi điều chỉnh đường dẫn tệp) và bạn sẽ chỉ nhận được cột product_name
Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của chúng bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột product_name và price, bạn có thể sử dụng cú pháp này ________số 8_______Bạn sẽ cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NaN Phần kết luậnBạn vừa xem cách nhập tệp Excel vào Python bằng Pandas Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp CSV vào Python bằng Pandas Bạn cũng có thể xem Tài liệu về Pandas để tìm hiểu thêm về các tùy chọn khác nhau mà bạn có thể áp dụng đối với read_excel Python có thể lấy dữ liệu từ Excel không?Người ta có thể truy xuất thông tin từ bảng tính . Việc đọc, viết hoặc sửa đổi dữ liệu có thể được thực hiện bằng Python có thể được thực hiện bằng các phương pháp khác nhau.
Làm cách nào để gửi dữ liệu từ Excel sang Python?Chuyển đổi CSV sang Excel bằng Python (bao gồm ví dụ) . Bước 1. Cài đặt gói Pandas. Nếu bạn chưa làm như vậy, hãy cài đặt gói Pandas. . Bước 2. Chụp đường dẫn lưu trữ tệp CSV. . Bước 3. Chỉ định đường dẫn nơi tệp Excel mới sẽ được lưu trữ. . Bước 4. Chuyển đổi CSV sang Excel bằng Python |