Đọc tệp được phân tách bằng dấu cách trong python pandas

Cách dễ nhất để chuyển đổi tệp được phân tách bằng dấu cách thành tệp giá trị được phân tách bằng dấu phẩy (CSV) là sử dụng ba dòng mã sau

  1. 0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    1
  2. 0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    2
  3. 0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    3

Tiếp theo, chúng tôi sẽ giải thích chi tiết hơn về phương pháp này và các phương pháp khác—hãy cuộn xuống Phương pháp 3 để biết phương pháp chính xác này

Xây dựng vấn đề

Đưa ra một tệp được phân cách bằng dấu cách có một hoặc nhiều khoảng trống giữa hai giá trị trong một cột nhất định

Đầu vào.

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
4

Alice DataScience $100000
Bob Programmer $90000
Carl Manager $122000
Dave Freelancer $144000

Làm cách nào để chuyển đổi các giá trị được phân tách bằng dấu cách thành tệp giá trị được phân tách bằng dấu phẩy (CSV)?

đầu ra.

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
5

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000

Chúng tôi cũng sẽ xem xét các biến thể nhỏ của vấn đề này. Đi nào

Phương pháp 1. Chuỗi thay thế khoảng trắng đơn

Cách đơn giản nhất để chuyển đổi tệp được phân tách bằng dấu cách thành tệp được phân tách bằng dấu phẩy (CSV) trong Python là thay thế từng khoảng trống

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
6 bằng ký tự dấu phẩy
0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
7 bằng phương pháp
0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
8. Điều này hoạt động nếu hai giá trị được phân tách bằng chính xác một khoảng trống

Đây là một tệp đầu vào ví dụ

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
4

Alice DataScience $100000
Bob Programmer $90000
Carl Manager $122000
Dave Freelancer $144000

Dưới đây là ví dụ về một số mã để chuyển đổi tệp được phân tách bằng dấu cách thành tệp CSV

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
2

Tệp đầu ra

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
5

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
4

Nếu bạn có bất kỳ nghi ngờ nào, vui lòng đi sâu vào các hướng dẫn liên quan của chúng tôi

  • Phương thức thay thế chuỗi Python
  • Hàm
    Alice DataScience $100000
    Bob Programmer $90000
    Carl Manager $122000
    Dave Freelancer $144000
    1 của Python
  • Python
    Alice DataScience $100000
    Bob Programmer $90000
    Carl Manager $122000
    Dave Freelancer $144000
    2 vào tệp
  • Hàm
    Alice DataScience $100000
    Bob Programmer $90000
    Carl Manager $122000
    Dave Freelancer $144000
    2 của Python
  • Trình quản lý bối cảnh Python

Phương pháp 2. Regex Thay thế khoảng trắng tùy ý

Để thay thế một hoặc nhiều khoảng trống giữa hai giá trị cột bằng dấu phẩy

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
7 và lấy CSV, hãy sử dụng thao tác biểu thức chính quy
Alice DataScience $100000
Bob Programmer $90000
Carl Manager $122000
Dave Freelancer $144000
5 trên dấu cách
Alice DataScience $100000
Bob Programmer $90000
Carl Manager $122000
Dave Freelancer $144000
6. Nếu bạn cũng cần thay thế các ký tự dạng bảng, hãy sử dụng
Alice DataScience $100000
Bob Programmer $90000
Carl Manager $122000
Dave Freelancer $144000
7 để thay thế

Nếu bạn có bất kỳ nghi ngờ nào, vui lòng đi sâu vào các hướng dẫn liên quan của chúng tôi

  • Python Regex
    Alice DataScience $100000
    Bob Programmer $90000
    Carl Manager $122000
    Dave Freelancer $144000
    8
  • Python Regex
    Alice DataScience $100000
    Bob Programmer $90000
    Carl Manager $122000
    Dave Freelancer $144000
    9 Lớp ký tự
  • Bộ định lượng Python Regex
    0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    20
  • Siêu năng lực Regex của Python

Đây là một ví dụ về tệp đầu vào

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
4, lưu ý các khoảng trắng bổ sung có thể phân tách hai giá trị cột

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
6

Dưới đây là ví dụ về một số mã để chuyển đổi tệp được phân tách bằng dấu cách thành tệp CSV

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
7

Tệp đầu ra

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
5

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
4

Phương pháp 3. Pandas read_csv() và to_csv()

Để chuyển đổi tệp được phân tách bằng dấu cách thành CSV, trước tiên hãy đọc tệp đó vào Khung dữ liệu Pandas bằng cách sử dụng

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
23, sau đó ghi Khung dữ liệu vào tệp bằng cách sử dụng
0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
24

Đây là một tệp đầu vào ví dụ

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
4

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
6

Dưới đây là ví dụ về một số mã để chuyển đổi tệp được phân tách bằng dấu cách thành tệp CSV

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
4

Tệp đầu ra

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000
5

0,Alice,DataScience,$100000
1,Bob,Programmer,$90000
2,Carl,Manager,$122000
3,Dave,Freelancer,$144000

Nếu bạn có bất kỳ nghi ngờ nào, vui lòng đi sâu vào các hướng dẫn liên quan của chúng tôi

  • Gấu trúc
    0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    27
  • Gấu trúc
    0,Alice,DataScience,$100000
    1,Bob,Programmer,$90000
    2,Carl,Manager,$122000
    3,Dave,Freelancer,$144000
    28

Tóm lược

Chúng tôi đã kiểm tra ba cách tuyệt vời để chuyển đổi tệp CSV được phân cách bằng dấu cách thành tệp CSV được phân tách bằng dấu phẩy

Cảm ơn đã dành thời gian để đọc bài viết này, bạn của tôi. 🐍💛


Regex hài hước

Đọc tệp được phân tách bằng dấu cách trong python pandas
Đợi đã, quên thoát khỏi một không gian. Weeeeee[taptaptap]eeeeee. (nguồn)

Đọc tệp được phân tách bằng dấu cách trong python pandas

Chris

Trong khi làm việc với tư cách là một nhà nghiên cứu trong các hệ thống phân tán, Dr. Christian Mayer tìm thấy tình yêu của mình với việc dạy sinh viên khoa học máy tính

Để giúp sinh viên đạt được mức độ thành công Python cao hơn, anh ấy đã thành lập trang web giáo dục lập trình Finxter. com. Ông là tác giả của cuốn sách lập trình nổi tiếng Python One-Liners (NoStarch 2020), đồng tác giả của loạt sách tự xuất bản Coffee Break Python, người đam mê khoa học máy tính, cộng tác viên tự do và chủ sở hữu của một trong 10 blog Python lớn nhất thế giới

Niềm đam mê của anh ấy là viết, đọc và mã hóa. Nhưng niềm đam mê lớn nhất của anh ấy là phục vụ các lập trình viên đầy tham vọng thông qua Finxter và giúp họ nâng cao kỹ năng của mình. Bạn có thể tham gia học viện email miễn phí của anh ấy tại đây

Làm cách nào để đọc tệp được phân tách bằng dấu cách trong gấu trúc Python?

Phương pháp 1. Sử dụng read_csv() . Cùng với tệp văn bản, chúng tôi cũng chuyển dấu phân cách dưới dạng một dấu cách (' ') cho ký tự khoảng trắng vì đối với tệp văn bản, ký tự khoảng trắng sẽ phân tách từng trường.

Làm thế nào để đọc csv với pandas không gian?

Xử lý khoảng trắng thừa khi đọc CSV trong Pandas .
Xem lại lý do tại sao chúng tôi quan tâm đến khoảng trắng trong CSV
Thiết lập điểm chuẩn bằng phương thức read_csv() của Pandas
Khám phá tham số skipinitialspace
Hãy thử dấu tách regex
Bỏ dấu tách regex do vấn đề về dấu ngoặc kép
Áp dụng regex trên dataFrame đã tải
kiểm tra str

S+ trong gấu trúc là gì?

Tham số sepstr, mặc định 's+' Một chuỗi hoặc dấu phân cách biểu thức chính quy . Mặc định của 's+' biểu thị một hoặc nhiều ký tự khoảng trắng.

Làm cách nào để đọc tệp csv không có tiêu đề trong gấu trúc?

Để đọc tệp CSV không có tiêu đề, hãy sử dụng tham số tiêu đề và đặt thành “Không” trong phương thức read_csv() .