Bạn có biết cách sử dụng Microsoft Excel và muốn tìm hiểu cách phân tích dữ liệu với Python không? Bạn là người may mắn. Chúng tôi vừa xuất bản một khóa học trên kênh YouTube Freecodecamp.org sẽ dạy bạn cách phân tích dữ liệu với Python. Khóa học này sẽ đặc biệt hữu ích nếu bạn có kinh nghiệm với Excel, nhưng điều đó không bắt buộc. Frank Andrade đã phát triển khóa học này. Frank là một nhà khoa học dữ liệu và giáo viên xuất sắc. Trong khóa học này, bạn sẽ tìm hiểu cách tạo các bảng xoay, làm việc với dữ liệu và thực hiện trực quan hóa bằng cách sử dụng máy tính xách tay Python, Gandas và Jupyter. Dưới đây là tất cả các chủ đề bạn sẽ tìm hiểu trong khóa học này: Xem toàn bộ khóa học bên dưới hoặc trên kênh YouTube freecodecamp.org (đồng hồ 4 giờ). Học mã miễn phí. Chương trình giảng dạy nguồn mở của Freecodecamp đã giúp hơn 40.000 người có được việc làm với tư cách là nhà phát triển. Bắt đầu Trong hướng dẫn này, chúng tôi sẽ so sánh Excel và Python bằng cách xem xét cách thực hiện các nhiệm vụ phân tích cơ bản trên cả hai nền tảng. Excel là phần mềm phân tích dữ liệu được sử dụng phổ biến nhất trên thế giới. Tại sao? Nó rất dễ dàng để có được sự kiên định và khá mạnh mẽ khi bạn làm chủ nó. Ngược lại, danh tiếng của Python, là nó khó sử dụng hơn, mặc dù những gì bạn có thể làm với nó là một khi bạn đã học được điều đó gần như không giới hạn. Nhưng làm thế nào để hai công cụ phân tích dữ liệu này thực sự so sánh? Danh tiếng của họ don thực sự phản ánh thực tế. Trong hướng dẫn này, chúng tôi sẽ xem xét một số nhiệm vụ phân tích dữ liệu phổ biến để chứng minh cách phân tích dữ liệu Python có thể truy cập được như thế nào. Hướng dẫn này giả định rằng bạn có kiến thức cấp trung gian về Excel, bao gồm sử dụng các công thức và bảng trục. Chúng tôi sẽ sử dụng Python Library Pandas, được thiết kế tạo điều kiện phân tích dữ liệu bằng Python, nhưng bạn không cần bất kỳ kiến thức Python hoặc Pandas nào cho hướng dẫn này.pandas, which is designed facilitate data analysis in Python, but you don’t need any Python or pandas knowledge for this tutorial. Tại sao sử dụng Python vs Excel?Trước khi chúng tôi bắt đầu, bạn có thể tự hỏi tại sao Python thậm chí còn đáng để xem xét. Tại sao bạn không thể tiếp tục sử dụng Excel? Mặc dù Excel là tuyệt vời, có một số lĩnh vực làm cho một ngôn ngữ lập trình như Python tốt hơn cho một số loại phân tích dữ liệu nhất định. Dưới đây là một số lý do từ bài viết 9 lý do người dùng Excel nên xem xét việc học lập trình:
Để rõ ràng, chúng tôi không ủng hộ việc bỏ lại Excel - đó là một công cụ mạnh mẽ với nhiều công dụng! Nhưng là một người dùng Excel, việc cũng có thể tận dụng sức mạnh của Python có thể giúp bạn tiết kiệm hàng giờ và mở ra các cơ hội thăng tiến nghề nghiệp. Nó có giá trị ghi nhớ hai công cụ có thể hoạt động tốt song song và bạn có thể thấy rằng một số nhiệm vụ tốt nhất còn lại trong Excel, trong khi những công cụ khác sẽ được hưởng lợi từ sức mạnh, tính linh hoạt và tính minh bạch mà Python cung cấp. Nhập dữ liệu của chúng tôiHãy để bắt đầu bằng cách làm quen với dữ liệu mà chúng tôi sẽ làm việc cho hướng dẫn này. Chúng tôi sẽ sử dụng dữ liệu hư cấu về một công ty với nhân viên bán hàng. Ở đây, dữ liệu của chúng tôi trông như thế nào trong Excel: Dữ liệu của chúng tôi được lưu dưới dạng tệp CSV được gọi là Mã trên nhập gấu trúc và bí danh vào cú pháp Để đọc tệp của chúng tôi, chúng tôi sử dụng Ai đó thành thạo Excel không chỉ có khả năng thực hiện bước nhảy vọt để làm việc trong Python. Thêm các kỹ năng Python vào bộ kỹ năng của bạn sẽ giúp bạn trở thành một nhà phân tích nhanh hơn và mạnh mẽ hơn về lâu dài và bạn sẽ khám phá các quy trình công việc mới tận dụng cả Excel và Python để phân tích dữ liệu hiệu quả và mạnh mẽ hơn bạn có thể làm với Excel một mình . Nếu bạn muốn học cách phân tích dữ liệu trong Python, nhà phân tích dữ liệu của chúng tôi trong Python Path là thiết kế để dạy bạn mọi thứ bạn cần biết, ngay cả khi bạn chưa bao giờ mã hóa trước đây. Bạn sẽ bắt đầu với hai khóa học dạy cho bạn các nguyên tắc cơ bản của Python trước khi bạn chuyển sang học thư viện Pandas mà chúng tôi đã làm việc trong hướng dẫn này.
Trước khi chúng tôi tìm hiểu hoạt động của Pandas đầu tiên, chúng tôi sẽ nhanh chóng tìm hiểu một chút về cách lưu trữ dữ liệu của chúng tôi. Hãy để sử dụng chức năng Ai đó thành thạo Excel không chỉ có khả năng thực hiện bước nhảy vọt để làm việc trong Python. Thêm các kỹ năng Python vào bộ kỹ năng của bạn sẽ giúp bạn trở thành một nhà phân tích nhanh hơn và mạnh mẽ hơn về lâu dài và bạn sẽ khám phá các quy trình công việc mới tận dụng cả Excel và Python để phân tích dữ liệu hiệu quả và mạnh mẽ hơn bạn có thể làm với Excel một mình .DataFrame object, which is a specific type of object in pandas. Most of the time in pandas when we want to modify a dataframe, we’ll use special syntax called a dataframe method, which allows us to access specific functionality that relates to the dataframe objects. We’ll see an example of that in a moment when we complete our first task in pandas! Sắp xếp dữ liệuHãy cùng học cách sắp xếp dữ liệu của chúng tôi trong Excel và Python. Hiện tại, dữ liệu của chúng tôi không được sắp xếp. Trong Excel, nếu chúng tôi muốn sắp xếp dữ liệu của mình theo cột
Trong gấu trúc, chúng tôi sử dụng phương pháp Chúng tôi cung cấp tên cột cho phương thức để cho nó biết cột nào sẽ sắp xếp bằng cách: Các giá trị trong khung dữ liệu của chúng tôi đã được sắp xếp với một dòng mã Pandas đơn giản! Tóm tắt các giá trị bán hàngBa cột cuối cùng của dữ liệu của chúng tôi chứa các giá trị bán hàng trong ba tháng đầu năm, được gọi là quý đầu tiên. Nhiệm vụ tiếp theo của chúng tôi sẽ là tổng hợp các giá trị đó trong cả Excel và Python. Hãy bắt đầu bằng cách nhìn vào cách chúng ta đạt được điều này trong Excel:
Trong gấu trúc, khi chúng tôi thực hiện một thao tác, nó sẽ tự động áp dụng nó cho mỗi hàng cùng một lúc. Chúng tôi sẽ bắt đầu bằng cách chọn cột ba bằng cách sử dụng tên của họ trong danh sách: Tiếp theo, chúng tôi sẽ sử dụng phương thức Trong Pandas, công thức của người Viking mà chúng tôi đã sử dụng được lưu trữ. Thay vào đó, các giá trị kết quả được thêm trực tiếp vào DataFrame của chúng tôi. Nếu chúng tôi muốn thực hiện điều chỉnh các giá trị trong cột mới của chúng tôi, chúng tôi cần phải viết mã mới để thực hiện. Tham gia dữ liệu Trình quản lýTrong bảng tính của chúng tôi, chúng tôi cũng có một bảng dữ liệu nhỏ về ai quản lý từng đội: Hãy cùng xem xét cách tham gia dữ liệu này trong cột
Để làm việc với dữ liệu này trong gấu trúc, trước tiên chúng tôi sẽ cần nhập nó từ CSV thứ hai, Ai đó thành thạo Excel không chỉ có khả năng thực hiện bước nhảy vọt để làm việc trong Python. Thêm các kỹ năng Python vào bộ kỹ năng của bạn sẽ giúp bạn trở thành một nhà phân tích nhanh hơn và mạnh mẽ hơn về lâu dài và bạn sẽ khám phá các quy trình công việc mới tận dụng cả Excel và Python để phân tích dữ liệu hiệu quả và mạnh mẽ hơn bạn có thể làm với Excel một mình .
Nếu điều này có vẻ hơi khó hiểu lúc đầu, thì đó là OK. Mô hình tham gia dữ liệu trong Python khác với những gì được sử dụng trong Excel, nhưng nó cũng mạnh hơn rất nhiều. Lưu ý rằng trong Python, chúng tôi có thể chỉ định chính xác cách chúng tôi tham gia dữ liệu của chúng tôi bằng cách sử dụng tên Clear Cú pháp và cột. Thêm một cột có điều kiệnNếu chúng ta nhìn vào cột Bắt đầu với Excel, để thêm cột này, chúng tôi:
Trong gấu trúc, chúng tôi sử dụng hàm Bảng xoay vòngMột trong những tính năng Excel mạnh mẽ nhất là các bảng trục, tạo điều kiện phân tích dữ liệu bằng cách sử dụng tổng hợp. Chúng tôi sẽ xem xét hai ứng dụng bảng xoay khác nhau trong Excel và Python. Chúng tôi sẽ bắt đầu với một bảng trục trong Excel, tính số lượng nhân viên trong mỗi bộ phận: Hoạt động này - đếm số lần một giá trị xảy ra trong một cột - rất phổ biến đến mức trong gấu trúc, nó có cú pháp riêng: Loại sê -ri là mới trong hướng dẫn này, nhưng nó khá giống với một khung dữ liệu, mà chúng tôi đã tìm hiểu. Sê -ri chỉ là biểu diễn gấu trúc của một hàng hoặc cột. Hãy để sử dụng phương pháp PANDAS để tính toán số lượng nhân viên trong mỗi bộ phận: Ví dụ bảng trục thứ hai cũng tổng hợp theo bộ phận, nhưng thay vào đó tính toán doanh số Q1 trung bình: Để tính toán điều này trong gấu trúc, chúng tôi sẽ sử dụng phương pháp
Excel vs Python: Tóm tắtTrong hướng dẫn này, chúng tôi đã học được tương đương Python cho chức năng Excel sau:
Đối với mỗi ví dụ chúng tôi đã xem xét, cú pháp Pandas có độ phức tạp tương tự như các công thức hoặc tùy chọn menu bạn sẽ sử dụng trong Excel. Nhưng Python cung cấp một số lợi thế, giống như xử lý nhanh hơn nhiều bộ dữ liệu lớn, tùy chỉnh và phức tạp hơn và tính minh bạch hơn để kiểm tra và kiểm tra lỗi (vì mọi thứ bạn đã thực hiện rõ ràng đều được trình bày rõ ràng trong mã, thay vì ẩn trong các ô). Ai đó thành thạo Excel không chỉ có khả năng thực hiện bước nhảy vọt để làm việc trong Python. Thêm các kỹ năng Python vào bộ kỹ năng của bạn sẽ giúp bạn trở thành một nhà phân tích nhanh hơn và mạnh mẽ hơn về lâu dài và bạn sẽ khám phá các quy trình công việc mới tận dụng cả Excel và Python để phân tích dữ liệu hiệu quả và mạnh mẽ hơn bạn có thể làm với Excel một mình . Nếu bạn muốn học cách phân tích dữ liệu trong Python, nhà phân tích dữ liệu của chúng tôi trong Python Path là thiết kế để dạy bạn mọi thứ bạn cần biết, ngay cả khi bạn chưa bao giờ mã hóa trước đây. Bạn sẽ bắt đầu với hai khóa học dạy cho bạn các nguyên tắc cơ bản của Python trước khi bạn chuyển sang học thư viện Pandas mà chúng tôi đã làm việc trong hướng dẫn này. Học kỹ năng dữ liệuNhận mức tăng tiếp theo hoặc chuyển sang nghề nghiệp trong khoa học dữ liệu bằng cách học các kỹ năng dữ liệu. Đăng ký một tài khoản miễn phí và thử các khóa học tương tác của chúng tôi tại Python, R, SQL, v.v.free account and try our interactive courses in Python, R, SQL, and more! Bạn có thể sử dụng Python để phân tích dữ liệu Excel không?Để thoát khỏi vấn đề này, các nhà phát triển Python đã đưa ra cách đọc, viết, phân tích tất cả các loại định dạng tệp, bao gồm cả bảng tính. Hướng dẫn hôm nay sẽ chủ yếu dựa trên cách bạn có thể sử dụng ngôn ngữ lập trình Python và làm việc với Excel mà không cần trực tiếp sử dụng ứng dụng Microsoft Excel.Python developers came up with ways of reading, writing, analyzing all kinds of file formats, including spreadsheets. Today's tutorial will be mostly on how you can use the Python programming language and work with Excel without directly using the Microsoft Excel application.
Làm thế nào Python có thể được sử dụng trong phân tích dữ liệu?Dưới đây là một số lý do tại sao phân tích dữ liệu sử dụng Python đã trở nên phổ biến: Python rất dễ học và hiểu và có cú pháp đơn giản.Ngôn ngữ lập trình có thể mở rộng và linh hoạt.Nó có một bộ sưu tập lớn các thư viện để tính toán số và thao tác dữ liệu.Python is easy to learn and understand and has a simple syntax. The programming language is scalable and flexible. It has a vast collection of libraries for numerical computation and data manipulation.
Làm thế nào Python và Microsoft Excel có thể hỗ trợ phân tích dữ liệu?Python để phân tích dữ liệu Nó có thể dễ dàng thay thế các tác vụ trần tục bằng tự động hóa.Python cũng cung cấp hiệu quả và khả năng mở rộng cao hơn.Nó nhanh hơn Excel cho các đường ống dữ liệu, tự động hóa và tính toán các phương trình và thuật toán phức tạp.It can easily replace mundane tasks with automation. Python also offers greater efficiency and scalability. It's faster than Excel for data pipelines, automation and calculating complex equations and algorithms.
Bạn có thể tích hợp Python vào Excel không?Pyxll rất khác với các gói khác này.Thay vì chỉ cho phép bạn đọc và viết các tệp Excel, Pyxll tích hợp Python vào Excel.Điều này cho phép bạn chạy Python bên trong Excel để mở rộng khả năng của Excel với mã Python của riêng bạn!PyXLL integrates Python into Excel. This allows you to run Python inside of Excel to extend Excel's capabilities with your own Python code! |