Hướng dẫn data analysis with pandas and python reddit - phân tích dữ liệu với gấu trúc và trăn reddit

Python linh hoạt hơn SQL nhưng có một số điểm tương đồng. Tôi sử dụng Python làm trình điều khiển hàng ngày của tôi. Pyspark là một cổng của Spark SQL, vì vậy có cùng loại chức năng vì vậy đó là hầu hết những gì tôi sử dụng. Sau đó, có một vài điều bạn có thể làm bổ sung với Python, Regexes, DateTime, v.v.PySpark is a port of Spark SQL so has the same kind of functionality so that's most of what I use. Then there's a few things you can do additionally with built-in python, regexes, datetime, etc

Tuy nhiên, tôi sử dụng pyspark với một nền tảng đám mây giúp sử dụng dễ dàng hơn. Bạn có thể sử dụng nó trong máy tính xách tay Jupyter, tuy nhiên bạn phải chuyển đổi nó thành một khung dữ liệu gấu trúc để xem nó và điều đó không hoạt động tốt. Ngoài ra, Pandas là một nơi tuyệt vời để bắt đầu. Bạn có thể có thể làm một số numpy trên đó.pandas is a great place to start. You can probably do some numpy on top of that.

Cho Vis, Matplotlib hoặc Seabornmatplotlib or seaborn

Python ưa thích cho các báo cáo giao dịch, SQL cho các báo cáo mô tả/chọn

Tôi sử dụng tất cả chúng, thực sự chỉ phụ thuộc vào tình huống

Python, không nghi ngờ gì về nó. Tôi chỉ sử dụng SQL nếu tôi hoàn toàn cần phải không bao giờ.

Những loại công việc tập trung vào dữ liệu mà không cần sử dụng SQL?

Đối với cá nhân tôi, tôi chưa bao giờ có bất kỳ công việc nào yêu cầu Python cụ thể. Hầu hết các công việc của tôi, tôi truy vấn dữ liệu mà tôi cần từ kho dữ liệu và tải nó vào các công cụ BI. Tất cả các phân tích mà tôi cần tôi làm điều đó trong công cụ

Tôi thoải mái hơn với SQL. Bởi vì tôi đã sử dụng SQL trong một thời gian dài.However, something tells me that I should learn how to programmatically explore the data (use df.head() to get a quick glimpse and .unique() and isnull() to explore the data, plotting the data using matplotlib, etc.) I feel like excel is useful to get a good birds-eye-view of the data. Which approach should be used in practice/industry?

Nó là phổ biến để sử dụng cả hai. Được sử dụng để sử dụng SQL để làm sạch truy xuất/dữ liệu và sau đó sử dụng SAS cho các phân tích. Bây giờ tôi đã chuyển sang Python để phân tích.

Nhấn J để nhảy vào nguồn cấp dữ liệu. Nhấn dấu câu hỏi để tìm hiểu phần còn lại của các phím tắt

Tìm thấy Internet!

Tham gia Reddit

Tạo một tài khoản để theo dõi các cộng đồng yêu thích của bạn và bắt đầu tham gia vào các cuộc trò chuyện.

Tạo một tài khoản

Hướng dẫn data analysis with pandas and python reddit - phân tích dữ liệu với gấu trúc và trăn reddit

Những loại công việc tập trung vào dữ liệu mà không cần sử dụng SQL?

EDIT:

Đối với cá nhân tôi, tôi chưa bao giờ có bất kỳ công việc nào yêu cầu Python cụ thể. Hầu hết các công việc của tôi, tôi truy vấn dữ liệu mà tôi cần từ kho dữ liệu và tải nó vào các công cụ BI. Tất cả các phân tích mà tôi cần tôi làm điều đó trong công cụ

Hướng dẫn data analysis with pandas and python reddit - phân tích dữ liệu với gấu trúc và trăn reddit

cấp độ 1

Tôi thoải mái hơn với SQL. Bởi vì tôi đã sử dụng SQL trong một thời gian dài.

Nó là phổ biến để sử dụng cả hai. Được sử dụng để sử dụng SQL để làm sạch truy xuất/dữ liệu và sau đó sử dụng SAS cho các phân tích. Bây giờ tôi đã chuyển sang Python để phân tích.

Khi bạn gặp phải những hạn chế về những gì bạn có thể đạt được với SQL thì hãy chọn một ngôn ngữ toàn diện như Python/Pandas.

Python ưa thích cho các báo cáo giao dịch, SQL cho các báo cáo mô tả/chọn

Khi bạn gặp phải những hạn chế về những gì bạn có thể đạt được với SQL thì hãy chọn một ngôn ngữ toàn diện như Python/Pandas.

Python ưa thích cho các báo cáo giao dịch, SQL cho các báo cáo mô tả/chọn

Tôi sử dụng tất cả chúng, thực sự chỉ phụ thuộc vào tình huống

Khi bạn gặp phải những hạn chế về những gì bạn có thể đạt được với SQL thì hãy chọn một ngôn ngữ toàn diện như Python/Pandas.

Python ưa thích cho các báo cáo giao dịch, SQL cho các báo cáo mô tả/chọn

cấp độ 1

Tôi sử dụng tất cả chúng, thực sự chỉ phụ thuộc vào tình huống

Khi bạn gặp phải những hạn chế về những gì bạn có thể đạt được với SQL thì hãy chọn một ngôn ngữ toàn diện như Python/Pandas.

Python ưa thích cho các báo cáo giao dịch, SQL cho các báo cáo mô tả/chọn

Tôi sử dụng tất cả chúng, thực sự chỉ phụ thuộc vào tình huống

cấp độ 1

Python, không nghi ngờ gì về nó. Tôi chỉ sử dụng SQL nếu tôi hoàn toàn cần phải không bao giờ.

cấp độ 1

SQL.

cấp độ 2

Những loại công việc tập trung vào dữ liệu mà không cần sử dụng SQL?

cấp độ 1

Đối với cá nhân tôi, tôi chưa bao giờ có bất kỳ công việc nào yêu cầu Python cụ thể. Hầu hết các công việc của tôi, tôi truy vấn dữ liệu mà tôi cần từ kho dữ liệu và tải nó vào các công cụ BI. Tất cả các phân tích mà tôi cần tôi làm điều đó trong công cụ

Tôi thoải mái hơn với SQL. Bởi vì tôi đã sử dụng SQL trong một thời gian dài.

cấp độ 1

Nó là phổ biến để sử dụng cả hai. Được sử dụng để sử dụng SQL để làm sạch truy xuất/dữ liệu và sau đó sử dụng SAS cho các phân tích. Bây giờ tôi đã chuyển sang Python để phân tích.

cấp độ 1

Vũ khí của bạn lựa chọn là gì

cấp độ 2

Amén. Bất cứ khi nào bạn có thể đẩy công việc vào máy chủ bằng cách sử dụng SQL, bạn sẽ tiết kiệm thời gian.

cấp độ 1

SQL: Truy vấn, tham gia nhiều bảng, tập hợp, lọc cơ bản và các câu lệnh IF/ELSE. Gấu trúc: Các quy tắc kinh doanh phức tạp hơn, tính toán logic và/hoặc số phức tạp hơn

cấp độ 1

SQL: Truy vấn, tham gia nhiều bảng, tập hợp, lọc cơ bản và các câu lệnh IF/ELSE. Gấu trúc: Các quy tắc kinh doanh phức tạp hơn, tính toán logic và/hoặc số phức tạp hơn

Tôi cũng sẽ nói cả hai nhưng theo một nghĩa khác - bạn có thể sử dụng chúng bên cạnh nhau hoặc hoàn toàn tách biệt cho những thứ khác nhau, nhưng với tôi sức mạnh thực sự là nơi bạn pha trộn chúng. Bạn có thể làm một cái gì đó như đọc một tệp .sql lớn có nhiều câu lệnh vào danh sách python bằng cách chia chúng theo; và sau đó thực hiện từng câu đối với một đầu nối PYODBC. Điều này cung cấp cho bạn chức năng của việc có thể tự động chèn các biến do Python tạo vào mã SQL của bạn.

Để cung cấp cho bạn một ví dụ - tệp .sql của bạn có thể có một cái gì đó như "Chọn {} từ {}. {} Trong đó {}" mà sau đó bạn có thể chuyển vào một con trỏ.execute (query.format ()) nghĩa đen là bất kỳ biến nào mà bạn muốn. Loại công cụ này làm cho truy vấn động và sử dụng mã lặp lại một giấc mơ tuyệt đối.

cấp độ 1

SQL: Truy vấn, tham gia nhiều bảng, tập hợp, lọc cơ bản và các câu lệnh IF/ELSE. Gấu trúc: Các quy tắc kinh doanh phức tạp hơn, tính toán logic và/hoặc số phức tạp hơn

Tôi cũng sẽ nói cả hai nhưng theo một nghĩa khác - bạn có thể sử dụng chúng bên cạnh nhau hoặc hoàn toàn tách biệt cho những thứ khác nhau, nhưng với tôi sức mạnh thực sự là nơi bạn pha trộn chúng. Bạn có thể làm một cái gì đó như đọc một tệp .sql lớn có nhiều câu lệnh vào danh sách python bằng cách chia chúng theo; và sau đó thực hiện từng câu đối với một đầu nối PYODBC. Điều này cung cấp cho bạn chức năng của việc có thể tự động chèn các biến do Python tạo vào mã SQL của bạn.

cấp độ 1

SQL: Truy vấn, tham gia nhiều bảng, tập hợp, lọc cơ bản và các câu lệnh IF/ELSE. Gấu trúc: Các quy tắc kinh doanh phức tạp hơn, tính toán logic và/hoặc số phức tạp hơn

cấp độ 1

SQL: Truy vấn, tham gia nhiều bảng, tập hợp, lọc cơ bản và các câu lệnh IF/ELSE. Gấu trúc: Các quy tắc kinh doanh phức tạp hơn, tính toán logic và/hoặc số phức tạp hơn

cấp độ 1

SQL: Truy vấn, tham gia nhiều bảng, tập hợp, lọc cơ bản và các câu lệnh IF/ELSE. Gấu trúc: Các quy tắc kinh doanh phức tạp hơn, tính toán logic và/hoặc số phức tạp hơn

cấp độ 2

Tôi cũng sẽ nói cả hai nhưng theo một nghĩa khác - bạn có thể sử dụng chúng bên cạnh nhau hoặc hoàn toàn tách biệt cho những thứ khác nhau, nhưng với tôi sức mạnh thực sự là nơi bạn pha trộn chúng. Bạn có thể làm một cái gì đó như đọc một tệp .sql lớn có nhiều câu lệnh vào danh sách python bằng cách chia chúng theo; và sau đó thực hiện từng câu đối với một đầu nối PYODBC. Điều này cung cấp cho bạn chức năng của việc có thể tự động chèn các biến do Python tạo vào mã SQL của bạn.

cấp độ 1

SQL: Truy vấn, tham gia nhiều bảng, tập hợp, lọc cơ bản và các câu lệnh IF/ELSE. Gấu trúc: Các quy tắc kinh doanh phức tạp hơn, tính toán logic và/hoặc số phức tạp hơn

cấp độ 1

SQL: Truy vấn, tham gia nhiều bảng, tập hợp, lọc cơ bản và các câu lệnh IF/ELSE. Gấu trúc: Các quy tắc kinh doanh phức tạp hơn, tính toán logic và/hoặc số phức tạp hơn

Tôi cũng sẽ nói cả hai nhưng theo một nghĩa khác - bạn có thể sử dụng chúng bên cạnh nhau hoặc hoàn toàn tách biệt cho những thứ khác nhau, nhưng với tôi sức mạnh thực sự là nơi bạn pha trộn chúng. Bạn có thể làm một cái gì đó như đọc một tệp .sql lớn có nhiều câu lệnh vào danh sách python bằng cách chia chúng theo; và sau đó thực hiện từng câu đối với một đầu nối PYODBC. Điều này cung cấp cho bạn chức năng của việc có thể tự động chèn các biến do Python tạo vào mã SQL của bạn.