Khoa học dữ liệu địa lý với cuốn sách python

Mục tiêu của cuốn sách là giúp các nhà khoa học dữ liệu và chuyên gia GIS tìm hiểu và triển khai Khoa học dữ liệu không gian địa lý với Python

Chúng ta sẽ tìm hiểu các thư viện GeoPython khác nhau. Chúng ta sẽ học cách đọc dữ liệu không gian một cách hiệu quả, thao tác và xử lý dữ liệu không gian cũng như thực hiện các thao tác không gian. Chúng ta cũng sẽ học trực quan hóa dữ liệu không gian

Chúng tôi cũng sẽ giới thiệu các trường hợp sử dụng khác nhau để giúp người đọc hiểu và hỗ trợ họ trong quá trình triển khai

Đến cuối cuốn sách, người đọc sẽ có thể phát triển các giải pháp khoa học dữ liệu không gian địa lý bằng Python

  • Hiểu các nguyên tắc cơ bản và phương pháp cần thiết để làm việc với dữ liệu không gian địa lý
  • Phát triển danh mục công việc giới thiệu bằng cách sử dụng cơ sở mã
  • Làm việc với dữ liệu không gian địa lý hoặc xử lý dữ liệu đó dưới dạng tập dữ liệu dạng bảng
  • Kỹ năng thực hành với các nghiên cứu điển hình liên quan đến khoa học dữ liệu không gian địa lý
  • Hiểu dữ liệu và cơ sở dữ liệu không gian địa lý và cách sử dụng hiệu quả
  • Các phương pháp hay nhất về sử dụng Dữ liệu không gian địa lý để kết nối với thế giới xung quanh bạn

Cuốn sách này được phát triển cho 1) các nhà khoa học dữ liệu đang tìm cách kết hợp phân tích không gian địa lý vào công việc của họ và 2) các chuyên gia về GIS đang tìm cách kết hợp các phương pháp khoa học dữ liệu vào công việc của họ. Người đọc sẽ cần có kiến ​​thức nền tảng về python để phân tích dữ liệu và/hoặc khoa học dữ liệu

Một số người thấy khóa học thú vị và muốn tìm hiểu thêm về cách sử dụng python để phân tích dữ liệu và cách tiếp tục tìm hiểu về Python cho Khoa học dữ liệu (địa lý). Phần này thu thập một vài tài liệu tham khảo để chỉ cho bạn theo hướng đó

Sách

Serge Rey, Dani Arribas-Bel và Levi Wolf hiện đang viết một cuốn sách mở về Khoa học dữ liệu địa lý bằng Python

Hai cuốn sách xuất sắc (miễn phí) sẽ giới thiệu cho bạn về Python và số liệu thống kê là

Có hai cuốn sách phổ biến giới thiệu tốt về cách sử dụng Python cho Khoa học dữ liệu

Lưu ý rằng đây là những phần giới thiệu về Khoa học dữ liệu và không nhất thiết phải có thành phần địa lý

Tài liệu tham khảo gói

Một số gói cốt lõi dành cho khoa học dữ liệu được viết bằng Python đã chuẩn bị các tài nguyên ấn tượng như một phần tài liệu của họ. Trong một số trường hợp, những tài liệu tham khảo này là một bản tóm tắt tuyệt vời không chỉ về chức năng của thư viện mà còn về các phương thức đằng sau chúng. Dưới đây là danh sách ngắn với một số danh sách phù hợp nhất

  • pandas (http://pandas.pydata.org/pandas-docs/stable/). tài liệu pandas chứa các hướng dẫn rất chi tiết về mọi chi tiết về cách thư viện được xây dựng và cách sử dụng thư viện trong nhiều ngữ cảnh khác nhau. Có thể không phải là cách tốt nhất để theo dõi từ đầu đến cuối, nhưng là nơi lý tưởng để hiểu cách thức hoạt động của các hoạt động phổ biến như nối bảng hoặc hoạt động theo nhóm
  • seaborn (http://seaborn.pydata.org/tutorial.html. trang hướng dẫn của nó chứa một tài khoản chi tiết về tất cả các chức năng được cung cấp để đáp ứng nhu cầu vẽ đồ thị của bạn mà không gặp khó khăn khi phải luôn truy cập matplotlib. Ngoài ra, nó bao gồm các hướng dẫn tuyệt vời cho các khái niệm liên quan đến các tác vụ trực quan hóa, từ cách chọn bảng màu phù hợp đến cách trực quan hóa dữ liệu phân loại
  • scikit-learn (http://scikit-learn.org/stable/) là cổng vào chính của thư viện máy học đẳng cấp thế giới. Ngoài phần mô tả chi tiết về chức năng, còn có một số hướng dẫn giới thiệu tuyệt vời về các phương pháp đằng sau công cụ này. scikit-learn kết hợp máy học hiện đại và được cập nhật liên tục, cùng với trang web của nó
  • statsmodels (http://pandas.pydata.org/pandas-docs/stable/0) là thư viện chính để lập mô hình thống kê trong Python. Nó không ngang tầm với những gì người ta có thể tìm thấy trong R, nhưng nó kết hợp một lượng lớn các kỹ thuật nền tảng, từ mô hình tuyến tính tổng quát đến mô hình phân cấp hoặc phân tích chuỗi thời gian. Trang web của thư viện chứa tài liệu tham khảo về chức năng và một số hướng dẫn hữu ích
  • http://pandas.pydata.org/pandas-docs/stable/1 (http://pandas.pydata.org/pandas-docs/stable/2) chứa một cửa hàng tổng hợp tốt nhất để học cách đọc, thao tác và chuyển đổi dữ liệu không gian trong Python. Bản thân thư viện là sự trừu tượng hóa của một số thư viện cấp thấp khác đóng vai trò như chất kết dính để làm việc với tất cả mọi thứ liền mạch nhất có thể. Trang web bao gồm các hướng dẫn về định dạng tệp, phép chiếu và hoạt động không gian, trong số các chủ đề khác
  • http://pandas.pydata.org/pandas-docs/stable/3 (http://pandas.pydata.org/pandas-docs/stable/4) là tài nguyên tốt nhất để khám phá chức năng trong Python để thực hiện phân tích không gian. Thư viện hiện đang được đại tu, điều đó có nghĩa là sẽ có nhiều gói liên quan hơn thông qua “thương hiệu” PySAL, vì vậy, trang web của thư viện đại diện cho cửa hàng tổng hợp tốt nhất để xem những gì có thể về mặt phân tích không gian trong Python
  • Ghi chú bài giảng scipy (_______15) ở cấp độ khá thấp, vì vậy có thể không dành cho người mới bắt đầu tuyệt đối, nhưng nếu bạn cần sử dụng Python để viết ứng dụng của riêng mình, đây có thể là nơi khởi đầu tuyệt vời

Video

Có một số tài nguyên trực tuyến để học Python, đến mức quá khó để biết bắt đầu từ đâu. Một trong những thứ hữu ích nhất là bản ghi của hội nghị SciPy về điện toán khoa học bằng Python, diễn ra vào tháng 7 hàng năm tại Austin (TX). Hội nghị bao gồm cả các bài thuyết trình ngắn về các gói và dự án mới cũng như hội thảo 4 giờ đi sâu vào chi tiết về chức năng chính trong ngăn xếp Python khoa học. Danh sách phát của phiên bản 2018 có sẵn tại

http://pandas.pydata.org/pandas-docs/stable/6

Và, trong bối cảnh Khoa học dữ liệu địa lý, hai hội thảo sau đây được đặc biệt quan tâm

http://pandas.pydata.org/pandas-docs/stable/7

http://pandas.pydata.org/pandas-docs/stable/8

Các khóa học trực tuyến

Ngoài các tài nguyên bị ngắt kết nối, bắt đầu xuất hiện các khóa học toàn diện về việc sử dụng Python cho Khoa học dữ liệu (Địa lý). Đây là một vài quan tâm

Cuốn sách nào tốt nhất để học khoa học dữ liệu bằng Python?

1. Python để phân tích dữ liệu . Đây là cuốn sách Python chuyên ngành đầu tiên về Phân tích dữ liệu và Khoa học dữ liệu. Cuốn sách Python này sẽ bao gồm tất cả những điều cơ bản mà Nhà khoa học dữ liệu hoặc kỹ sư dữ liệu nên biết, như tổng hợp dữ liệu và chuỗi thời gian.

R hay Python tốt hơn cho GIS?

Mặc dù R giỏi về trực quan hóa và phân tích thống kê, Python đặc biệt giỏi khi làm việc với các hệ thống tệp, mạng, quét web và tự động hóa . Đây là lý do tại sao Python là ngôn ngữ lập trình mặc định cho QGIS và ArcGIS, thay vì R.

GIS có hữu ích cho khoa học dữ liệu không?

GIS có thể là một công cụ mạnh mẽ dành cho các nhà khoa học dữ liệu , những người có thể sử dụng nó để phân tích và trực quan hóa dữ liệu theo nhiều cách khác nhau.

3 công cụ được sử dụng để thu thập dữ liệu địa lý là gì?

Phần cứng thu thập dữ liệu GIS có thể được chia thành ba loại cơ bản. máy số hóa, thiết bị GPS và thiết bị di động . Với nhiều khả năng và mức giá khác nhau, mỗi loại thiết bị đều có trường hợp sử dụng lý tưởng riêng.