Hướng dẫn is it easy to learn machine learning with python? - Học máy học với python có dễ không?

Hướng dẫn is it easy to learn machine learning with python? - Học máy học với python có dễ không?

Hình ảnh của biên tập viên

Giới thiệu

Bạn đang cố gắng dạy bản thân học máy từ đầu, nhưng aren chắc chắn để bắt đầu từ đâu? Hoặc có thể bạn đã tham gia một hoặc hai khóa học trực tuyến, nhưng đã đạt được một rào cản trong hành trình học tập của bạn và không biết cách tiến hành.

Tôi đã ở một vị trí tương tự chỉ hai năm trước. Tôi đã chi hơn 25 nghìn đô la phí đại học, nhưng vẫn thiếu kinh nghiệm và không chuẩn bị cho thị trường việc làm.

Phải mất rất nhiều thử nghiệm và lỗi cho tôi để đưa ra một lộ trình học máy. Tôi đã xem các khóa học trực tuyến, video YouTube và tải xuống vô số sách điện tử. Kiến thức tôi có được trực tuyến đã vượt qua mọi thứ tôi học được ở trường đại học. Và phần tốt nhất - nó đến với một phần nhỏ của chi phí!

Trong bài viết này, tôi sẽ cố gắng ngưng tụ tất cả các tài nguyên mà tôi đã sử dụng trong nhiều năm thành 7 bước mà bạn có thể làm theo để dạy cho mình học máy. & NBSP;

Bước 1: Tìm hiểu lập trình cho học máy

Bạn cần có kiến ​​thức làm việc về lập trình trước khi bạn đi sâu vào học máy. Hầu hết các nhà khoa học dữ liệu sử dụng Python hoặc R để xây dựng các mô hình ML. & NBSP;

Tôi bắt đầu với Python, vì đây là ngôn ngữ lập trình mục đích chung và có nhu cầu cao hơn R. & NBSP;

Kỹ năng Python cũng có thể chuyển sang các lĩnh vực khác nhau, vì vậy sẽ dễ dàng thực hiện quá trình chuyển đổi nếu bạn phân nhánh thành các lĩnh vực như phát triển web hoặc phân tích dữ liệu trong tương lai.

Khóa học Python Bootcamp hoàn chỉnh năm 2022 của Jose Portilla là một giới thiệu tuyệt vời về Python nếu bạn chưa quen với lập trình. Khóa học này là trên UDEMY, và họ thường cung cấp các chương trình khuyến mãi có thể đưa giá khóa học xuống mức thấp nhất là $ 10. Đó là một ý tưởng tốt để chờ một trong những chương trình khuyến mãi này trước khi mua hàng.

Một lợi thế khác của việc tham gia khóa học này là nó hoàn toàn được dạy bằng cách sử dụng máy tính xách tay Jupyter. Đây là Python IDE phổ biến nhất được sử dụng bởi các nhà khoa học dữ liệu và Jose sẽ làm quen với bạn với giao diện để bạn không cần phải dành thời gian để tự mình học nó.

Tuy nhiên, nếu bạn thích các lựa chọn thay thế miễn phí cho khóa học trên, thì đây là những gì tôi đề xuất:

  • Hướng dẫn Notebook Jupyter: Giới thiệu, thiết lập và hướng dẫn - Khóa học này sẽ giúp bạn làm quen với giao diện Jupyter.
  • Tìm hiểu Python: Khóa học đầy đủ cho người mới bắt đầu [Hướng dẫn] - Khóa học này sẽ đưa bạn đi qua những điều cơ bản của lập trình Python, chẳng hạn như các biến, loại dữ liệu, chức năng, câu lệnh có điều kiện và vòng lặp. Nó được dạy bằng cách sử dụng pycharm IDE, nhưng bạn có thể sử dụng máy tính xách tay Jupyter.
  • Python cho tất cả mọi người-đây là một cuốn sách điện tử mà bạn có thể tải xuống miễn phí. Cuốn sách này không giống như bất kỳ hướng dẫn Python nào khác mà bạn tìm thấy trực tuyến. Nó giới thiệu cho bạn các khái niệm lập trình thông qua lăng kính giải quyết các vấn đề dữ liệu, điều này làm cho nó trở thành một lý tưởng đọc cho những người khao khát khoa học dữ liệu.

Khi bạn đã nắm bắt được những điều cơ bản của Python, hãy bắt đầu áp dụng các khái niệm này để giải quyết các vấn đề. Tôi chưa bao giờ học cách viết mã đúng mặc dù hoàn thành bằng đại học 3 năm về khoa học máy tính, và điều đó vì tôi không bao giờ áp dụng các khái niệm mà tôi đã học được về các vấn đề thực tế.

Do đó, tôi đã có một sự hiểu biết về lý thuyết về cách viết mã, nhưng thiếu khả năng phá vỡ một vấn đề và mã hóa một giải pháp.

Một công cụ giúp cải thiện kỹ năng giải quyết vấn đề của tôi là Hackerrank. Hackerrank là một nền tảng cung cấp cho người dùng một loạt các thách thức lập trình với các mức độ khó khác nhau. Hãy thử giải quyết ít nhất 2 vấn đề HackerRank mỗi ngày. Bắt đầu với những người dễ nhất, và sau đó tăng mức độ khó khi bạn tiếp tục.

Nếu bạn đã từng gặp khó khăn trong một vấn đề, bạn luôn có thể đề cập đến một người khác giải pháp để hiểu cách họ giải quyết nó. Sau đó, hãy thử sao chép quá trình suy nghĩ của họ bằng mã của riêng bạn. & NBSP;

Khi bạn tiếp tục thực hiện những vấn đề thực hành này, bạn sẽ bắt đầu tự tin vào khả năng mã hóa của mình. & NBSP;

Sau đó, bạn có thể chuyển sang bước tiếp theo - học cách làm việc với dữ liệu trong Python.

Bước 2: Thu thập dữ liệu và xử lý trước trong Python

Bây giờ bạn đã biết cách viết mã trong Python, bạn có thể bắt đầu tìm hiểu thu thập dữ liệu và xử lý trước.

Một điều tôi đã nhận thấy về hầu hết người mới bắt đầu trong ngành khoa học dữ liệu là họ nhảy thẳng vào việc cố gắng làm chủ việc học máy. Họ không thể nhấn mạnh vào việc thu thập hoặc phân tích dữ liệu, đây là một kỹ năng riêng biệt trên chính nó.

Do đó, họ thường đấu tranh tại nơi làm việc khi được yêu cầu thực hiện các nhiệm vụ như tìm nguồn cung cấp dữ liệu của bên thứ ba hoặc chuẩn bị dữ liệu cho mô hình học máy máy. & NBSP;

Dưới đây là một số khóa học tôi khuyên bạn nên thực hiện các nhiệm vụ trên. Tôi cũng sẽ cung cấp các lựa chọn thay thế miễn phí mà bạn có thể chọn thay thế.

  • Thu thập dữ liệu - Nhiều công ty yêu cầu thu thập dữ liệu bên ngoài để hỗ trợ quy trình khoa học dữ liệu của họ. Bạn có thể sử dụng API để thu thập dữ liệu này hoặc tạo bộ phế liệu web từ đầu, tùy thuộc vào loại tác vụ được gán cho bạn. Khóa học cơ bản của Scraping và API Foncents của 365Datascience sẽ dạy bạn thu thập dữ liệu web trong Python. Nếu bạn thích một giải pháp thay thế miễn phí, thì tôi đề nghị mã hóa theo hướng dẫn API Python, tiếp theo là hướng dẫn quét web Python trên DataQuest.
  • Dữ liệu xử lý trước-Dữ liệu bạn thu thập có thể có mặt ở nhiều định dạng khác nhau. Bạn cần có khả năng chuyển đổi dữ liệu này thành một định dạng có thể được ăn bởi các mô hình học máy. Điều này thường được thực hiện bằng cách sử dụng thư viện Python có tên Pandas, và bạn nên có được một nắm bắt mạnh mẽ của thư viện này trước khi bạn bắt đầu tìm hiểu mô hình ML. Để bắt đầu, bạn có thể thực hiện xử lý trước dữ liệu này với khóa học gandas được cung cấp bởi 365Datascience. Nếu bạn thích một giải pháp thay thế cho khóa học ở trên, bạn có thể xem video YouTube miễn phí có tiêu đề Giới thiệu về xử lý trước dữ liệu với Python.

Bước 3: Phân tích dữ liệu trong Python

Tiếp theo, bạn nên bắt đầu học phân tích dữ liệu với Python. Phân tích dữ liệu là quá trình xác định các mẫu với số lượng lớn dữ liệu và khám phá những hiểu biết thêm giá trị.

Trước khi tạo bất kỳ mô hình học máy nào, bạn cần hiểu dữ liệu bạn đang xử lý. Nhìn vào các mối quan hệ giữa các biến khác nhau trong bộ dữ liệu của bạn. Một biến nào cho bạn biết thông tin khác? Bạn có thể cung cấp các đề xuất dựa trên những hiểu biết bạn khám phá trong bộ dữ liệu không?

Tôi đề nghị tham gia một khóa học có tiêu đề Học Python để phân tích và trực quan hóa dữ liệu, cũng bởi Jose Portilla, để trau dồi kỹ năng của bạn trong lĩnh vực này. & NBSP;

Có bốn thư viện trong Python chủ yếu được sử dụng để phân tích dữ liệu: gấu trúc, numpy, matplotlib và seeborn. Khóa học Jose Jose sẽ dạy bạn phân tích dữ liệu bằng tất cả các thư viện này. Phần tốt nhất về khóa học này là anh ấy bao gồm các dự án mẫu tương tự như các ví dụ mà bạn sẽ gặp trong thế giới thực.

Nếu bạn đang tìm kiếm các lựa chọn thay thế miễn phí, bạn có thể sử dụng phân tích dữ liệu Freecodecamp, với khóa học Python hoặc tải xuống phân tích dữ liệu khám phá với sách điện tử Python.

& nbsp; hình ảnh từ tài liệu scikit-learn

Hướng dẫn is it easy to learn machine learning with python? - Học máy học với python có dễ không?

Image from the Scikit-learn documentation

& nbsp; Cuối cùng, bạn có thể bắt đầu học máy học! Tôi luôn đề nghị sử dụng một cách tiếp cận từ trên xuống khi học ML.
Finally, you can start to learn machine learning! I always suggest using a top-down approach when it comes to learning ML.

Thay vì học lý thuyết và làm việc chuyên sâu của các mô hình học máy, hãy bắt đầu với cách tiếp cận đầu tiên thực hiện.

Tìm hiểu cách sử dụng các gói Python để xây dựng các mô hình dự đoán trước. Chạy các mô hình trên các bộ dữ liệu trong thế giới thực và quan sát đầu ra. Một khi bạn có cảm giác về việc học máy trông như thế nào trong thực tế, bạn có thể đi sâu hơn vào hoạt động của mỗi thuật toán.

Python cho khoa học dữ liệu và học máy là một khóa học tuyệt vời mà bạn có thể thực hiện để tìm hiểu việc triển khai các mô hình ML trong Python. Một lần nữa, điều này được giảng dạy bởi Jose Portilla, và một trong những khóa học học máy giới thiệu tốt nhất mà tôi đã từng tham gia.

Jose sẽ hướng dẫn bạn qua quy trình học tập máy từ đầu đến cuối. Bạn sẽ học cách xây dựng, đào tạo và đánh giá các mô hình ML trong Python bằng một thư viện có tên Scikit-Learn.

Jose sẽ giúp bạn dễ dàng vào các khái niệm học máy mà không cần đi sâu vào chi tiết, điều này làm cho nó trở thành một khóa học giới thiệu tuyệt vời để bạn bắt đầu.

Học máy Freecodecamp, với khóa học Scikit-learn là một sự thay thế miễn phí tuyệt vời cho khóa học ở trên. Nếu bạn thích đọc, bạn có thể tải xuống một cuốn sách điện tử miễn phí có tiêu đề Building Machine Learning Systems với Python. Đây là một cuốn sách giáo khoa ngắn, thực hành sẽ cung cấp cho bạn rất nhiều ví dụ thực tế mà không cần lặn quá sâu vào hoạt động của mỗi thuật toán.

Bước 5: Thuật toán học máy theo chiều sâu

Khi bạn cảm nhận được các mô hình khác nhau và cách chúng được thực hiện, bạn có thể bắt đầu học các thuật toán cơ bản đằng sau các mô hình này.

Có hai tài nguyên tôi đề xuất cho điều này:

  • Học tập thống kê-EDX: Khóa học này sẽ cung cấp cho bạn sự hiểu biết sâu sắc về cách các thuật toán học máy khác nhau hoạt động. Có ít sự phụ thuộc vào các công thức toán học phức tạp trong khóa học này, điều này giúp bạn dễ dàng hơn nếu bạn không đến từ một nền tảng toán học.

Khóa học này bao gồm các kỹ thuật học máy được giám sát và không giám sát, chẳng hạn như hồi quy tuyến tính, hồi quy logistic, phân tích phân biệt tuyến tính, phân cụm K-MEAN và phân cụm phân cấp. Các giảng viên cũng bao gồm các khái niệm như xác thực chéo và chính quy hóa để tránh quá mức mô hình-điều này sẽ hữu ích khi làm việc với các bộ dữ liệu trong thế giới thực. & NBSP;

Một số bài giảng thực tế trong khóa học này được dạy trong R, mà bạn có thể cảm thấy thoải mái khi bỏ qua, vì giá trị chính của khóa học là tài liệu lý thuyết.

Khóa học này dựa trên một cuốn sách được viết bởi các giảng viên của nó có tên là Giới thiệu về Học tập thống kê. Đây cũng là một tài nguyên với các ví dụ mã được viết bằng R. Tuy nhiên, tôi đã tìm thấy một kho lưu trữ GitHub dịch tất cả các ví dụ mã thành Python, vì vậy bạn có thể đọc sách và mã theo các ví dụ Python.

Tất cả các tài nguyên trên có thể được lấy miễn phí. Trong khi các khóa học EDX đi kèm với một chi phí, bạn có thể đăng ký hỗ trợ tài chính để được miễn phí khóa học. Bạn cũng có thể tải xuống sách điện tử được đề cập ở trên miễn phí.

  • Danh sách phát máy học của Krish Naik, - YouTube: Krish Naik là một nhà khoa học dữ liệu, người tạo ra các hướng dẫn học máy trên YouTube có thể được truy cập miễn phí. & NBSP;

Trong danh sách phát này, anh ta có các video đưa người học thông qua trực giác toán học đằng sau các mô hình học máy khác nhau. Ông giải thích thuật toán cơ bản đằng sau hồi quy tuyến tính và logistic, các khái niệm như đóng gói và tăng cường, và các kỹ thuật học tập không giám sát như K-MEANS và phân cụm phân cấp. & NBSP;

Tương tự như khóa học học thống kê, anh ấy không giải thích bất kỳ điều gì trong số này với ký hiệu toán học phức tạp. Thay vào đó, ông giải thích hoạt động của từng thuật toán bằng tiếng Anh đơn giản để người học có thể dễ dàng hiểu được từ các nền tảng khác nhau.

& NBSP; Hình ảnh của Glem trên Pixabay

Hướng dẫn is it easy to learn machine learning with python? - Học máy học với python có dễ không?

Image by geralt on Pixabay

Bước 6: Học sâu

Cho đến nay, tất cả các tài nguyên trên đã tập trung vào một thuật toán học máy truyền thống, hoặc thuật toán học tập nông. Bây giờ bạn có thể bắt đầu học một lớp khác nhau của các thuật toán học máy - học sâu.

Các thuật toán học sâu có thể xác định các biểu diễn trong dữ liệu mà không có kỹ thuật tính năng. Các thuật toán học sâu có thể xác định các biểu diễn trong dữ liệu và các tính năng xuất phát trực tiếp từ nó. Do đó, việc học sâu thường được sử dụng để xử lý dữ liệu không có các tính năng rõ ràng - chẳng hạn như dữ liệu hình ảnh, giọng nói và văn bản.

Có hai tài nguyên tôi đề xuất để bắt đầu với việc học sâu:

  • Chuyên ngành học sâu của Andrew Ng sườn - Coursera: Đây là một trong những tài nguyên trực tuyến phổ biến nhất để học sâu sắc. Andrew Ng sẽ dạy bạn xây dựng và đào tạo các mạng lưới thần kinh, và áp dụng các kỹ thuật học tập sâu vào dữ liệu hình ảnh và văn bản. Coursera tính phí hàng tháng khi bạn đăng ký vào một khóa học và họ sẽ cung cấp cho bạn một chứng chỉ sau khi bạn hoàn thành nó. Tuy nhiên, bạn có thể chọn kiểm toán khóa học này và nhận tất cả các tài liệu khóa học miễn phí. & NBSP;
  • Học sâu với Python - đây là tài nguyên học tập sâu yêu thích của tôi ngoài kia. Sách giáo khoa này sẽ đưa bạn qua lý thuyết và thực hiện các mô hình học tập sâu. Một lần nữa, tác giả của cuốn sách này giả định rằng người đọc không đến từ một nền tảng toán học, và tất cả các khái niệm được giải thích bằng tiếng Anh đơn giản. Tôi thích cuốn sách này hơn khóa học sâu sắc của Andrew Ng, vì nhiều ví dụ thế giới thực và mã Python đã được cung cấp. Tôi đã có thể áp dụng những gì tôi đã học được cho các dự án thực tế, so với khóa học Andrew Ng, rất lý thuyết.

Bước 7: Dự án

Bước cuối cùng: Xây dựng các dự án!

Có rất nhiều tài liệu được cung cấp ở trên. Nếu bạn không áp dụng bất kỳ điều gì trong số đó cho các dự án thực tế, bạn sẽ quên những gì bạn đã học. Bạn có thể ghi nhớ các khái niệm, thu thập các chứng chỉ và ngồi cho bao nhiêu bài kiểm tra như bạn muốn. Nhưng bạn chỉ thực sự học được khi bạn bắt đầu xây dựng.

Dưới đây là một bài viết có một bản tổng hợp các dự án học máy được tạo bởi các nhà khoa học dữ liệu khác, với mã nguồn được cung cấp để bạn tham khảo. Bạn có thể viết mã theo một số dự án này và thực hiện các thay đổi nhỏ cho chúng, trước khi bắt đầu dự án của riêng bạn từ đầu.

Dưới đây là một vài tài nguyên tôi thấy có thể giúp bạn bắt đầu:

  • Quét các đánh giá sách Amazon
  • Các dự án học tập sâu với mã nguồn
  • Danh sách phát dự án học máy của Krish Naik,
  • Xây dựng mô hình phát hiện tuổi từ hình ảnh khuôn mặt của họ

Dạy cho mình học máy có thể tốn thời gian và quá sức. Tuy nhiên, đó cũng là một hành trình rất bổ ích. Mỗi khi bạn tìm hiểu một khái niệm mới hoặc giải quyết một vấn đề mà bạn không nghĩ là có thể, bạn sẽ tiến gần hơn một bước để đạt được mục tiêu về trình độ học tập máy.

& nbsp; Natassha Selvaraj là một nhà khoa học dữ liệu tự học với niềm đam mê viết lách. Bạn có thể kết nối với cô ấy trên LinkedIn.Natassha Selvaraj is a self-taught data scientist with a passion for writing. You can connect with her on LinkedIn.

Có khó để học máy học với Python không?

Nếu bạn sẽ theo đuổi việc học máy, nên bắt đầu với các khái niệm toán học quan trọng này và chuyển sang các khía cạnh mã hóa từ đó. Nhiều ngôn ngữ liên quan đến trí tuệ nhân tạo như Python được coi là tương đối dễ dàng.relatively easy.

Mất bao lâu để học Python cho học máy?

Nhìn chung, phải mất khoảng hai đến sáu tháng để tìm hiểu các nguyên tắc cơ bản của Python.Nhưng bạn có thể học đủ để viết chương trình ngắn đầu tiên của mình trong vài phút.Phát triển việc làm chủ các thư viện khổng lồ của Python có thể mất nhiều tháng hoặc nhiều năm.two to six months to learn the fundamentals of Python. But you can learn enough to write your first short program in a matter of minutes. Developing mastery of Python's vast array of libraries can take months or years.

Python có đủ để học máy không?

Python là một ngôn ngữ lập trình cho phép áp dụng các thuật toán và khái niệm học máy một cách đơn giản và nhanh hơn.Nó là điều cần thiết nhưng nó chắc chắn không phải là kỹ năng duy nhất cần thiết.It is essential but it is definitely not the only skill required.

Tôi nên học C ++ hoặc học máy Python?

Python cũng là một ngôn ngữ hàng đầu để phân tích dữ liệu và học máy.Mặc dù cũng có thể sử dụng C ++ cho mục đích học máy, nhưng nó không phải là một lựa chọn tốt.Về mặt đơn giản, Python dễ sử dụng hơn nhiều và có một hệ thống hỗ trợ tuyệt vời khi nói đến các khung AI và ML.While it is possible to use C++ for machine learning purposes as well, it is not a good option. In terms of simplicity, Python is much easier to use and has a great support system when it comes to AI and ML frameworks.