Lấy dữ liệu từ web vào Google Sheet

Bạn có muốn chuyển một bảng từ web HTML sang Google Sheets không? Hãy tưởng tượng bạn cần thu thập dữ liệu để báo cáo, nhưng dữ liệu của bạn chỉ có sẵn trên web và bạn cần tìm một cách thức dễ dàng để đưa dữ liệu đó vào bảng tính của mình.

Trong bài viết này chúng ta sẽ tìm hiểu một số cách khác nhau để chuyển dữ liệu từ một bảng trên trang web HTML sang Bảng tính. 

Trọn bộ khóa học Google Sheets từ cơ bản tới nâng cao

Gợi ý khóa học dành riêng cho bạn

Lấy dữ liệu từ web vào Google Sheet
Xây dựng bảng lương bằng Google Sheets cơ bản từ A-Z

Tô Văn Thuật

363 học viên

0 (0 đánh giá)

Lấy dữ liệu từ web vào Google Sheet
Google Sheets từ Cơ bản đến Nâng cao, công cụ thay thế Excel

Nguyễn Văn Qúy

361 học viên

5 (4 đánh giá)

Lấy dữ liệu từ web vào Google Sheet
Xây dựng file thông tin quản lý hồ sơ nhân sự bằng Google Sheets từ A-Z

Tô Văn Thuật

318 học viên

5 (1 đánh giá)

Lấy dữ liệu từ web vào Google Sheet
Cách gửi Email cho ứng viên trong Google Sheets | Tuyển Dụng | Quản lý Hồ Sơ Nhân Sự

Tô Văn Thuật

192 học viên

0 (0 đánh giá)

Xem toàn bộ khóa học Google Sheets

Gợi ý khóa học dành riêng cho bạn

Lấy dữ liệu từ web vào Google Sheet

Xây dựng bảng lương bằng Google Sheets cơ bản từ A-Z

Tô Văn Thuật - 363 học viên

0 (0 đánh giá)

Lấy dữ liệu từ web vào Google Sheet

Google Sheets từ Cơ bản đến Nâng cao, công cụ thay thế Excel

Nguyễn Văn Qúy - 361 học viên

5 (4 đánh giá)

Lấy dữ liệu từ web vào Google Sheet

Xây dựng file thông tin quản lý hồ sơ nhân sự bằng Google Sheets từ A-Z

Tô Văn Thuật - 318 học viên

5 (1 đánh giá)

Lấy dữ liệu từ web vào Google Sheet

Cách gửi Email cho ứng viên trong Google Sheets | Tuyển Dụng | Quản lý Hồ Sơ Nhân Sự

Tô Văn Thuật - 192 học viên

0 (0 đánh giá)

Xem toàn bộ khóa học Google Sheets

2 cách chuyển một bảng từ trang web HTML sang Google Sheets

Cách 1: Sử dụng New Web Query trong Excel

Ví dụ bạn muốn trích xuất dữ liệu từ trang web như hình bên dưới.

Lấy dữ liệu từ web vào Google Sheet

Trong Excel, bạn cần làm các bước sau:

Bước 1: Mở thẻ Data, chọn Get External Data

Bước 2: Chọn From Web

Bước 3: Nhập URL trang  vào hộp thoại New Web Query

Bước 4: Nhấp nút Go

Lấy dữ liệu từ web vào Google Sheet

Bước 5: Di chuột lên phần dấu mũi tên màu vàng, click chọn những bản dữ liệu bạn cần:

Lấy dữ liệu từ web vào Google Sheet

Bước 6: Nhấp nút Import. Chọn ô bạn muốn lưu trong hộp thoại Import Data. Trong ví dụ này, chúng ta sẽ chọn ô A1

Lấy dữ liệu từ web vào Google Sheet

Như vậy là bạn đã lấy được dữ liệu từ Website vào trong Excel.

Xem thêm: Unpivot Column là gì? Cách tạo Unpivot Column trong Power Query

Cách 2: Sử dụng hàm importHTML trong Google Sheets

Với ví dụ bên dưới, chúng ta sẽ sử dụng hàm importHTML (“”, ”table”, N) trong Google Sheets để chuyển một bảng từ trang web HTML sang bảng tính Google. Cả URL của trang web mục tiêu và thành phần bảng mục tiêu đều phải nằm trong dấu ngoặc kép. Số N xác định vị trí của bảng trong trang (bắt đầu đếm từ 0).

Ví dụ bạn có một bảng số liệu Danh sách các khu định cư lớn nhất của Vương quốc Anh như hình bên dưới, trên trang Wikipedia. 

Lấy dữ liệu từ web vào Google Sheet

 

Bạn cần sao chép URL của trang này, mở Bảng tính Google mới và nhập công thức “= importHTML” vào đó.

Lấy dữ liệu từ web vào Google Sheet

 

= ImportHtml (“ http://en.wikipedia.org/wiki/List_of_largest_United_Kingdom_settlements_by_population” ;,” table ”, 1)

Và một bảng dữ liệu xuất hiện:
 

Lấy dữ liệu từ web vào Google Sheet

 

Với bảng dữ liệu này, bạn có thể dễ dàng vẽ một biểu đồ minh họa trong Google Sheets.

Lấy dữ liệu từ web vào Google Sheet

Xem thêm: Cách sử dụng hàm IMPORTRANGE bảo toàn định dạng bảng tính Google Sheets

Trích xuất bảng tính Google sang nhiều định dạng khác nhau

Ở phần trên, bạn đã biết cách nhanh chóng chuyển một bảng HTML sang Sheets của mình. Thế nhưng, đây vẫn chưa là điều thú vị nhất. Với bảng tính này, bạn còn có thể suất ra dưới nhiều định dạng khác nhau.

Bạn chỉ cần click và nút Share trên thanh công cụ, sau đó chọn Publish as a web page.

Lấy dữ liệu từ web vào Google Sheet

 

Ngoài việc xuất bản bảng tính dưới dạng trang HTML mà bất kỳ ai cũng có thể xem, bạn cũng có thể truy cập vào nguồn cấp dữ liệu RSS - và một loạt các định dạng dữ liệu khác nếu muốn.

Lấy dữ liệu từ web vào Google Sheet

 

Nhấp vào liên kết các tùy chọn xuất bản khác "More publishing options" và chọn định dạng file CVS

Lấy dữ liệu từ web vào Google Sheet

 

Lấy dữ liệu từ web vào Google Sheet

 

Thật không may, các dấu * trong tên phần tử làm rối tung mọi thứ lên một chút, vì vậy hãy đổi tên chúng (đừng quên bỏ hàng ban đầu của nguồn cấp dữ liệu (cách khác, chỉnh sửa URL CSV để nó bắt đầu bằng hàng 2); Bạn cũng có thể cũng tạo nguồn cấp RSS thích hợp, bằng cách đảm bảo rằng có ít nhất một tiêu đề và phần tử mô tả trong đó:
 

Lấy dữ liệu từ web vào Google Sheet

 

Chúng ta có thể làm cho phần mô tả này dễ nhìn hơn một chút bằng cách sử dụng biểu thức chính quy để viết lại phần tử mô tả và thực hiện một số thay đổi với khối trích xuất vị trí.

Lấy dữ liệu từ web vào Google Sheet

 

Tuy nhiên, chúng tôi khuyến khuyết bạn thay thế khối Location Builder bằng khối Loop trong Yahoo Pipes để có hiệu quả tốt hơn

Lấy dữ liệu từ web vào Google Sheet

 

Location Builder sẽ tìm đến một phần tử được chỉ định cho nội dung mà chúng ta muốn mã hóa địa lý:

Lấy dữ liệu từ web vào Google Sheet

 

Khối Location Builder phải được định cấu hình để xuất kết quả được mã hóa địa lý tới phần tử y: location. LƯU Ý: mã địa lý thường giả định tên thị trấn / thành phố của Hoa Kỳ. Nếu bạn có một danh sách các tên thị trấn mà bạn biết đến từ một quốc gia nhất định, bạn có thể muốn chú thích chúng với tên quốc gia trước khi bạn cố gắng mã hóa chúng. Một khối biểu thức chính quy có thể giúp bạn thực hiện

Lấy dữ liệu từ web vào Google Sheet

 

Khối này cho biết - trong phần tử tiêu đề , lấy một bản sao của mọi thứ -. * - vào một biến - (. *) - và sau đó thay thế nội dung của phần tử tiêu đề bằng giá trị ban đầu - $ 1 - cũng như “, UK” - $ 1, Vương quốc Anh

Lưu ý rằng khối biểu thức chính quy này sẽ cần được đặt TRƯỚC khối Vòng lặp mã hóa địa lý. Bởi vì chúng ta muốn bộ mã hóa địa lý hoạt động trên phần tử tiêu đề có chứa “Cambridge, Vương quốc Anh” chẳng hạn, thay vì chỉ “Cambridge”. Như hình dưới dây:

Tiếp theo chúng ta lấy nguồn cấp dữ liệu KML

Lấy dữ liệu từ web vào Google Sheet

 

Và đưa nó vào bản đồ Google:
 

Lấy dữ liệu từ web vào Google Sheet

 

 

Như vậy, chúng ta đã trích xuất một số dữ liệu từ trang wikipedia vào bảng tính Google bằng công thức importHTML, xuất bản một số hàng từ bảng đó dưới dạng CSV, sử dụng CSV trong Yahoo pipe và tạo nguồn cấp dữ liệu KML được mã hóa địa lý, sau đó hiển thị nó trong bản đồ Google.

Xem thêm: CÁCH SỬ DỤNG HÀM QUERY TRONG GOOGLE SHEETS

Kết luận

Hy vọng qua bài viết này, bạn đã chọn được một cách dễ dàng chuyển dữ liệu từ một bảng HTML có sẵn trên web sang bảng tính của mình. Bên cạnh đó, để không bỏ lỡ những mẹo và thủ thuật tin học văn phòng hữu ích khác, hãy tham gia Gitiho ngay hôm nay.

Thích 0

Chia sẻ

0/5 - (0 bình chọn)

0/5 - (0 bình chọn)

Bài viết liên quan

Lấy dữ liệu từ web vào Google Sheet

Hướng dẫn tạo danh sách tùy chọn Drop List trong Google Sheets

Lấy dữ liệu từ web vào Google Sheet

Hướng dẫn cách cố định hàng/cột trong Google Sheets

Lấy dữ liệu từ web vào Google Sheet

Hướng dẫn cách bảo vệ trang tính trong Google Sheets

Lấy dữ liệu từ web vào Google Sheet

Cách khắc phục lỗi về ô và dòng trong Google Sheets

Lấy dữ liệu từ web vào Google Sheet

Tổng hợp các phím tắt thông dụng trong Google Sheets

Lấy dữ liệu từ web vào Google Sheet

Hướng dẫn tô màu xen kẽ giữa các hàng trong Google Sheets

×

Chúc mừng bạn đã nhận được quà tặng ""

HÃY ĐĂNG NHẬP ĐỂ NHẬN QUÀ NGAY

Lấy dữ liệu từ web vào Google Sheet

Đăng nhập bằng Google

Đăng nhập bằng Apple

Hoặc đăng nhập

Đăng nhập

Đăng ký tài khoản

Đăng nhập bằng Google

Đăng nhập bằng Apple

Hoặc đăng ký

Đăng ký

Đăng nhập

Khóa học của tôi

Tải xuống

Bạn vui lòng đăng nhập để gửi tương tác

Đăng nhập

Đăng nhập bằng Google

Đăng nhập bằng Apple

Hoặc đăng nhập

Đăng nhập

Đăng ký tài khoản

Đăng ký

Đăng nhập bằng Google

Đăng nhập bằng Apple

Hoặc đăng ký

Đăng ký

Đăng nhập

Lấy dữ liệu từ web vào Google Sheet
Top

Hỗ trợ khách hàng

Email: [email protected] Hotline: 0774 116 285 (Giờ làm việc: 8h30 - 18h, nghỉ chiều thứ 7 và CN) Những câu hỏi thường gặp Hướng dẫn đăng ký khoá học Hướng dẫn đăng nhập Hướng dẫn lấy lại mật khẩu Hướng dẫn thanh toán khóa học sau khi đăng ký thành công

VỀ GITIHO

Giới thiệu về Gitiho Tuyển dụng giảng viên Tuyển dụng nhân sự Đào tạo cho doanh nghiệp Chính sách bảo mật thông tin Chính sách và quy định chung Quy định mua, hủy, sử dụng khóa học Bộ quy tắc hành xử của giảng viên và học viên trên Gitiho Quy trình xác nhận – hoàn, hủy đơn hàng tại hệ thống Gitiho Cách lấy chứng nhận Gitiho

hợp tác và liên kết

Dạy học trên Gitiho Dịch vụ Doanh nghiệp Đăng ký Gitiho Affiliate

Tải App Gitiho

Lấy dữ liệu từ web vào Google Sheet
Lấy dữ liệu từ web vào Google Sheet

Kết nối với chúng tôi

Lấy dữ liệu từ web vào Google Sheet
Lấy dữ liệu từ web vào Google Sheet
Lấy dữ liệu từ web vào Google Sheet
Lấy dữ liệu từ web vào Google Sheet

Lấy dữ liệu từ web vào Google Sheet

Địa chỉ văn phòng: Phòng 206, tầng 2, Tòa nhà Tây Hà, KĐT mới Phùng Khoang, Phường Trung Văn, Quận Nam Từ Liêm, Thành phố Hà Nội, Việt Nam