Web scraping hay trích xuất dữ liệu không phải là một nhiệm vụ dễ dàng. Nhưng điều mà nhiều người chưa biết là chẳng cần phải là một hacker mới có thể thu thập dữ liệu từ những trang web. Trên thực tế, bạn không cần bất kỳ chuyên môn lập trình nào.
Vô số các công cụ như tiện ích mở rộng trình duyệt tồn tại để giúp giảm bớt kiến thức kỹ thuật cần thiết. Nhưng ngay cả khi chúng hơi “quá sức” đối với bạn, thì cũng đừng lo lắng. Google Sheets sẽ đến để giúp đỡ bạn
Google Sheets có 1 công thức nhỏ tiện lợi cấp phép bạn trích xuất danh sách hoặc bảng dữ liệu của trang web vào trang tính do bạn chọn. Công thức kia được coi là importhtml và hoạt động như sau:
Tìm trang web bạn mong muốn lấy dữ liệu
Ví dụ, hãy coi xét danh sách các công ty công nghệ đứng đầu về doanh số trên trang Wikipedia:
https://en.wikipedia.org/wiki/List_of_largest_technology_companies_by_revenue
Xác định bảng hoặc bản kê bạn muốn trích xuất dữ liệu
Trong tình huống này, hãy chọn bảng thứ 2 trên trang, trong phần “2019 list”.
Bây giờ, nhập nội dung sau vào ô tùy ý (giả sử A1)
=IMPORTHTML("https://en.wikipedia.org/wiki/List_of_largest_technology_companies_by_revenue", "table", 2)
Như bạn có thể thấy, bạn sẽ phải khai báo ba điều trong công thức: URL bạn mong muốn lấy dữ liệu từ đó, loại dữ liệu (bảng hoặc danh sách) và vị trí (trong tình huống đây là bảng thứ hai, vì vậy, số trong công thức là 2 ).
Nhấn Enter
và bảng xuất sẽ hiện trong trang tính:

Để đi tới cấp độ kế đến và đích thực chuyển đổi hoặc xóa dữ liệu đó, trước tiên hãy đáp ứng rằng nó được đặt tại trạng thái tĩnh thay vì dữ liệu được liên kết. Để làm như vậy, chọn bảng, click chuột phải vào ô A1 , chọn Paste special > Paste values only .
Mọi thao tác đã hoàn tất. Hãy nhẹ nhõm làm những điều bạn thích với dữ liệu trong Google Sheets!
Chúc bạn thi hành thành công!
Google Sheets, dữ liệu trang web, lấy dữ liệu trang web, cách lấy dữ liệu trang web với Google Sheets, lấy dữ liệu trang web bằng Google Sheets
Nội dung Cách lấy dữ liệu trang web với Google Sheets được tổng hợp sưu tầm biên tập bởi: Tin Học Trường Tín. Mọi ý kiến vui lòng gửi Liên Hệ cho truongtin.top để điều chỉnh. truongtin.top tks.
Bài Viết Liên Quan
Bài Viết Khác
- Sửa Wifi Tại Nhà Quận 4
- Cài Win Quận 3 – Dịch Vụ Tận Nơi Tại Nhà Q3
- Vệ Sinh Máy Tính Quận 3
- Sửa Laptop Quận 3
- Dịch Vụ Cài Lại Windows 7,8,10 Tận Nhà Quận 4
- Dịch Vụ Cài Lại Windows 7,8,10 Tận Nhà Quận 3
- Tuyển Thợ Sửa Máy Tính – Thợ Sửa Máy In Tại Quận 4 Lương Trên 10tr
- Tuyển Thợ Sửa Máy Tính – Thợ Sửa Máy In Tại Quận 3
- Hướng dẫn tải cài đặt Microsoft Office 2003
- 10 mẹo và thủ thuật Google Slides giúp bạn tiết kiệm thời gian
- 21 cách sử dụng tính năng Paste trong Excel
- Top 10 Cửa Hàng Bán Máy Tính Cũ Để Bàn Ở Tại Quận Thủ Đức Tphcm
- Pin Laptop HP Compaq NC8430 Giá Rẻ Nhất