Cách lấy toàn bộ dữ liệu của một trang bloger, thủ thuật blogger
- Sỡ dĩ có thể lấy cắp toàn bộ dữ liệu của blog chính là do 1 tính năng mà blog cung cấp – RSS – ATOM.Bước 1. Xác định trang bloger mà bạn muốn lấy dữ liệu.
Ví dụ: cntt-news.blogspot.comNguồn cấp dữ liệu bài đăng sẽ là: http://cntt-news.blogspot.com/atom.xml.
Lưu ý: Một vài blogspot tạo Feed, Atom sử dụng công cụ của bên thứ 3
Bước 2. Xác định tổng số lượng bài viết của blog mà bạn muốn lấy.
- bạn copy toàn bộ đoạn javascript dưới đây:Lưu ý: Thay địa chỉ blog http://cntt-news.blogspot.com bằng địa chỉ của trang mà bạn muốn lấy.
<script style="text/javascript">
function showpostcount(json) {
document.write('<center>Tổng số bài viết: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="http://cntt-news.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
<script style="text/javascript"></script>
- sau đó vào ĐÂY và dán toàn bộ đoạn javascript mà bạn đã copy ở trên rồi ấn submit bạn sẽ nhận được tổng số bài viết của bloger đó.
Bước 3. Tiến hành lấy toàn bộ dữ liệu về máy tính
- bạn copy đoạn code sau.http://cntt-news.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y- Thay http://cntt-news.blogspot.com bằng bloger của nạn nhân.
- X: Bài bắt đầu lấy, tính từ bài viết mới nhất, bài mới nhất là 1.
- Y: Tổng số bài sẽ lấy tính từ X.
VD: http://cntt-news.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=300.
- sau khi xác định được số lượng bài viết muốn lấy, ta cố 2 cách để lấy bài viết.( nên chia nhỏ số lượng file muốn lấy mỗi file khoảng 200 bài)
Cách 1: Sử dụng trình duyệt.
- pase đường dẫn vừa lấy ở trên dán vào thanh địa chỉ của trình duyệt.
- sau đó chọn lưu thành để tải về máy.
Cách 2: Sử dụng trình Internet Download Manager (IDM)
– Mở trình duyệt IDM, vào Task trên thanh menu, chọn “Add new download”.
- Một hộp thoại hiện ra, Paste đoạn bên trên vào thanh Address rồi chọn download là được.
- như vậy là các bạn đã lấy thành công.
Bước 4. Nhập dữ liệu vào blogger.
- Truy cập vào trang quản trị blog của bạn, vào Cài đặt/ Khác, chọn “Nhập blog”- Lần lượt chọn các tập tin atom mà bạn đã tải về, nhớ nhập mã Capcha nha.
Chú ý: Khi import xong nên đăng lấy lệ một vài bài để xóa bỏ Mã Capcha, tránh việc import quá nhiều bài cùng một lúc sẽ bị google cho là spam.
Nguồn : tutorialit
0 comments:
Post a Comment