Kiến thức Hữu ích 😍

Hướng dẫn sử dụng WordPress Content Crawler


WordPress Content Crawler là gì?

WordPress Content Crawler là một plugin mạnh mẽ giúp tự động thu thập nội dung từ các trang web khác và đăng lên trang WordPress của bạn. Công cụ này rất hữu ích cho các trang tin tức, blog hoặc website tổng hợp nội dung từ nhiều nguồn khác nhau.

Tải về plugin WP Content Crawler tại đây (Google Drive)

hdsd-plugin-wp-content-crawler

Lợi ích của WordPress Content Crawler:

  • Tự động hóa nội dung: Tiết kiệm thời gian bằng cách tự động lấy bài viết từ các nguồn tin cậy.
  • Tùy chỉnh linh hoạt: Cho phép thiết lập nội dung, chọn lọc bài viết theo ý muốn.
  • Tích hợp SEO: Hỗ trợ tối ưu hóa bài viết để giúp website tăng thứ hạng trên công cụ tìm kiếm.
  • Hỗ trợ nhiều loại nội dung: Có thể lấy bài viết, hình ảnh, video, giá sản phẩm, mô tả và nhiều hơn nữa.
  • Tiết kiệm công sức quản lý nội dung: Không cần nhập thủ công từng bài viết, giúp bạn có thể tập trung vào các chiến lược phát triển website.
  • Hỗ trợ nhiều website cùng lúc: Cho phép quản lý và thu thập nội dung từ nhiều nguồn khác nhau chỉ với một plugin duy nhất.

Xem thêm: Dịch vụ thiết kế website giá rẻ tại AZWEB

Cách cài đặt WordPress Content Crawler

Bước 1: Cài đặt Plugin

Tải Plugin về và giải nén ra tại link: Tải về tại đây (Google Drive)

Vào PluginsAdd NewUpload Plugin.

Chọn file .zip đã tải về.

Nhấn Install Now và sau đó Activate.

Tải Plugin lên

Bước 2: Kích hoạt bản quyền

Cách 1: Mua License Key chính hãng

Nếu sử dụng bản trả phí, bạn cần nhập mã kích hoạt để sử dụng đầy đủ tính năng.

Cách 2: Dùng bản đã được kích hoạt

Bản tải về mà AZWEB chia sẻ bên trên cho bạn chính là bản đã được mua bản quyền và kích hoạt rồi. Bạn chỉ cần về cài đặt và sử dụng.

Bản này dùng cho thử nghiệm hoặc không nhằm mục đích kinh doanh. Nếu website của bạn kiếm ra được tiền, hãy mua License chính hãng để ủng hộ nhóm tác giả nhé.

Cách 3: Nếu như Plugin bạn vừa tải về không kích hoạt được , bạn làm như sau:

Bước 1: Mở file wp-content-crawler.php nằm trong thư mục gốc của plugin và thêm đoạn mã phí dưới vào phần đầu nội dung ( sau phần khai báo thông tin tên, phiên bản, …)

Bước 2: Chèn đoạn mã sau vào phần đầu của tệp và bấm lưu lại:

namespace WPCCrawler;
if(!class_exists('WPTSLMClient')) {
    class WPTSLMClient {
        public function __construct($productName, $productId, $type, $apiUrl, $pluginFilePath, $textDomain){}
        public function setUrlHowToFindLicenseKey($url){}
        public function isUserCool() {return true;}
        public function setIsProductPageCallback($callback){}
    }
}
Huong-dan-kich-hoat-ban-quyen-Plugin-Wp-Content-Crawler

Nếu các bạn làm cách trên vẫn không thành công thì hãy thử cách này nhé.

Lưu ý:  Phiên bản mới yêu cầu bạn phải sử dụng tối thiểu PHP 7.2

Bước 1: Bạn thực hiện cài đặt Plugin vào website.

Bước 2: Tiếp theo, hãy truy cập vào đường dẫn: /wp-content/plugins/wp-content-crawler/app/WPTSLMClient.php

Tm đến dòng:

private function setValid($value)

Sửa cả cụm thành như sau:

private function setValid($value) {
    $value = '1';
    update_option($this->getValidOptionName(), base64_encode($value), true);
}

Tiếp theo tìm dòng:

private function getValid()

Sửa tiếp cả cụm thành:

private function getValid() { return '1'; }
Huong-dan-kich-hoat-ban-quyen-Plugin-Wp-Content-Crawler-3

Sau đó lưu lại. Đăng nhập vào trang quản trị web và truy cập Setting > License Settings for Content Crawler > Điền số bất kỳ > Ấn Save Change.

Cấu hình WordPress Content Crawler

Thêm nguồn nội dung (Site Settings)

  1. Vào WordPress DashboardWP Content CrawlerNew Site.
  2. Nhập URL của trang web bạn muốn lấy nội dung.
  3. Chọn kiểu thu thập dữ liệu: Bài viết, sản phẩm, hình ảnh,….

Cấu hình bộ lọc nội dung

  • Chọn danh mục bài viết: Đảm bảo bài viết được đưa vào đúng chuyên mục.
  • Thiết lập tiêu đề: Lọc và sửa tiêu đề trước khi đăng bài.
  • Loại bỏ nội dung không mong muốn: Dùng CSS Selectors hoặc Regex để loại bỏ phần không cần thiết.
  • Chọn ảnh đại diện tự động: Plugin hỗ trợ lấy ảnh từ nội dung hoặc chỉ định ảnh cố định.
  • Chặn nội dung trùng lặp: Sử dụng hash hoặc bộ lọc để tránh trùng lặp bài viết.
  • Kiểm soát các đoạn trích (excerpt): Tùy chỉnh để tạo các đoạn trích hấp dẫn hơn cho người đọc.

Cấu hình đăng bài tự động

  • Định thời gian đăng bài: Đặt lịch để bài viết tự động đăng sau một khoảng thời gian nhất định.
  • Tối ưu hóa SEO: Tích hợp với plugin như Yoast SEO để tự động tạo meta descriptions, keywords.
  • Spin nội dung (nếu cần): Dùng tính năng spin nội dung để tránh trùng lặp và cải thiện SEO.
  • Cấu hình URL tĩnh: Tùy chỉnh URL để bài viết trở nên thân thiện hơn với các công cụ tìm kiếm.
  • Thiết lập slug tự động: Chỉnh sửa slug sao cho ngắn gọn, rõ ràng và chuẩn SEO.
  • Tạo tag và danh mục thông minh: Để phân loại bài viết dễ dàng hơn.
Cach-tao-mot-site-setting-de-dinh-nghia-cac-trang-web-nguon

Quản lý hình ảnh và video

  • Chọn Download images để tải hình ảnh về website.
  • Nếu muốn nhúng video từ YouTube, có thể lấy thẳng link nhúng từ nguồn.
  • Thiết lập hình ảnh nổi bật: Để bài viết hiển thị chuyên nghiệp hơn.
  • Nén hình ảnh tự động: Giảm dung lượng hình ảnh để tăng tốc độ tải trang.
  • Thay thế liên kết hình ảnh gốc: Để tránh hiển thị ảnh từ trang web nguồn.

Các mẹo tối ưu WordPress Content Crawler

Tránh trùng lặp nội dung

  • Dùng Rewrite Content hoặc tích hợp với Spin Rewriter.
  • Thiết lập Canonical URL để tránh bị Google phạt vì trùng lặp nội dung.
  • Dùng API kiểm tra trùng lặp: Như Copyscape hoặc Grammarly để rà soát nội dung.

Chọn nguồn chất lượng

  • Chỉ thu thập nội dung từ các trang web đáng tin cậy.
  • Kiểm tra bản quyền trước khi sử dụng nội dung.
  • Cấu hình whitelist/blacklist: Để chọn lọc nội dung hợp lệ.

Cải thiện tốc độ website

  • Giới hạn số bài viết lấy về mỗi ngày để tránh làm chậm website.
  • Dùng WP Rocket hoặc LiteSpeed Cache để tối ưu tốc độ tải trang.
  • Sử dụng CDN: Để giảm tải máy chủ và tăng tốc độ load trang.
  • Xóa dữ liệu cũ: Loại bỏ nội dung không cần thiết để tối ưu dung lượng cơ sở dữ liệu.

Bảo mật và duy trì plugin

  • Cập nhật plugin thường xuyên để tránh lỗi bảo mật.
  • Kiểm tra plugin có tương thích với phiên bản WordPress mới nhất hay không.
  • Dùng bảo mật 2 lớp: Để bảo vệ dữ liệu thu thập được.
  • Theo dõi nhật ký hoạt động: Để kiểm tra nội dung thu thập có đúng mong muốn.

Kết luận

WordPress Content Crawler là công cụ hữu ích giúp tự động hóa việc thu thập nội dung và quản lý bài viết. Tuy nhiên, để sử dụng hiệu quả và không vi phạm bản quyền, bạn cần chọn nguồn hợp lý, tối ưu SEO và kiểm soát nội dung chặt chẽ. Nếu sử dụng đúng cách, plugin này có thể giúp bạn tiết kiệm rất nhiều thời gian và nâng cao hiệu quả phát triển website.

Việc thiết lập plugin đúng cách sẽ mang lại lợi ích lâu dài, giúp website của bạn luôn có nội dung mới, hấp dẫn mà không tốn nhiều công sức. Hãy thử nghiệm với các tùy chỉnh khác nhau để tìm ra chiến lược thu thập nội dung phù hợp nhất!

Đánh giá