Staging site là staging site, Duplicate website là duplicate website!

Hôm nọ tôi lại chia sẻ cách tạo trang staging site cho WordPress trên nhóm WP của Thạch Phạm. Staging site giúp tiện việc chỉnh sửa, hoặc giao cho bên thứ ba can thiệp để không ảnh hưởng đến website gốc.

Sau có bạn bình luận thế này:

:)) tóm lại nói staging cho nó sang chảnh thôi chứ nói đơn giản là duplicate web và chỉnh sửa hoặc làm gì thì làm :))

Ý bạn ấy là nói staging site chỉ là làm màu thôi, chứ bản chất chỉ là duplicate web.

Nhầm to!

Chính xác thì duplicate web là chỉ là một phần trong quy trình staging site. Dù duplicate web là cái lõi cực kỳ quan trọng của staging site nhưng hai cái đó không tương đương. Và nếu làm trên các website quan trọng, chỉ duplicate web rồi “chỉnh sửa hoặc làm gì thì làm” có khả năng gây lỗi SEO cực nghiêm trọng là duplicate content- nhất là trong bối cảnh staging site thường triển khai trên chính subdomain của website gốc.

Sau bạn nói thêm về vụ trong bài viết tôi quên nhắc chuyện nếu xóa nội dung nhạy cảm giao rồi cho bên thứ ba thì khi chuyển lại staging site về trang gốc thì chủ trang cần khôi phục lại- cái này tôi ghi nhận.

Tiếp theo, một bình luận của bạn khác:

Thật ra bác cứ làm cao siêu lên đấy chứ :)) Nhân bản ra 1 subdomain rồi disallow đám bot = xong 😀 Mà lại quên mất chức năng của WordPress có 1 dòng à :))

Kèm ảnh:

chặn bot tìm kiếm

Ý của bạn là các cách khác tôi chỉ như meta noindex, robots.txt hay HTTP auth là cao siêu, màu mè mà quên mất chức năng có sẵn của WordPress.

Bạn nói không sai hoàn toàn, nhưng nhầm về khoản cao siêu!

Tính năng bạn trên vừa chỉ thuộc vào phần Setting > Reading > Search Engine Visibility. Về bản chất nó cũng thêm meta noindex vào trang như thế này:

<meta name='robots' content='noindex,nofollow' />

Nhưng cái mà tôi muốn nhấn mạnh ở đây là các phương thức khác nhau (và có thể kết hợp) để tránh tối đa rủi ro trùng lặp nội dung, vì nếu bị xảy ra thì đây là lỗi rất nặng. An toàn nhất vẫn phải dùng HTTP auth rồi thiết lập pass để tránh truy cập công khai, còn trong phần đa trường hợp meta noindex và robots.txt là đủ.

Kết luận: Staging site là staging site, Duplicate website là duplicate website! Lẫn lộn là có ngày đền ốm chứ chẳng chơi đâu.