Bài 11: Canonical URL

Trong bài viết này, bạn sẽ tìm hiểu Canonical URL là gì và tại sao nó lại quan trọng đối với SEO. Canonical URL là một yếu tố hỗ trợ bạn để khắc phục tình trạng duplicate content trên toàn bộ website một cách hiệu quả. Thông thường, việc trùng lặp URL diễn ra trên trang web mà đôi khi bạn còn không hay biết. Chính vì vậy, việc thêm canonical URL  giúp website tránh bị thuật toán Panda của Google phạt, làm ảnh hưởng nghiêm trọng đến thứ hạng website.

Canonical URL là gì?

Khi website trở nên lớn mạnh và cung cấp nhiều nội dung thì thường sẽ xuất hiện các trang chứa thông tin tương tự hoặc trùng lặp nhau, điều này dẫn đến tình trạng “trùng lặp nội dung” (Duplicate content) và có thể bị thuật toán của Google phạt.

Nếu các bài viết có nội dung giống nhau đều được Google index thì có thể có trường hợp đường link bạn không mong muốn lại xuất hiện ở thứ hạng cao trên trang kết quả. Để giải quyết vấn đề này thì  một canonical URL sẽ được thêm vào phần HEAD của một trang và cho các ng cụ tìm kiếm biết đâu là URL được ưu tiên lựa chọn xếp hạng. Canonical URL có thể trỏ đến chính nó (tự tham chiếu) hoặc một URL khác.

Thẻ canonical được sử dụng để làm gì?

  • Giúp quản trị viên web giải quyết vấn đề nội dung trùng lặp.
  • Giúp ng cụ tìm kiếm lập chỉ mục trang tốt nhất (trong trường hợp các trang có nội dung tương tự/ giống hệt nhau).
  • Giúp quản trị viên web chỉ định preferred domain.
  • Là một cách để hợp nhất các trang.
  • Là một cách để bảo vệ PageRank khỏi bị sao chép nội dung.
  • Là một cách để tránh các vấn đề trùng lặp nội dung.
  • Là một cách để chỉ định trang nào sẽ được lập chỉ mục trong trường hợp sử dụng trang dành cho thiết bị di động (AMP) trên trang web.

Các lỗi thường gặp với Canonical URL là gì?

Bạn có thể vẫn thắc mắc làm sao có thể tạo ra một trang bị trùng và cần sử dụng đến canonical URL để khắc phục. Trên thực tế, chúng ta thường coi một trang như một khái niệm, ví dụ như trang chủ. Nhưng đối với các công cụ tìm kiếm thì mỗi URL là một trang riêng biệt.

Ví dụ: Search Engines có thể truy cập trang chủ của bạn và thu thập dữ liệu theo tất cả các cách sau:

  • http://www.excample.com
  • https://www.example.com
  • http://example.com
  • http://example.com/index.php
  • https://example.com.index.php?r..

Rõ ràng, tất cả các URL này chỉ đại diện cho một trang duy nhất nhưng đối với công cụ tìm kiếm thì mỗi URL này là một trang riêng biệt. Vậy trong ví dụ trên là năm bản sao của trang chủ đang hoạt động.

Đây chỉ là một trường hợp rất nhỏ về các biến thể mà bạn có thể gặp phải. Việc sử dụng hệ thống quản trị nội dung trang web (CMS) và các trang web động, chạy bằng code có thể khiến vấn đề này trở nên nghiêm trọng hơn.

Bên cạnh đó, nhiều trang web tự động thêm đường dẫn, thẻ, URL có đích đến cùng một nội dung. Ngoài ra, chúng còn có thể thêm các tham số URL cho việc tìm kiếm, sắp xếp,… Do đó, bạn có thể có hàng nghìn URL trùng lặp trên website của mình mà thậm chí không hề hay biết.

Làm cách nào để tìm Canonical URL?

Canonical URL chỉ hiển thị đối với trình thu thập thông tin của ng cụ tìm kiếm chứ không phải người dùng. Nó được thêm vào phần <HEAD></HEAD> của trang và có định dạng sau: <link rel=”canonical” href=”CANONICAL-URL”/>

Để tìm Canonical URL, hãy sử dụng một trong các cách bên dưới:

Xem Nguồn HTML của một trang

Mở một trang web trong Chrome và chọn ViewDeveloperView Source từ menu trên cùng để xem nguồn HTML của trang.

Tìm từ ‘Canonical’. Nếu thẻ được tìm thấy, nó sẽ có dạng:

<link rel=”canonical” href=”https://dmagency.vn/canonical-url-la-gi”/>

Nếu bạn không thể tìm thấy từ Canonical trong HTML của mình thì điều này có nghĩa là bạn chưa có Canonical URL cho trang.

Sử dụng Công cụ kiểm tra URL

Công cụ kiểm tra URL của Google Search Console https://daotaodigital.com/google-search-console-la-gi/ cho bạn thấy Canonical URL của một trang.

  • Đăng nhập vào Google Search Console
  • Nhập URL vào ng cụ kiểm tra URL và nhấn Enter
  • Mở phần Coverage của báo cáo
  • Tìm kiếm ‘Canonical do Google chọn
Xác định canonical URL bằng công cụ kiểm tra URL
Xác định canonical URL bằng công cụ kiểm tra URL

Nếu giá trị là ‘URL được kiểm tra’ thì điều này có nghĩa là Canonical URL đã có và giống với URL trang. Nếu là một Canonical URL khác thì nó là URL được ưu tiên hướng tới.

Khi nào nên sử dụng Canonical URL?

Giải quyết vấn đề nội dung trùng lặp

Một trang web thường gặp sự cố trùng lặp nội dung, ngay cả khi bạn không cố ý sao chép nội dung của mình trên các URL khác nhau. Các trường hợp nội dung trùng lặp điển hình bao gồm:

  • Một URL có thể truy cập có hoặc không có www trong URL. Ví dụ:
    https://dmagency.vn/canonical-la-gi http://wdmagency.vn/canonical-la-gi
  • Một URL có thể truy cập bằng cả giao thức HTTP và HTTPS. Ví dụ:
    https://dmagency.vn/canonical-la-gi https://dmagency.vn/canonical-la-gi
  • Các trang có phiên bản ?print=true. Ví dụ: https://dmagency.vn/canonical-la-gi https://dmagency.vn/canonical-la-gi/?print=true
  • Các trang có nội dung giống hệt nhau nhưng các URL khác nhau. Ví dụ:
    https://dmagency.vn/khoa-hoc/khoa-hoc-seo https://dmagency.vn/khoa-hoc-seo

Nội dung trùng lặp trên webite eCommerce 

Các trang danh mục và sản phẩm có cùng nội dung và bộ lọc. Cả hai trang đều là cùng một cái áo sơ mi nhưng có màu sắc khác nhau. Đối với Google, đây được coi là nội dung trùng lặp.

Ví dụ: https://dmagency.vn/san-pham/ao-so-mi/?mau=xanhVàhttps://dmagency.vn/san-pham/ao-so-mi

Trong tất cả các trường hợp trên, việc đặt Canonical URL cho phép bạn báo cho các ng cụ tìm kiếm biết nên đưa URL nào vào kết quả tìm kiếm của họ.

Có cần sử dụng Canonical URL trên các trang có nội dung gốc không?

Có, lý do chính là đó là một cách để bảo vệ nội dung của bạn. Trong trường hợp ai đó sao chép trang web thì Canonical URL sẽ cho các ng cụ tìm kiếm biết nguồn gốc nội dung ở đâu.

Xuất bản nội dung gắn Canonical URL

Khi bạn xuất bản lại hoặc đăng nội dung của mình trên các nền tảng mạng xã hội, ví dụ Bài đăng trên LinkedIn, bạn có thể sử dụng Canonical URL để cho Google biết rằng đây là bản sao của một URL hiện có, bạn cần đảm bảo rằng Google biết nguồn gốc của một bài đăng.

Ví dụ về Canonical URL

Canonical URL là gì?
Canonical URL là gì?

Dưới đây là một ví dụ về cách hoạt động để giúp bạn hiểu cách đặt thẻ Canonical của mình.

Giả sử nội dung của trang này

https://dmagency.vn/khoa-hoc/khoa-hoc-seo

giống trang này

https://dmagency.vn/khoa-hoc-seo và bạn muốn Google lập chỉ mục cái thứ hai.

Trong trường hợp này, bạn cần đặt các Canonical URL của mình như sau:

Trên trang  https://dmagency.vn/khoa-hoc/khoa-hoc-seo Canonical URL phải trỏ đến trang thứ hai, nghĩa là:

<link rel=”canonical” href=”https://dmagency.vn/khoa-hoc-seo”/>

Còn trên trang https://dmagency.vn/khoa-hoc-seo Canonical URL sẽ tự tham chiếu và nó sẽ trỏ đến chính đó:

<link rel=”canonical” href=”https://dmagency.vn/khoa-hoc-seo”/>

Bằng cách này, bạn cho Google biết trang nào cần thêm vào chỉ mục và hiển thị trang đó trong kết quả tìm kiếm.

Nội dung trùng lặp trong các trang danh mục sản phẩm

Đây là một ví dụ khác về thẻ Canonical giúp bạn giải quyết vấn đề nội dung trùng lặp cho các danh mục trang Thương mại điện tử. Giả sử bạn có một trang danh mục hiển thị áo sơ mi với các thuộc tính về màu sắc khác nhau.

Người dùng có thể lọc sản phẩm bằng cách chọn màu từ bộ lọc.

Đây là trang chính: https://dmagency.vn/san-pham/ao-so-mi

Và đây là một trong những trang được tạo khi người dùng chọn màu từ bộ lọc: https://dmagency.vn/san-pham/ao-so-mi/?mau=xanh

Cả hai URL đều có nội dung hoàn toàn giống nhau và điểm khác biệt duy nhất là hình ảnh sản phẩm chỉ hiển thị áo sơ mi có màu xanh. Đây là một ví dụ điển hình của các trang nội dung trùng lặp trên các trang web Thương mại Điện tử.

Trong trường hợp này, bạn cần đặt các Canonical URL như sau:

Trên trang dmagency.vn/san-pham/ao-so-mi/?mau=xanh?mau=xanh, Canonical URL phải trỏ đến trang danh mục chính, nghĩa là

<link rel=”canonical” href=”https://dmagency.vn/san-pham/ao-so-mi/”/>

Trên trang dmagency.vn/san-pham/ao-so-mi/Canonical URL sẽ tự tham chiếu, nghĩa là nó sẽ trỏ đến chính trang đó.

<link rel=”canonical” href=” https://dmagency.vn/san-pham/ao-so-mi/”/>

Yêu cầu chung về Canonical URL

Khi tối ưu canonical URL, bạn cần lưu ý đến một số yêu cầu chung như sau:

  1. Mỗi trang phải có một Canonical URL trỏ đến chính nó hoặc một URL khác.
  2. Chỉ được có một Canonical URL trên mỗi trang.
  3. Thẻ Canonical được đặt trong HEAD của trang.
  4. URL được chỉ định trong thẻ rel=”canonical” phải hợp lệ
  5. URL được chỉ định trong thẻ rel=”canonical” không được có thuộc tính “noindex”.
  6. Tránh trỏ Canonical URL tới một trang có thẻ Canonical khác. Điều này sẽ tạo vòng lặp và gây nhầm lẫn cho trình thu thập thông tin.
  7. Sử dụng Canonical khi các trang có nội dung trùng lặp hoặc tương tự. Không sử dụng thẻ Canonical trên các trang có nội dung khác (Trường hợp này  thìnên sử dụng chuyển hướng 301).
  8. Canonical URL phải trỏ đến các trang trong cùng một ngôn ngữ. Đối với các trang web đa ngôn ngữ, bạn có thể sử dụng thuộc tính “href lang” để chỉ định các phiên bản khác nhau.
  9. Trang chủ phải có một Canonical xác định là Preferred Domain.
  10. Tất cả các Canonical URL phải cùng định dạng với trang chủ.
  11. Nếu bạn đã bật Tăng tốc dành cho thiết bị di động (AMP), hãy kiểm tra xem Canonical URL có trỏ đến trang không phải là AMP hay không.

Một số lưu ý khi sử dụng thẻ Canonical

Bạn cần xem xét một số điều quan trọng sau đây khi sử dụng canonical URL:

Thẻ canonical có thể tự tham chiếu

Thẻ canonical có thể dẫn đến URL hiện tại. Ví dụ: Nếu các URL X, Y và Z bị trùng lặp và X là đường link chuẩn, bạn có thể đặt thẻ canonical đến X trên chính URL X.

Chủ động sử dụng Canonical URL cho trang chủ của bạn

Việc trang chủ bị trùng lặp diễn ra rất thường xuyên và mọi người có thể liên kết đến trang chủ theo nhiều cách. Do đó, bạn nên đặt thẻ canonical trên URL trang chủ để ngăn chặn các sự cố không mong muốn.

Kiểm tra các thẻ canonical động

Đôi khi các code không hợp lệ có thể khiến hệ thống viết thẻ canonical khác nhau cho mọi phiên bản của URL (hoàn toàn thiếu toàn bộ điểm của thẻ chuẩn). Bạn cần đảm bảo kiểm tra ngay các URL, đặc biệt là trên các trang web thương mại điện tử và CMS.

Tránh tín hiệu gây nhiễu cho canonical URL

Các công cụ tìm kiếm có thể xác định nhầm lẫn một thẻ canonical hoặc giải thích nó không chính xác nếu bạn gửi các tín hiệu gây nhiễu. Hay nói đơn giản hơn là bạn không nên gắn thẻ canonical đến trang B cho trang A, rồi lại gắn thẻ canonical đến trang A cho trang B.

Tương tự, bạn cũng không nên triển khai thẻ canonical từ trang A đến trang B rồi lại sử dụng redirect 301 từ trang B đến trang A. Đồng thời gắn thẻ canonical theo dạng chuỗi như từ trang A đến trang B, trang B đến trang C cũng cần tránh. 

Cẩn thận khi gắn thẻ cho các bản sao gần giống nhau

Bạn có thể gắn thẻ canonical trên các trang trùng lặp hoặc các trang có nội dung giống nhau, nhưng hãy tiến hành cẩn thận. Ví dụ như trang sản phẩm chỉ khác nhau về đơn vị tiền tệ, vị trí hoặc một số thuộc tính sản phẩm. Hãy nhớ rằng các phiên bản không chuẩn của trang đó có thể không đủ điều kiện để xếp hạng. Hoặc nếu các trang quá khác nhau thì công cụ tìm kiếm cũng sẽ bỏ qua thẻ.

Sự khác biệt giữa thẻ Canonical và Chuyển hướng 301?

Khi bạn đặt chuyển hướng 301, người dùng không nhìn thấy trang nguồn mà chỉ nhìn thấy trang đích. Trong trường hợp thẻ Canonical, người dùng vẫn có thể xem cả hai trang, nhưng các ng cụ tìm kiếm được yêu cầu không xem xét một trong hai trang.

Trong cả hai trường hợp trên thì các liên kết ngược được đều được hợp nhất vào trang đích. Theo nguyên tắc chung, hãy sử dụng Canonical URL khi bạn vẫn muốn giữ trang đó với mục đích điều hướng bot và sử dụng 301 khi bạn muốn điều hướng người dùng xem thẳng trang đích.

Chuyển hướng 301
Chuyển hướng 301

Ưu điểm của việc sử dụng Thẻ Canonical cho SEO

Khi nói đến SEO, Canonical URL có những ưu điểm sau:

  • Cho phép bạn xác định Preferred Domain của mình. Trước đây, thực hiện được thông qua Google Search Console nhưng bây giờ cách duy nhất để cho các ng cụ tìm kiếm biết Preferred Domain là thông qua thẻ Canonical.
  • Cho phép bạn xác định phiên bản nào của trang mà bạn muốn đưa vào kết quả tìm kiếm.
  • Cải thiện PageRank bằng cách hợp nhất các URL.
  • Nó bảo vệ PageRank khi bị các trang web khác ăn cắp nội dung.
  • Là một cách tuyệt vời để tối ưu dung lượng thu thập dữ liệu của bạn vì tránh thu thập dữ liệu các trang có nội dung trùng lặp.

Làm cách nào để đặt Canonical URL với WordPress?

Cách dễ nhất là sử dụng plugin Yoast SEO. Khi bạn kích hoạt Yoast SEO, nó sẽ tự động thêm Canonical URL cho tất cả các trang.

Để thay đổi Canonical URL của một trang hoặc bài đăng, hãy chỉnh sửa trang cụ thể và nhấp vào Nâng cao và đặt lại Canonical URL.

Đặt canonical URL bằng plugin Yoast SEO
Đặt canonical URL bằng plugin Yoast SEO

Làm cách nào để đặt Canonical URL trong CMS?

Đối với các trang web không phải WordPress, bạn cần thêm vào phần HEAD của tất cả các trang một thuộc tính liên kết có định dạng sau: <link rel=”canonical” href=”CANONICAL-URL”/>

Thay thế Canonical URL bằng URL của trang mà bạn muốn trỏ tới. Đây có thể là cùng một trang hoặc URL trang khác hoặc tới một tên miền khác (cross-domain canonical).

Ví dụ về canonical URL trong CMS
Ví dụ về canonical URL trong CMS

 

KẾT LUẬN

Mọi trang trên website của bạn cần phải có một thẻ Canonical và thông qua bài viết trên, Digital Marketing DMA hy vọng bạn đã hiểu rõ Canonical URL là gì. Lưu ý rằng canonical URL phải trỏ đến chính nó hoặc một URL hợp lệ trên trang web của bạn. Nếu bạn dùng WordPress, hãy cài đặt plugin Yoast SEO để tự động đặt các thẻ self-referencing Canonical, sau đó truy cập từng trang riêng lẻ và thay đổi Canonical URL nếu cần. Nếu bạn có một trang dạng Thương mại điện tử, hãy đảm bảo rằng mọi url thuộc tính được tạo động đều có Canonical URL trỏ đến các trang chính trên trang web của bạn

 

Liên hệ SEO

✅ Dịch vụ SEO ⭐ SEO tổng thể, SEO từ khóa
✅ Giá SEO ⭕ Rẻ nhất thị trường
✅ Thời gian SEO ⭐ 8 – 12 tháng.
✅ Từ khóa ⭕ Top 1-3, 1-5, 1-7, 1-10
✅ Cam kết ⭐ An toàn và bền vững
✅ Chuyển đổi ⭕ Tối ưu cao nhất

 

Câu hỏi thường gặp về Canonical URL

  1. Canonical URL là gì và tại sao nó quan trọng trong SEO?
    Canonical URL là một thẻ HTML hoặc phần header cho biết URL chính thức của một trang web. Nó quan trọng trong SEO để xác định trang chính và tránh nội dung trùng lặp.
  2. Khi nào chúng ta cần sử dụng canonical URL?
    Khi có nhiều phiên bản của cùng một nội dung trên nhiều URL khác nhau. Điều này giúp tập trung giá trị SEO vào một URL duy nhất.
  3. Làm thế nào để thiết lập canonical URL cho trang web của mình?
    Để thiết lập canonical URL, bạn cần thêm thẻ <link rel=”canonical” href=”URL_chinh”/> vào phần header của trang web.
  4. Có những trường hợp nào mà chúng ta không nên sử dụng canonical URL?
    Không nên sử dụng canonical URL khi nội dung trên các trang khác nhau là duy nhất và không có nội dung tương đương.
  5. Làm thế nào để kiểm tra xem canonical URL đã được thiết lập đúng hay chưa?
    Xem mã nguồn trang web hoặc sử dụng các công cụ kiểm tra SEO trực tuyến.

 

CHÚC CÁC BẠN THÀNH CÔNG!

Để lại một bình luận