Sitemap là gì? Cách tạo sitemap và khai báo với Google

sitemap là gì

Table of Contents

Liệu bạn đã hiểu rõ về Sitemap là gì, cách tạo Sitemap trên website hay tầm quan trọng của nó đối với SEO chưa,… hãy cùng Ematic Solutions tìm hiểu chi tiết với bài viết dưới đây nhé! 

1. Sitemap là gì? 

Sitemap (bản đồ trang web hoặc sơ đồ trang web) chứa danh sách các URL. Sitemap giúp các công cụ tìm kiếm như: Bing, Google,…thu thập thông tin, dữ liệu, hiểu cấu trúc của trang web của bạn và index các trang một cách hiệu quả. 

Ngoài ra, sơ đồ cũng cho các công cụ tìm kiếm biết những trang nào quan trọng trên website và cung cấp thông tin chính xác hơn cho người tìm kiếm 

Sitemap là gì? 

1.1 HTML sitemap

  • Cấu trúc: HTML sitemap thường có các phần tử HTML như <html>, <head>, <title>, <body>, và các phần tử khác như <h1>, <ul>, <li>, và <a> để hiển thị nội dung và liên kết URL trong từng phần hay từng trang khác nhau của Blog hay Website.
  • Thứ tự: URL được sắp xếp theo thứ tự mục và tuân thủ theo cấu trúc của trang web. Ví dụ phần tử <head> thường đứng trước phần tử <body>
  • Đối tượng: HTML sitemap thường giúp người dùng dễ hiểu và tìm được thông tin dễ dàng.
HTML sitemap

1.2 XML sitemap

  • Cấu trúc: XML sitemap thường có các phần tử <urlset>, <url> <priority> được hiển thị danh sách URL của Blog hay Website theo chuẩn XML. 
  • Thứ tự: Thứ tự các phần tử trong sơ đồ XML thường được quy định bởi quy định của ngôn ngữ XML
  • Đối tượng: XML sitemap thường được sử dụng để truyền dữ liệu giữa các ứng dụng và hệ thống máy tính, ví dụ như giữa trang web và các công cụ tìm kiếm.
XML sitemap

1.3 Định dạng

  • Sitemap Index: Dùng để chỉ đường dẫn đến tập hợp các sơ đồ (sitemap) khác. Thường được đặt trong file robots.txt để máy tìm kiếm có thể dễ dàng tìm thấy.
  • Sitemap-category.xml: Tập hợp các URL của cấu trúc danh mục trên trang web.
  • Sitemap-products.xml: Chứa các URL của các sản phẩm trên trang web.
  • Sitemap-articles.xml: Chứa các URL của các bài viết trên trang web.
  • Sitemap-tags.xml: Chứa các URL của các thẻ (tags) trên trang web.
  • Sitemap-video.xml: Chứa các URL của các video trên trang web.
  • Sitemap-image.xml: Chứa các URL của các hình ảnh trên trang web

2. Tại sao Sitemap lại quan trọng đối với SEO 

  • Tăng trải nghiệm người dùng: Sitemap sẽ cung cấp cái nhìn tổng quan về cấu trúc của trang web, bao gồm các trang, danh mục, sản phẩm, bài viết, và các liên kết khác. Điều này giúp các Google hiểu rõ hơn cấu trúc trang web, từ đó nâng cao trải nghiệm và thu hút người dùng hơn. 
  • Hỗ trợ index các trang web mới: Bằng cách cung cấp Sitemap, bạn có thể ưu tiên cho các URL quan trọng hơn để được index. Điều này đặc biệt có lợi cho SEO đối với các trang mới, trang có rất ít liên kết ngược. 
  • Dễ theo dõi hiệu suất: Sitemap cho phép bạn theo dõi hiệu suất của trang web bằng cách xem số lượng URL đã được index. 

>> Xem thêm: SEO Onpage vs SEO Offpage: Đâu mới quan trọng

3. Cách tạo Sitemap cho website WordPress

Trường hợp bạn có tài khoản WordPress, bạn có thể sử dụng 2 plugin dưới đây để tạo Sitemap: 

  • Yoast SEO
  • Google XML Sitemaps 

Cách 1: Sử dụng Yoast SEO 

Yoast SEO là một plugin WordPress phổ biến được sử dụng để tối ưu hóa công việc SEO cho các trang web WordPress. Plugin này cung cấp các tính năng đa dạng giúp người dùng tối ưu hóa nội dung trang web của họ để tăng khả năng xuất hiện trên các công cụ tìm kiếm như Google. 

  • Bước 1: Cài đặt và kích hoạt Yoast SEO
Bước 1: Cài đặt và kích hoạt Yoast SEO
  • Bước 2: Thiết lập các trang 

Sau khi kích hoạt, chọn Yoast SEO -> Dashboard

Bước 2: Thiết lập các trang 

Chọn Features -> Advanced setting pages -> chuyển sang Enabled để kích hoạt tính năng chỉnh sửa nâng cao

Kích hoạt tính năng chỉnh sửa nâng cao
  • Bước 3: Kích hoạt XML Sitemap

Chọn sitemap XML mới xuất hiện trong thanh điều khiển.

Chuyển sang Enabled để bật sitemap XML. Trong phần này, bạn có thể chỉnh sửa tệp sitemap xml

Nếu bạn đang sử dụng một trang web bình thường không có yêu cầu đặc biệt, bạn không cần phải điều chỉnh bất cứ điều gì.

  • Bước 4: Kiểm tra

Cách 2: Sử dụng plugin Google XML Sitemaps 

  • Bước 1: Cài đặt và kích hoạt Google XML Sitemaps
Bước 1: Cài đặt và kích hoạt Google XML Sitemaps
  • Bước 2: Thiết lập XML Sitemaps
  • Bước 3: Hoàn tất quá trình 

Sau khi thiết lập xong, hãy xem lại sitemap XML mà plugin đã tạo cho trang web. 

Xem lại sitemap XML mà plugin đã tạo cho trang web

4. Cách khai báo Sitemap tới GSC 

 Logo Google Search Console

Để submit Sitemap đến Google bạn cần phải sử dụng công cụ GCS để thao tác.

Bước 1: Truy cập vào tài khoản Google Search Console đã xác minh quyền sở hữu tên miền website của bạn.

Truy cập vào tài khoản Google Search Console đã xác minh quyền sở hữu tên miền website của bạn.

Bước 2: Trong Menu bên trái -> Chọn mục Sitemaps hoặc Sơ đồ trang mới 

Bước 3: Nhập đoạn URL dẫn đến sitemap (thường là sitemap.xml) -> Submit

Submit Sitemap

Bước 3: Sau khi submit, Google sẽ crawl toàn bộ website theo sitemap

Nếu không có lỗi, thì sẽ thông báo trạng thái thành công

Nếu gặp lỗi trong quá trình submit thì GSC sẽ thông báo các lỗi phát hiện được để bạn có thể chỉnh sửa và submit lại.

Sau khi đã thêm Sitemap, bạn có thể quản lý và theo dõi hiệu suất của trang web trong GSC.

>>Xem thêm: Hướng dẫn Submit URL Lên Google Chuẩn và Nhanh Chóng

5. Một số lưu ý khi tối ưu Sitemap 

5.1 Nên ưu tiên các trang chất lượng cao trong Sitemap 

Chất lượng website đóng vai trò quan trọng trong việc xếp hạng trên kết quả tìm kiếm của Google. Do đó, nếu Sitemap chứa nhiều trang không đạt chất lượng, sẽ ảnh hưởng đến toàn bộ chất lượng website. Vì thế hãy hướng con bots đến những trang quan trọng, chất lượng của website. 

5.2 Tối ưu canonical của URl trong Sitemap 

Google không thích nhiều trang có cùng một nội dung, điều này có thể làm giảm giá trị của trang web trong kết quả tìm kiếm. Bạn có thể sử dụng tag “link rel=canonical” để Google biết trang nào là trang chính, từ đó dễ thu thập thông tin và index nhanh hơn. 

5.3 Sử dụng meta robot hoặc robots.txt 

Tag meta robot

  • Khi bạn sử dụng tag Robots Meta như noindex, follow, bạn đang chỉ định cho các công cụ tìm kiếm biết rằng họ không nên lập chỉ mục trang đó trong kết quả tìm kiếm (noindex), nhưng vẫn nên theo các liên kết có trên trang (follow).
  • Điều này giúp tránh việc Google index trang những vẫn bảo toàn giá trị liên liên kết các trang quan trọng nhưng không xuất hiện trong kết quả tìm kiếm. 

Tệp robots.txt:

  • Tệp robots.txt thường được sử dụng để chỉ định cho các robot không nên truy cập vào các phần cụ thể của trang web. Điều này có thể gây ra các vấn đề liên quan đến việc lập chỉ mục và giá trị liên kết.
  • Khi bạn sử dụng robots.txt để chặn trang, nó sẽ ngăn các robot truy cập vào trang hoàn toàn, không chỉ ngăn chúng lập chỉ mục trang. Điều này có thể dẫn đến việc mất giá trị liên kết mà trang có thể mang lại.

5.4 Không được chèn URL “nonindex” vào Sitemap 

Không muốn thu thập và lập chỉ mục một URL nào đó, nên loại bỏ nó khỏi Sitemap. Bao gồm các trang không được index trong Sitemap không chỉ là lãng phí ngân sách thu thập thông tin mà còn gây hiểu lầm về sự quan trọng của các trang trong trang web của bạn.

5.5 Nên cập nhật thời gian sửa đổi khi có thay đổi quan trọng 

Việc thay đổi ngày sửa đổi mà không có nội dung mới sẽ không mang lại lợi ích gì và có thể khiến Google xóa ngày đăng tải của bạn. Điều này xảy ra khi Google phát hiện các trang được cập nhật liên tục mà không có thêm giá trị mới. Vì vậy, hãy chỉ cập nhật thời gian sửa đổi khi bạn thực sự thay đổi nội dung của trang.

5.6 Giữ kích thước tệp càng nhỏ càng tốt

Mặc dù Google và Bing đã tăng dung lượng tối đa cho file Sitemap lên 50 MB từ năm 2016, nhưng việc giữ Sitemap gọn gàng vẫn là lựa chọn tốt để đảm bảo ưu tiên cho các trang chính của bạn. 

Điều này giúp tăng hiệu suất và giảm thời gian tải của trang web, đồng thời làm giảm áp lực đối với máy chủ của bạn.

5.7 Tạo Sitemap XML động cho các trang web lớn 

Việc tạo XML Sitemap động cho các trang web lớn là một phương pháp hiệu quả để quản lý và duy trì sitemap một cách tự động. Thay vì kiểm soát từng URL một cách thủ công, bạn nên sử dụng các quy tắc tự động để xác định xem một trang nào sẽ được bao gồm trong XML Sitemap và khi nào nó sẽ được thêm vào hoặc chuyển từ trạng thái ‘noindex’ sang ‘index, follow’.

Có nhiều công cụ và framework hỗ trợ việc tạo XML Sitemap động một cách dễ dàng và hiệu quả. Một số công cụ phổ biến bao gồm: Yoast SEO plugin, Screaming Frog, Google Sitemap Generator,…

>>Xem thêm: SEO Website là gì? Vì sao website cần chuẩn SEO

Facebook
LinkedIn
Twitter
WhatsApp
Email
sitemap là gì

để nhận được những xu hướng mới nhất!

mau-email-marketing-thu-hut
Top 5 mẫu Email Marketing phổ biến và những tiêu chí cần biết

Email Marketing là công cụ không thể thiếu trong chiến lược tiếp thị số của mọi doanh nghiệp. Một mẫu email thiết kế chuyên nghiệp không chỉ giúp truyền tải thông điệp mà còn là chìa khóa tạo ấn tượng mạnh và thúc đẩy tương tác với khách hàng. Hãy cùng Ematic Solutions tìm hiểu về Những tiêu chí cần biết để xây dựng mẫu Email Marketing thu hút và ví dụ 5 mẫu phổ biến nhất qua bài viết sau đây.

Đọc thêm »
core-web-vitals-la-gi
Core Web Vitals là gì? Các chỉ số cải thiện thứ hạng website

Trong bối cảnh Google ngày càng đặt nặng trải nghiệm người dùng, Core Web Vitals trở thành tiêu chí cốt lõi giúp xếp hạng trang web. Nếu bạn muốn website vượt qua đối thủ, Core Web Vitals chính là yếu tố không thể bỏ qua. Cùng Ematic Solutions khám phá những kiến thức chi tiết về Core Web Vitals và hướng dẫn cách tối ưu trang web hữu ích nhé.

Đọc thêm »
goog-dhwhuh-dư
Hiểu thêm về thẻ Canonical: Bí quyết tối ưu SEO với nội dung đồng nhất

Trong lĩnh vực tối ưu hóa công cụ tìm kiếm (SEO), duy trì sự đồng nhất nội dung trên các trang web là điều cực kỳ quan trọng. Khi các trang web ngày càng phức tạp và quy mô lớn hơn, việc đảm bảo rằng các công cụ tìm kiếm có thể lập chỉ mục và xếp hạng nội dung một cách chính xác trở thành một thách thức. Đây là lúc thẻ canonical phát huy vai trò quan trọng – một công cụ mạnh mẽ giúp quản trị viên web và chuyên gia SEO giải quyết vấn đề nội dung trùng lặp và cải thiện hiệu suất trang web.Vậy Thẻ Canonical là gì? Hãy cùng Ematic Solutions tìm hiểu thêm về thẻ Canonical và bí quyết tối ưu SEO với nội dung đồng nhất. 

Đọc thêm »
google-pagespeed-insights
Google PageSpeed Insights là gì?

Trong thế giới số hiện nay, hiệu suất website đóng vai trò quan trọng trong trải nghiệm người dùng và xếp hạng trên công cụ tìm kiếm. Google PageSpeed Insights (PSI) là một công cụ mạnh mẽ giúp các chủ website và nhà phát triển đánh giá và cải thiện tốc độ tải trang của website. Hãy cùng Ematic Solutions tìm hiểu sâu hơn về PageSpeed Insights, cách công cụ này hoạt động và tại sao nó lại quan trọng trong việc đóng góp vào sự thành công của website.

Đọc thêm »
serp-la-gi
SERP là gì? Các loại SERP phổ biến giúp website dễ lên TOP đầu

SERP là gì? Đây là câu hỏi được nhiều người làm trong lĩnh vực SEO và Digital Marketing quan tâm bởi SERP đóng vai trò quan trọng trong việc xác định thứ hạng website trên công cụ tìm kiếm. Việc hiểu rõ các loại SERP phổ biến không chỉ giúp bạn tối ưu hóa nội dung hiệu quả mà còn nâng cao khả năng đưa website lên TOP đầu một cách bền vững. Vì thế, hãy cùng Ematic Solutions khám phá các loại SERP và cách tối ưu chúng để đạt được hiệu quả SEO tốt nhất!

Đọc thêm »
organic-search
Organic search là gì? Làm thế nào để tăng traffic cho website?

Với sự phát triển không ngừng của SEO, việc hiểu và tối ưu hóa organic search đang trở thành yếu tố then chốt cho các doanh nghiệp. Vậy Organic search là gì? Làm thế nào để tăng chỉ số Organic search cho website? Hãy cùng Ematic Solutions tìm hiểu sâu hơn về khái niệm Organic search và những cách để tối ưu chỉ số organic search cho website của bạn.

Đọc thêm »