Apa Itu Sitemap dan Robots.txt?
Sitemap dan robots.txt adalah dua file teknis yang membantu mesin pencari memahami dan mengakses website Anda dengan lebih efisien. Meskipun pengunjung tidak pernah melihat file-file ini, keduanya memainkan peran penting dalam SEO teknis.
Sitemap adalah peta website Anda yang memberitahu Google halaman-halaman apa saja yang ada dan mana yang paling penting.
Robots.txt adalah instruksi untuk crawler mesin pencari tentang halaman mana yang boleh dan tidak boleh diakses.
---
Sitemap XML: Peta untuk Google
Apa Fungsinya?
Sitemap XML membantu Google:
- Menemukan halaman baru lebih cepat
- Memahami struktur website
- Mengetahui kapan halaman terakhir diupdate
- Memahami prioritas relatif antar halaman
Kapan Sitemap Sangat Penting?
- Website baru (belum banyak backlink)
- Website besar (ratusan halaman)
- Website dengan banyak halaman yang tidak terlink dengan baik
- Website yang sering update konten
Struktur Sitemap XML
Setiap entry dalam sitemap berisi:
- loc: URL halaman
- lastmod: tanggal terakhir dimodifikasi
- changefreq: seberapa sering halaman berubah
- priority: prioritas relatif (0.0 - 1.0)
Best Practices Sitemap
1. Hanya masukkan halaman yang ingin diindex
2. Update lastmod hanya ketika konten benar-benar berubah
3. Jangan masukkan halaman yang di-noindex
4. Maksimal 50.000 URL per sitemap
5. Submit sitemap di Google Search Console
6. Referensikan sitemap di robots.txt
---
Robots.txt: Instruksi untuk Crawler
Apa Fungsinya?
Robots.txt memberitahu crawler mesin pencari:
- Halaman atau direktori mana yang tidak boleh di-crawl
- Di mana sitemap berada
- Crawl delay (jika diperlukan)
Kapan Perlu Memblokir Crawler?
- Halaman admin atau dashboard
- Halaman duplikat (print versions, parameter URLs)
- Halaman staging atau development
- File yang tidak perlu diindex (CSS, JS tertentu)
- Halaman dengan konten sensitif
Penting: Robots.txt Bukan Security
Robots.txt hanya instruksi, bukan pagar. Crawler yang baik (Googlebot) akan mematuhi, tapi crawler jahat bisa mengabaikannya. Jangan gunakan robots.txt untuk menyembunyikan konten sensitif.
---
Implementasi untuk Website Bisnis
Sitemap yang Ideal untuk Company Profile
Halaman yang harus ada di sitemap:
- Homepage (priority: 1.0)
- Halaman layanan (priority: 0.8)
- Halaman portofolio (priority: 0.7)
- Blog posts (priority: 0.6)
- Halaman kontak (priority: 0.5)
- Halaman about (priority: 0.5)
Halaman yang TIDAK perlu di sitemap:
- Thank you pages
- Halaman admin
- Halaman dengan parameter URL
- Halaman redirect
Robots.txt yang Ideal
Yang perlu diblokir:
- /admin/ (halaman admin)
- /api/ (API endpoints)
- /_next/ (Next.js internal files)
- File yang tidak perlu diindex
Yang perlu diizinkan:
- Semua halaman publik
- Gambar (agar bisa muncul di Google Images)
- CSS dan JS (agar Google bisa render halaman)
---
Cara Submit Sitemap ke Google
1. Via Google Search Console
- Login ke Search Console
- Pilih property website
- Klik Sitemaps di menu kiri
- Masukkan URL sitemap
- Klik Submit
2. Via Robots.txt
Tambahkan baris di robots.txt:
Sitemap: https://namawebsite.com/sitemap.xml
---
Monitoring dan Troubleshooting
Cek di Google Search Console
- Berapa halaman yang submitted vs indexed
- Apakah ada errors
- Coverage issues
Common Issues
- Sitemap berisi URL yang di-noindex (konflik)
- Robots.txt memblokir halaman yang ada di sitemap (konflik)
- Sitemap tidak diupdate saat ada halaman baru
- URL di sitemap return 404
---
Kesimpulan
Sitemap dan robots.txt adalah fondasi SEO teknis yang sering diabaikan. Implementasi yang benar membantu Google menemukan dan mengindex halaman Anda lebih efisien. Pastikan sitemap selalu up-to-date, robots.txt tidak memblokir halaman penting, dan monitor secara berkala di Google Search Console.
Butuh website yang lebih siap ranking?
Lander Creative membantu bisnis membangun website, landing page, company profile, dan optimasi SEO dasar agar lebih mudah ditemukan dan lebih siap menghasilkan leads.