File robots.txt có 3 mục chính
- User-agent:* chỉ định và cho phép các công cụ tìm kiếm vào index website bạn. Nên để chế độ * để cho phép tất cả các công cụ vào web
- Allow: cho phép công cụ tìm kiếm vào các thư mục đc chỉ định
- Disallow: /folder : ngăn chặn công cụ tìm kiếm vào các thư mục quan trọng mà bạn cảm thấy không cần lên google VD: tôi không muốn robots tìm kiếm vào thư mục image thì tôi sẽ đặt giá trị là : Disallow:/image/
- Sitemap: bạn có thể để đường dẫn site map của bạn ở đây, cái này có cũng được không cũng đc, vì trong phần thiết lập của Google webmastertool có phần đẩy sitemap lên cho google rồi
Ngoài ra bạn có thể tạo file robots.txt tại đây :http://www.mcanerin.com/en/search-engine/robots-txt.asp