Sitemap可以增加您的网路商店被搜寻引擎搜索到的机会,同时特别设计成可寻找被网路爬虫忽略的页面。Sitemap也可以设置为能够索引所有页面和图片。
当启用Sitemap时,Magento会建立一个叫sitemap.xml的档案保存到安装的根目录。该配置使你能够设置更新的频率和每种内容的优先权。而你的sitemap应该按照网站上的内容进行更新(可能每天、每周、每月)。
当网站进行开发中时,你可能会放入网路爬虫的指令来避免网站被搜索到,记得上线前更改指令来允许网站被索引。
步骤一:设置并启用Sitemap
首先在左边管理列中导入Store>Configuration
接着选取Catalog区块里的XML Sitemap
各类别里的配置页面皆可展开选项来根据你的需求做设置
您除了可以对目录、产品、CMS做频率和优先顺序之设置外,甚至能将产品及图像包含到sitemap中。
在“生成设置”中,您可以启动Sitemap,并设置它的时间与频率。
在“Sitemap File Limits”部分中,您可以选择每个文件的URL限制和文件的最大大小(单位:bytes)。若您想藉由robots.txt的指令好让搜寻引擎找到你的网站,则将Enable Submission to Robots.txt选项设置为Yes。
步骤二:设置并启用robot.xml
- 在管理栏位选择Store>Settings>Configuration.
- 在General下拉栏位处选择Design
- 展开Searchn Engine Robots栏位后照着以下步骤进行
a.设定Robot预设值
INDEX, FOLLOW:命令网页抓取工具对网站进行索引并在更动之后做查看
NOINDEX, FOLLOW :命令网页抓取工具对网站停止索引,但会之后检查或更动
INDEX, NOFOLLOW:命令网页抓取工具对网站进行一次索引,但更动后不再做检查
NOINDEX, NOFOLLOW:命令网页抓取工具对网站停止索引,并未来不再做检查更动
b.若有需要,将自定义指令输入到robot.xml文件的编辑自定义指令中,例:当你的网站正在开发中时,可能会希望禁止外界造访你的网站
c.若要恢复成预设指令,按Reset to Default
4.完成后按Save Config
步骤三:提交sitemap给搜寻引擎
你可以藉由提供Magento安装的根目录的sitemap.xml的档案连结来将你的sitemap提交给不同搜寻引擎。以下是两个最大搜寻引擎的指令资讯:
Google: https://support.google.com/webmasters/answer/183669?hl=en
Microsoft Bing: https://www.bing.com/webmaster/help/how-to-submit-sitemaps-82a15bd4
步骤四:恢复先前的Robot指令
最后你可以选择恢复成最原始状态或预设限制