您的位置：首页 > 教程笔记 > 综合教程

控制搜索引擎爬虫行为的HTML元标签（meta标签）

2025-12-20 09:07:25 综合教程 159

各部分含义：
<meta name="robots" content="index, follow">

name="robots" - 指定这个指令是针对所有搜索引擎爬虫的

也可以针对特定爬虫，如 name="googlebot"

content="index, follow" - 包含两个指令，用逗号分隔：

index：允许搜索引擎将本页收录到搜索结果中

follow：允许搜索引擎跟踪本页上的链接

常见指令组合：
index, follow ✅ - 默认值，允许收录和跟踪链接（通常不需要特意声明）

noindex, nofollow ❌ - 禁止收录且不跟踪链接

noindex, follow - 不收录但跟踪链接

index, nofollow - 收录但不跟踪链接

实际应用场景：
html

<meta name="robots" content="index, follow">

<meta name="robots" content="noindex, nofollow">

<meta name="googlebot" content="noindex">
重要说明：
大多数情况下，如果您希望页面被搜索引擎收录，不需要特意添加这个标签，因为 index, follow 是默认行为。

这个标签只是建议，搜索引擎可能选择不遵循，但主流搜索引擎通常都会尊重。

这是对 robots.txt 文件的补充，但优先级更高。

常用于：

临时禁止收录（如测试页面）

控制重复内容

保护隐私页面

避免低质量页面被收录

这个标签是SEO（搜索引擎优化）的重要工具，帮助网站管理员控制搜索引擎如何对待网页内容。

#meta标签

点赞收藏

声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至201542412@QQ.com举报，一经查实，本站将立刻删除。