您的位置:首页 > 教程笔记 > 综合教程

控制搜索引擎爬虫行为的HTML元标签(meta标签)

2025-12-20 09:07:25 综合教程 152

各部分含义:
<meta name="robots" content="index, follow">

<meta> - HTML元标签,用于提供网页的元数据(关于网页的信息)

name="robots" - 指定这个指令是针对所有搜索引擎爬虫的

也可以针对特定爬虫,如 name="googlebot"

content="index, follow" - 包含两个指令,用逗号分隔:

index:允许搜索引擎将本页收录到搜索结果中

follow:允许搜索引擎跟踪本页上的链接

常见指令组合:
index, follow ✅ - 默认值,允许收录和跟踪链接(通常不需要特意声明)

noindex, nofollow ❌ - 禁止收录且不跟踪链接

noindex, follow - 不收录但跟踪链接

index, nofollow - 收录但不跟踪链接

实际应用场景:
html
<!-- 允许所有搜索引擎收录和跟踪链接 -->
<meta name="robots" content="index, follow">

<!-- 禁止所有搜索引擎收录且不跟踪链接 -->
<meta name="robots" content="noindex, nofollow">

<!-- 仅禁止Google收录,其他搜索引擎可以 -->
<meta name="googlebot" content="noindex">
重要说明:
大多数情况下,如果您希望页面被搜索引擎收录,不需要特意添加这个标签,因为 index, follow 是默认行为。

这个标签只是建议,搜索引擎可能选择不遵循,但主流搜索引擎通常都会尊重。

这是对 robots.txt 文件的补充,但优先级更高。

常用于:

临时禁止收录(如测试页面)

控制重复内容

保护隐私页面

避免低质量页面被收录

这个标签是SEO(搜索引擎优化)的重要工具,帮助网站管理员控制搜索引擎如何对待网页内容。

相关推荐

  • Meta标签是否还有用

    Meta标签是否还有用

    M标签指的是网页HTML文件里面的一些文件标签。其中最重要的是:标题标签Titlg,描述标签Dscriptiong和关键词标签Kywordg。其他比如象作者,软件版本等等,可以不用管了,在网站优化当中,没有什么价值。当然,其他标签也不妨碍什么。你愿意的话,可以放上你想放的信息

    综合教程 2020-03-31 13:28:56 37