当您在Google上搜索某些内容时,结果通常是HTML格式页面-您每天看到的正常网页。
但是,Google也可以显示非HTML格式文件,例如Pdf,电子表格,演示文稿和Adobe文件。
如何按文件类型搜索Google
使用"filetype:"搜索运算符将搜索范围缩小到特定的文件类型。
例如,搜索"filetype:pdf格式 health"将显示包含单词"health"的PDF文件。”

搜索"文件类型:ppt旅行"将显示与旅行相关的演示文稿。

谷歌可以显示这些结果,因为它可以爬网和索引多种类型的文件。
Google上提供的文件类型
下表显示了您可以在Google上找到的文件类型:
格式 | 文件扩展名 |
Adobe可移植文档格式 | pdf格式 |
Adobe PostScript的 | ps |
Autodesk设计网页格式 | dwf |
谷歌地球 | kml,kmz |
GPS交换格式 | [医]gpx |
汉考姆汉语拼音 | hwp |
HTML格式 | htm,html |
微软Excel | xls,xlsx |
微软PowerPoint | ppt,pptx |
微软Word | doc,docx |
OpenOffice演示文稿 | odp |
OpenOffice电子表格 | ods |
OpenOffice文本 | 奥德特 |
富文本格式 | rtf |
可伸缩矢量图形 | svg技术 |
TeX/乳胶 | 特克斯 |
文本 | txt脧脗脭脴 |
基本源代码 | bas |
C/C++源代码 | c,cc,cpp,cxx,h,hpp |
C#源代码 | cs |
Java源代码 | java语言 |
Perl源代码 | pl |
Python源代码 | py |
无线标记语言 | wml,wap |
XML | xml |
Google支持各种搜索运算符来查找这些文件类型。
什么是搜索运算符?
搜索运算符是帮助您优化Google搜索的特殊命令。
例如,"site:"将结果限制为特定网站。 像"这样的查询site:semrush.com SEO"只显示来自semrush.com...

确保您的文件在Google中编入索引
如果您有不同文件类型的内容(例如xls、pdf格式、ppt等)。),你想出现在谷歌搜索结果中,你需要确保谷歌可以抓取和索引它们。
Google无法索引被X-机器人-标签noindex指令. 如果您发布PDF,XLS,PPT或其他文件类型,请检查Google是否可以抓取并索引它们。
使用Semrush的现场审核工具,看看是否有任何重要的文件被错误noindexed:
1. 打开站点审核,输入您的域,然后单击"开始审核。”

2. 审核完成后,转到"问题"选项卡并搜索"X-robots-tag。”

3. 如果某些文件错误地没有索引,请删除"noindex"指令,以便Google可以索引它们。
钥匙拿走
- Google可以找到的不仅仅是HTML格式页面。 使用"filetype:"运算符查找Pdf、电子表格、演示文稿等。
- Google可以抓取和索引文件类型,如XLS,PPT,PDF和TXT。
- 确认Google可以通过删除不必要的noindex指令来索引您的非HTML格式文件。 该现场审核工具可以帮助您检测这些问题。