应用一班
Would you like to react to this message? Create an account in a few clicks or log in to continue.
应用一班

应用一班的活动区
 
首页首页  欢迎页欢迎页  Latest imagesLatest images  搜索搜索  注册注册  登录  

 

 google从入门到精通4

向下 
作者留言
饺子
系主任
系主任
饺子


帖子数 : 43
年龄 : 36
地点 : 石家庄藁城
注册日期 : 07-11-28

google从入门到精通4 Empty
帖子主题: google从入门到精通4   google从入门到精通4 Icon_minitime周三 十一月 28, 2007 3:51 pm

8.2、在某一类文件中查找信息



“filetype:”是google开发的非常强大实用的一个搜索语法。也就是说,google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,google已经能检索微软的office文档如.xls、.ppt、.doc,.rtf,wordperfect文档,lotus1-2-3文档,adobe的.pdf文档,shockwave的.swf文档(flash动画)等。其中最实用的文档搜索是pdf搜索。pdf是adobe公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前google检索的pdf文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。pdf文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。



示例:搜索几个资产负债表的office文档。

搜索:“资产负债表 filetype:doc or filetype:xls or filetype:ppt”

结果:已搜索有关资产负债表 filetype:doc or filetype:xls or filetype:ppt的中文(简体)网页。 共约有481项查询结果,这是第1-10项 。 搜索用时0.04秒。



注意,下载的office文件可能含有宏病毒,谨慎操作。



示例:搜索一些关于搜索引擎知识和技巧方面的pdf文档

搜索:“"search engine" tips or tutorial filetype:pdf”

结果:已向英特网搜索"search engine" tips or tutorial filetype:pdf. 共约有12,600项查询结果,这是第1-10项 。 搜索用时0.22秒。



我们来看其中的一个结果:



[pdf]search engines tips

文档类型: pdf/adobe acrobat - html 版

... http://www.google.com/press/zeitgeist.html see what people are searching on at google.com

* search engine watch http://searchenginewatch.com/ some free tips ...

www.allvertical.com/promokits/searchenginetips.pdf - 类似网页



可以看到,google用[pdf]来标记这是一个pdf的文档检索,另外,它还给出了该pdf文档的html版本,该html版保留了文档的文字内容和结构,但没有图片。

8.3、搜索的关键字包含在url链接中



“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“mp3”、“gallary”等,于是,就可以用inurl语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。inurl语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。



示例:查找midi曲“沧海一声笑”。

搜索:“inurl:midi “沧海一声笑””

结果:已搜索有关inurl:midi "沧海一声笑"的中文(简体)网页。 共约有27项查询结果,这是第1-10项 。 搜索用时0.34秒。



注意:“inurl:”后面不能有空格,google也不对url符号如“/”进行搜索。例如,google会把“cgi-bin/phf”中的“/”当成空格处理。



“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。



示例:查找可能具有phf安全漏洞的公司网站。通常这些网站的cgi-bin目录中含有phf脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。

搜索:“allinurl:"cgi-bin" phf +com”

结果:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有51项查询结果,这是第1-10项 。 搜索用时0.11秒。



8.4、搜索的关键字包含在网页标题中



“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对url进行查询,而前者对网页的标题栏进行查询。网页标题,就是html标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。



示例:查找日本明星藤原纪香的照片集。

搜索:“intitle:藤原纪香 "写真集"”

结果:已搜索有关intitle:藤原纪香 "写真集"的中文(简体)网页。 共约有315项查询结果,这是第1-10项 。 搜索用时0.15秒。



8.5、搜索的关键字包含在网页的“锚”(anchor)链点内



所谓“锚”,就是在同一个网页中快速切换链接点。与url和title类似,google提供了两种对anchor的检索,“inanchor”和“allincnchor”。对此不作详述。
返回页首 向下
 
google从入门到精通4
返回页首 
1页/共1

您在这个论坛的权限:不能在这个论坛回复主题
应用一班 :: 上网冲浪-
转跳到: