百度网事通采集检索系统——检索帮助
初学者入门
  1. 检索,就这么简单
  2. 什么是关键词、类聚、相关度和模糊检索
  3. 同义词的检索
  4. 输入多个关键词检索
  5. 按站点检索
组合检索功能
   1. 按范围检索
   2. 按频道检索
   3. 按时间范围检索
   4. 检索结果显示顺序
   5. 检索结果类聚
   6. 检索网页类型
   7. 检索结果每页显示的信息条数
   8. 检索结果是否显示长摘要


如果您还有其它疑问,请咨询百度技术支持部


检索结果页指南
  1. 在结果中检索
  2. 百度快照

常见问题
  1. 如何清除检索框中的历史记录?
  2. 简体和繁体有无影响?
  3. 英文字母大小写有无影响?

初学者入门
↑返回目录

1. 检索,就这么简单

 只要在检索框中输入关键词,并按一下“开始检索”按钮,系统就会在相关网站自动找出符合检索条件的信息。系统会寻找所有符合您全部查询条件的信息,并把相关度最高的信息排在最前面。如果想取消刚输入关键词时,可以点击窗体上的“重新填写”按钮,这样刚输入的所有信息都会被清除。
小技巧:输入关键词后,直接按键盘上的回车键(即Enter健),系统也能正常检索。

2. 什么是关键词

 关键词,就是您输入检索框中的文字或字符,也就是您想让系统为您寻找的东西。
您可以让系统寻找任何内容,所以关键词的内容可以是:人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文...
关键词,可以是任何中文、英文、数字,或中文英文数字的混合体。
  例如,您可以检索[大话西游]、[windows]、[911]、[对于C++初学者]。
关键词,您可以输入一个,也可以输入两个、三个、四个,您甚至可以输入一句话。
  例如,您可以检索[]、[美女]、[mp3 下载]、[游戏 攻略 大全]、[蓦然回首,那人却在灯火阑珊处]。

类 聚自动去掉内容相同的网页,只显示它们的一个代表页面。

相关度:用户输入的关键词和检索结果信息的匹配程度,相关度越高的说明检索出来的内容和关键词越相近。

模糊检索:是指网事通系统自动按照用户输入关键词的同义词进行模糊检索,从而得出较多的检索结果。同义词由网事通系统的管理界面配置。如配置了“电脑”与“computer”为同义词后,检索“电脑”,则包含“computer”的网页也会出现在检索结果中。如果您想用模糊检索方式检索,只需选中模糊检索复选框即可。

提示:多个关键词之间必须留一个空格。

3. 同义词的检索

  百度网事通采集检索系统支持同义词检索,用户先在管理界面中配置同义词后,然后在检索页面中输入同义词中任何一个词检索时,选中“模糊检索”复选框,则该检索词的所有同义词的信息也会被检索出来。
例如:如果管理界面中定义 [舒淇] 和 [舒琪] 为同义词,那么选中模糊检索时输入
[舒淇]关键词后,同义词[舒琪]也被检索出来。

注意:在管理界面中配置同义词后,需要系统重新启动后,该配置的同义词才生效,只有生效后的同义词,检索时输入任意一个关键词后选择模糊检索时才能检索出相应的同义词信息。

4.输入多个关键词检索

  输入多个关键词检索,可以获得更精确更丰富的检索结果。
例如,检索[北京 暂住证],可以找到几千篇资料。而检索[暂住证],则会检索出全国各地的暂住证信息,可能检索出来的信息会有上万篇资料,而且检索出来的很多相关信息和关键词的相关度不是很高。

百度网事通采集检索系统支持多个关键词间的(“+”或 “空格”)、(“|”)、不包括(“-”)和优先级选择(括号)四种关系。注意:运算符和关键词之间必须要有空格,否则,系统会把运算符看作是一个普通字符,然后把关键字和普通字符连在一起认为是一个词。

  如:用户输入检索关键词:[Cisco + ( 通讯 | 路由器 ) – 服务]

那么系统会按这个意思来检索信息:内容包含cisco通讯路由器两个词中的一个,而且不包含服务的信息

5.按站点检索

站点检索意思就是在关键词后面的文本框中输入要检索的站点名称。

     它的格式是:site:站点名称 [其它检索词]

     例如:site:forum.baidu.com  布兰妮

注意:

(1)site:前面不能有除空格以外的任何字符,否则,网事通系统将把site当做普通字符;

(2)site和“:”之间不能有空格;

(3)站点名称不区分大小写、全半角;

(4)“site:”和站点名称之前不能有空格,否则,网事通系统认为要查询的站点名称是“ ”,而把站点名称当作普通检索字符;

(5) 在“site:站点名称”后面可以加其它检索词,表示在指定站点中查找符合条件的页面。“site:站点名称”和其它检索词之间必须有空格。

组合检索功能
↑返回目录

1. 按范围检索

检索范围分为“全文检索”和“标题检索”两类。点击“检索范围”后的下拉框进行选择。

全文检索指用户检索的关键词可以出现在结果网页内容中的任何位置;

标题检索是要求用户检索的关键词必须出现在每一篇结果网页的标题中。

缺省的检索范围是“全文检索”。用户也可以指定检索范围为“标题检索”,以得到标题中包含关键词的检索结果。

2. 按频道检索

  频道在站点定义页面中进行配置,用来表示站点的类别,如“科技”、“财经”等。用户进行检索时,可以指定频道进行检索,从而得到更精确的检索结果。如果选择“科技”频道,那么系统只在该频道信息中检索符合检索条件的信息。所属频道的名称是由管理员在站点定义中配置的,在这里系统自动获得。  

3. 按时间范围来检索

     时间范围表示检索结果网页的最后更新时间的范围值。若结果网页没有最后更新时间,则表示网事通系统抓取该网页的时间。缺省的检索条件下,对结果网页的时间范围不作限制。用户可以通过下拉列表框指定时间范围值,以得到更精确的检索结果。

4. 检索结果显示顺序

  检索结果页面中,每一个检索结果条目均代表一篇结果网页,包含有该结果网页的链接、摘要等信息。结果顺序表示检索结果页面中所有这些检索结果条目的排列顺序。

  结果顺序包括“按照网页相关度进行排序”、“按照网页最后更新时间降序排列”两类。“按照网页相关度进行排序”表示按照每一篇结果网页与用户输入的关键词的相关程度进行排序,相关度高的排列在前面;“按照网页最后更新时间降序排列”表示按每一篇结果网页的最后更新时间排序,最后更新的排列在最前面。

缺省情况下,检索结果按网页相关度进行排序。用户可以指定其它结果顺序,更方便地查找需要的检索结果。

5. 检索结果类聚

  结果类聚表示网事通系统在检索结果页面中,会自动去掉内容或主题相同的网页,只显示它们中最先抓取的一个页面,这样可以减少检索结果的重复数量,方便用户查看,提高用户的检索效率。

结果类聚包含“不类聚”,“按网页标题进行类聚”和“按网页内容进行类聚”三类。“按网页标题进行类聚”表示类聚掉标题相同的网页,只保留一个最先抓取的;“按网页内容进行类聚”则表示类聚掉整个网页正文内容相同的网页,只保留一个最先抓取的。缺省的类聚条件是“不类聚”,用户可以选择类聚条件,更方便地查找需要的检索结果。

6. 检索网页类型

  网页类型分为:是新闻网页、非新闻网页和全部网页三类。新闻和非新闻网页的区分是根据“站点定义”配置时决定的,如果站点定义是“新闻”,则在该站点下抓取的网页都归类为新闻网页,否则是非新闻网页。系统默认是“全部网页”。

7. 检索结果每页显示的信息条数

每页显示结果条数表示每一个检索结果页面最多包含多少个结果网页的条目,共有:10、20、50三个选项,缺省值为10例如,当一次检索包含300个检索结果,每页显示结果条数为20时,这些结果条目将分15页显示。用户可以点击检索结果页面上显示的不同页码,查看其它页的检索结果。

8. 检索结果是否显示长摘要

 摘要位于每条检索结果下,是从结果网页中提取出来的一段描述性文字。摘要分为“长摘要”和“短摘要”两种类型。长摘要表示所有网页的摘要文字长度基本不变(最大值);短摘要代表的摘要长度则根据用户输入的关键词个数不断变化,用户输入的关键词越多,相应的摘要长度也越大。

缺省的摘要为长摘要,即“长摘要”项复选框被选中。用户也可以指定显示短摘要,不选中“长摘要”复选框即可。

检索结果页指南
↑返回目录

A.

检索输入框
在这里,您仅需要输入要检索的关键词,然后点击后面的“检索”图标按钮或者按回车键(Enter),即可找到相关的信息资料。

B.

模糊检索
选中“模糊检索”复选框,则系统检索关键词和它的同义词,即系统会把关键词的同义词的信息也检索出来。

C.

在结果中检索

“在结果中检索”的意思是保留前一次检索的所有检索条件,再加上新的检索关键词,进行检索和排序。如果“在结果中检索”没有选中,“检索”将不使用前一次检索的检索条件,即唯一的检索限制就是新输入的检索关键词。如果第一次检索无结果,那么在页面中就不会有“在结果中检索”项了。

D.

相关度排序
点击此按钮则检索出来的结果会按“相关度”由高到低的排序来显示信息,相关度是用一个百分比的数字来显示的,该数字显示在检索信息主题的后面。

E.

按时间排序
点击此按钮,检索结果信息按网页的最后更新时间(不是系统抓取网页的时间)的倒序来排序。此时检索结果页面不再显示相关度信息了。

F.

组合检索
点击“组合检索”按钮,页面跳转到组合检索页面,用户可以在该页面中输入多条检索条件进行检索。

H.

检索结果统计信息
这是有关检索结果数量,以及检索时间的统计。

I.

产品Logo
这是网事通产品图标(logo)。点击该图标可以直接进入百度网站的首页。

J.

翻页
显示检索结果网页的页数,点击相应数字可进入相应检索结果页面。

K.

网页标题
这是检索结果中该网页的标题。点击该网页标题可直达该网页。

L.

网页站点名称
该处显示的该条信息抓取的站点名称,该站点名称是在管理界面上的站点定义中命名和配置的。

M.

网页的相关度
这是显示检索结果和关键词的相关度百分比数字。

N.

网页摘要
结果网页的摘要信息。其中您输入检索的关键词,都已高亮显示,以便阅读。

O.

网页信息
这里显示的内容包括网页URL地址、网页的大小和网页的最后更新时间,不是网页抓取时间。

P.

网页编码
检索结果网页的编码形式,如简体、繁体等。

Q.

百度快照
点击每条检索结果后的"网页快照",可查看该网页的快照内容。
百度网事通采集检索系统已先预览各网站,拍下网页的快照,为用户贮存大量的应急网页。
快照中您检索用的关键词均已用不同颜色在网页中显示。

常见问题
↑返回目录

1. 如何清除检索框中的历史记录?

  如果您的浏览器是IE4,则由以下步骤完成: 查看—>internet选项—>内容—>自动完成—>清除表单—>确定;

  如果您的浏览器是IE5、IE6,则由 工具—>internet选项—>内容—>自动完成—>清除表单—>确定;

  如果您希望IE浏览器以后不再记录您输入检索框的关键词,在“自动完成”里不要选择“表单”项即可。  

2. 简体和繁体有无影响?

  只要是标准编码,就没有影响。
  无论您输入标准编码的繁体中文或简体中文,都可以同时搜到繁体中文和简体中文网页。
  检索结果中的繁体网页信息将会自动转成简体中文保存到系统数据库中,为了方便阅读,用户看到的也是简体中文。

3. 英文字母大小写有无影响?

  百度网事通采集检索系统不区分英文字母大小写。所有的字母均当做小写处理。
  例如:输入"oicq",或"OICQ",或"oIcQ",结果都是一样的。

↑返回目录
Baidu.com co., ltd 2000-2008 © 版权所有
电话: 010-82884488   传真: 010-82883929