| 梁's profileLiLiangPhotosBlogListsMore |
|
June 08 关于元搜索引擎的调度策略方法在前面我提到调度策略是研究元搜索引擎的一个方法 下面我想具体说明一些方法:仅供讨论,我在blog里 不会涉及到具体代码。 有关成员搜索引擎调度算法的分类方法也不统一。 通常可分为三大类:定性法,定量法,基于学习法。 定性法根据一定的评分标准,针对给定查询预测每个 成员搜索引擎数据库的性能。其评分或性能衡量往往不易理解。 定量法根据一些比定性方法使用的衡量标准更易理解的标准来衡 量成员搜索引擎数据库的性能。定量法根据给定查询计算出成员 搜索引擎数据库的有用性,相对于定性方法而言更加直接和明晰。 基于学习法根据以往成员搜索引擎检索结果,来预测各成员搜索 引擎的有用性。基于学习的方法实现有很多种,可分为静态学习 和动态学习,它们都是根据以前的查询经验来决定下次检索的调度策略。 定性法举例: 在CORI Net(collection retrieval inference network)方法中[11], 每个成员搜索引擎数据库的描述信息包括了其所有术语的两个信息:文件 频率和数据库频率。前者是指在某个成员搜索引擎数据库中含有该术语 的文件个数,后者是指含有该术语的成员搜索引擎数据库的个数。对于 给定查询q,CORI Net将一种在 INQUERY [12]系统中被称为 inference network的 文件评估法经拓展后用于计算成员搜索引擎数据库关于q的评分。 这种延展主要是概念上的,其思想是将一个成员搜索引擎数据库 代表想象为一个含有该数据库的所有术语的超级文件。数据库中术语的 文件频率成为超级文件中术语的术语频率。 定量法举例: 定量方法和定性方法主要区别在于前者使用的衡量成员搜索引擎数据库 有用性的标准更加明确和实用。举例来说,定量方法使用的衡量成员搜 索引擎数据库有用性的一种标准是“成员搜索引擎数据库中对于每一个查 询潜在的有用文件的数量”。很明显,这个数量清楚的反映了该成员搜索 引擎数据库对于给定查询的有用性。 学习方法举例: 这类方法基于以前提交的查询中得到的检索经验来预测成员搜索引擎数 据库对于新查询的有用程度。检索经验可能来自多方面。第一,可使用 训练查询。对于每个成员搜索引擎数据库关于训练查询的检索经验可以 在搜索引擎数据库选择投入使用前得到。这类方法称为静态学习方法, 因为在此类学习方法中,检索经验一经学习得到就不再改变了。静态学 习方法的缺陷在于不能适应成员搜索引擎数据库内容和查询模式的改变。 第二,可使用真正的用户查询(而不是训练查询),检索经验可以逐步 SavvySearch[13](www.search.com)是一个采用动态学习方法的元搜索 引擎,它对于成员搜索引擎关于一个查询的评分是根据查询中术语在以前 查询中获得的知识来得到的。积累并持续更新。这类方法称为动态学习方法。 ProFusion(www.profusion.com)是一个使用混合学习方法的元搜索引擎。 在ProFusion中,13个预先设置的类别被用于学习过程。每一个类别有一组 反映该类别主题的术语。对于每一个类别一组训练查询将用来做静态学习。 使用这些类别以及专门的训练查询的原因是为了了解不同成员搜索引擎 对于不同类别的响应情况。 _________________________________________________________________ 享用世界上最大的电子邮件系统— MSN Hotmail。 http://www.hotmail.com TrackbacksThe trackback URL for this entry is: http://liliang366.spaces.live.com/blog/cns!68EFD72ECE46CDC4!160.trak Weblogs that reference this entry
|
|
|