梁's profileLiLiangPhotosBlogListsMore Tools Help

Blog


    June 08

    关于元搜索引擎的调度策略方法

    在前面我提到调度策略是研究元搜索引擎的一个方法
    下面我想具体说明一些方法:仅供讨论,我在blog里
    不会涉及到具体代码。
    有关成员搜索引擎调度算法的分类方法也不统一。
    通常可分为三大类:定性法,定量法,基于学习法。
    定性法根据一定的评分标准,针对给定查询预测每个
    成员搜索引擎数据库的性能。其评分或性能衡量往往不易理解。
    定量法根据一些比定性方法使用的衡量标准更易理解的标准来衡
    量成员搜索引擎数据库的性能。定量法根据给定查询计算出成员
    搜索引擎数据库的有用性,相对于定性方法而言更加直接和明晰。
    基于学习法根据以往成员搜索引擎检索结果,来预测各成员搜索
    引擎的有用性。基于学习的方法实现有很多种,可分为静态学习
    和动态学习,它们都是根据以前的查询经验来决定下次检索的调度策略。

    定性法举例:
    在CORI Net(collection retrieval inference network)方法中[11],
    每个成员搜索引擎数据库的描述信息包括了其所有术语的两个信息:文件
    频率和数据库频率。前者是指在某个成员搜索引擎数据库中含有该术语
    的文件个数,后者是指含有该术语的成员搜索引擎数据库的个数。对于
    给定查询q,CORI Net将一种在 INQUERY [12]系统中被称为 inference network的
    文件评估法经拓展后用于计算成员搜索引擎数据库关于q的评分。
    这种延展主要是概念上的,其思想是将一个成员搜索引擎数据库
    代表想象为一个含有该数据库的所有术语的超级文件。数据库中术语的
    文件频率成为超级文件中术语的术语频率。

    定量法举例:
    定量方法和定性方法主要区别在于前者使用的衡量成员搜索引擎数据库
    有用性的标准更加明确和实用。举例来说,定量方法使用的衡量成员搜
    索引擎数据库有用性的一种标准是“成员搜索引擎数据库中对于每一个查
    询潜在的有用文件的数量”。很明显,这个数量清楚的反映了该成员搜索
    引擎数据库对于给定查询的有用性。

    学习方法举例:
    这类方法基于以前提交的查询中得到的检索经验来预测成员搜索引擎数
    据库对于新查询的有用程度。检索经验可能来自多方面。第一,可使用
    训练查询。对于每个成员搜索引擎数据库关于训练查询的检索经验可以
    在搜索引擎数据库选择投入使用前得到。这类方法称为静态学习方法,
    因为在此类学习方法中,检索经验一经学习得到就不再改变了。静态学
    习方法的缺陷在于不能适应成员搜索引擎数据库内容和查询模式的改变。
    第二,可使用真正的用户查询(而不是训练查询),检索经验可以逐步
    SavvySearch[13](www.search.com)是一个采用动态学习方法的元搜索
    引擎,它对于成员搜索引擎关于一个查询的评分是根据查询中术语在以前
    查询中获得的知识来得到的。积累并持续更新。这类方法称为动态学习方法。
    ProFusion(www.profusion.com)是一个使用混合学习方法的元搜索引擎。
    在ProFusion中,13个预先设置的类别被用于学习过程。每一个类别有一组
    反映该类别主题的术语。对于每一个类别一组训练查询将用来做静态学习。
    使用这些类别以及专门的训练查询的原因是为了了解不同成员搜索引擎
    对于不同类别的响应情况。

    _________________________________________________________________
    享用世界上最大的电子邮件系统— MSN Hotmail。 http://www.hotmail.com

    Comments

    Please wait...
    Sorry, the comment you entered is too long. Please shorten it.
    You didn't enter anything. Please try again.
    Sorry, we can't add your comment right now. Please try again later.
    To add a comment, you need permission from your parent. Ask for permission
    Your parent has turned off comments.
    Sorry, we can't delete your comment right now. Please try again later.
    You've exceeded the maximum number of comments that can be left in one day. Please try again in 24 hours.
    Your account has had the ability to leave comments disabled because our systems indicate that you may be spamming other users. If you believe that your account has been disabled in error please contact Windows Live support.
    Complete the security check below to finish leaving your comment.
    The characters you type in the security check must match the characters in the picture or audio.

    To add a comment, sign in with your Windows Live ID (if you use Hotmail, Messenger, or Xbox LIVE, you have a Windows Live ID). Sign in


    Don't have a Windows Live ID? Sign up

    Trackbacks

    The trackback URL for this entry is:
    http://liliang366.spaces.live.com/blog/cns!68EFD72ECE46CDC4!160.trak
    Weblogs that reference this entry
    • None