個人檔案LiLiang相片部落格清單更多 工具 說明
6月7日

关于桌面搜索引擎的讨论

谈这个,其实有点脸红,因为我没有做过桌面搜索引擎

的工作,虽然很早就想做,但是当发现google,

ask等纷纷推出桌面搜索技术的时候才觉得后悔。

因为没有做过,所以我的某些想法只是我通过使用

&自己做过的一些东西的经验猜测的,希望大家多多指教。

桌面搜索引擎的目的在于对本地硬盘的资源的挖掘。

当硬盘资源无限制的夸大的时候,本地挖掘就显得极为的重要

微软为我们提供了一个效率非常低,方式极为简单的接口,面对小量资源的时候

还是勉强可以使用的,但是资源量大的时候就太难了。

微软的难处在哪里那,我考虑主要有以下几点:

1。微软系统的文件组织方式。即文件系统本身就是不利于查询的。

这点对它的限制非常大。在目前的文件系统上如果想做一个功能

极为强大的搜索接口是很困难的。

2。微软自身对于检索的研究。微软对于internet尤其实搜索技术的

研究存在问题。可以说它失去了一个非常好的机会,信息检索技术

我认为绝对是现在,将来10年最重要的技术。简单的说,当资源无限制

的增长的时候,只有检索技术才是人们需要的技术。我们看到,凡是

有搜索引擎接口的网站或者资源,它的易用性是没有相应接口的网站难以比拟的。

现在很多搜索引擎公司都推出了自己的桌面搜索引擎,我使用了ask,google.baidu

yahoo等公司的软件,以下是我的一些想法:

  • 首先不是所有公司都提供基于内容的检索,有些只是提供对文件的快速检索
  • 基于内容的检索系统中google的有点比较明显,首先它是一个开放的系统,可以通过安装插件来扩展它的检索内容,其次如果对于内容检索,首先要设计一个非常强大的自索引系统,显然google的自索引算法是最先进的,因为它的索引文件最小的,很明显。
  • 是否需要提供高级选项,有些公司,尤其yahoo,它的选择之多,功能之强大令人侧目,但是它的软件却非常难用,其实互联网上需要牢记得就是简单就是美,如果有丰富的内容,没有必要搞那么复杂。
  • 隐私&广告问题。基于对本机的搜索的确在某种程度上容易暴露个人隐私,其实是别人获取你的隐私更加的方便了。可是这个问题主要是个人计算机的安全问题,不是搜索本身的问题,搜索本身对于隐私的保护即使去做,也是微乎其微的。至于广告应该不是问题,但是远期来看,有可能会加入文字广告。
  • 本地检索的窗口界面应该是本地启动一个socket。但是这样做的稳定性&安全性不太好说。

其实本地硬盘搜索的最重要的问题就是自索引算法的先进性问题了。如果有了先进的自索引算法。

那么其它的问题只是编程的水平了。

 希望大家也多多讨论。

回應

請稍候...
很抱歉,您輸入的回應過長。請縮短您的回應。
您尚未輸入內容,請再試一次。
很抱歉,目前無法新增您的回應,請稍後再試。
若要新增回應,您的父母必須先給您權限。要求權限
您的家長已關閉回應功能。
很抱歉,目前無法刪除您的回應,請稍後再試。
您已超過每日回應上限次數,請於 24 小時後再試一次。
由於系統顯示您可能傳送垃圾郵件給其他使用者,因此您帳號中的回應功能已遭停用。 如果您認為自己帳號遭錯誤停用,請連絡 Windows Live 支援
請完成下列安全檢查,以完成回應。
您輸入的安全檢查字元必須與圖片或音訊中的字元相符。

若要新增回應,請以您的 Windows Live ID 登入 (若您使用 Hotmail、Messenger 或 Xbox LIVE,則您已擁有 Windows Live ID)。登入


沒有 Windows Live ID?註冊

引用通告

此內容的引用通告是:
http://liliang366.spaces.live.com/blog/cns!68EFD72ECE46CDC4!147.trak
引述這則內容的部落格