)。这些创新分为4类:查询预处理;信息来源;算法改进;结果可视化和后处理。
和 Powerset
,二者以不同的方式试图理解用户查询背后的语义或意思。这些搜索引擎与Google的很大的不同,是他们认为“忽略词”(stopwords
)非常重要,如次要的连词,像by, for, about, of, in等,Google通常会忽略它们。
,尽管Google的Matt Cutts并不同意这个看法
。] 所需要的就是一种虽然是匿名方式,但能提供个性化的搜索方式。从更广泛的角度来说,提供多个网站上的个性化会更加有用。 Collarity
就是拥有这一功能的搜索引擎。
, podzinger
),视频(Youtube
, truveo
),电视 (Blinkx
),图片 (Picsearch
, Netvue
)
),新闻(Topix
),分类广告 (oodle
)
(博客),Searchmash
(图片), Google视频, Google新闻等,因此,也许将这一项放在这个清单里不大公平。尽管如此,理想的情况是,将不同的媒体结果集合在一个搜索里,正如Searchmash已经做的那样(Retrevo
是另外一个好例子)。
,它能从多种数据来源中提供内容,并允许用户对每一个搜索作出清楚的选择。Google Co-op
和 Yahoo! Search Builder
能使第三方可以创建这种解决方案;Rollyo
早已经是这一领域的先行者!
上的文章或在Software Abstractions博客上的概述
。 [要更全面地了解这方面的信息,Sramana Mitra的在线旅游服务概述
介绍了垂直搜索与通用搜索的关系。]
允许你用材料、品牌、风格或价格不同来限定衣服搜索;像indeed
这样的招聘搜索网站让你限定搜索匹配的邮政编码;GlobalSpec
让你搜索工程部件时指定多种参数(如搜索工业管道时输入各种参数
)。参数搜索是垂直搜索引擎的天然特性。
未来将是搜索技术一个重要的分水岭(微软也有同样看法
)。来自大量用户的聚集信息输入使搜索引擎受益于群众的智慧而提供优质的搜索结果。当然,如果某些个别的输入缺乏独立性或可能是故意捣乱,搜索结果可能会无效。 在这一领域中提供的不同的服务中,del.icio.us 是根据这一方法提供优质搜索能力的典范。[在我较早发布的文章中,作了一个基于“外包给群众(crowd-sourcing)”的不同解决方案的可搜索性能的对比
。] 其他基于用户评价的系统包括StumbleUpon
, Squidoo
, About.com,当然也有Wikipedia。尽管严格来说,它们不是搜索引擎,它们都可以归结于可搜索性的总体框架之内。
的隐含投票。
这样的搜索引擎正在试验用人工操作员来回答搜索查询。 值得讨论,Yahoo! Answers
是否也是这一领域中的另一种解决方案,尽管这些答案由其他用户,而不是为搜索引擎工作的人来提供。
,它试图从网络上提取可作为行动参考的金融信息,金融机构投资者们可能对这些信息有兴趣;Spock
,“搜人”引擎(现在正处于封闭测试阶段),它计划在启动时数据库中有1亿份档案;Riya,
一个视觉搜索引擎,其技术能提供照片的面部和文本识别。
已经支持“特荐Feed”的功能--很明显,feed读者很适合在你感兴趣的领域推荐新的博客和feed(基于你的OPML文档的内容)。这一领域中还有Aggregate Knowledge
,它通过从多处网站匿名收集信息来为零售和媒体提供专业化服务。总体而言,这将来会是一个令人激动的领域!
和Clusty
这样的搜索引擎根据标签和关键词提供结果的聚类。它不仅让用户看到结果本身,也使结果的聚类及结果之间的关系可视化。这一元信息(-information)能帮助用户领会结果并发现相关主题
的新信息。
,Inxight Software
的VizServer和房地产搜索引擎Trulia
的HeatMaps
都是使信息可视化的新方法的例子,尽管在这一领域的研究还处于早期阶段。更简单的一个应用,HousingMaps
是一个显示可租/售房屋位置的聚合。
,它允许用户通过使用人口特质过滤器来改动卫生保健搜索结果。这很重要,因为人口特质,比如年龄、种族和性别可能对症状、疾病和治疗用药的搜索结果有很大的影响;还有基于发现结果的复杂性、来源和类型的过滤器。
和相关的Plusbox
新功能来提炼。随着时间的过去,我们可以期待这一功能会日益成熟。
提供RSS feed 已经很长时间了;Quintura
起初根本就是一个可下载的RIA应用,现在这个搜索引擎刚刚开始提供网络界面。
是最先提供开放的API的平台之一(尽管你自己承担使用该API的风险
),其他可用的API包括oodle
, zillow
和 trulia
。
(互联网太大了),它能使用户搜索英国的公共关系机构的网站上的信息。他们提供一个有趣的附加功能
:用户能输入他们的想查询的有关公关的详细情况,点击一下就可以直接提交给多个公关机构。类似地,房地产搜索引擎Zillow提供Zestimate
(Zillow计算的房产的估计价值)的概念,以及房产问答
的功能。这些类型的附加服务增加了提供给用户的搜索结果的价值,也使这个网站更有“粘性”。
是这一领域的有趣的服务—Copernic搜索代理能自动运行已存储的搜索,提供新结果的汇总,还能跟踪网页的变化。来自Connotate Technologies
的Information Agent Suite挖掘“深层网络”并自动进行变化探测。更多搜索代理的例子,详见读写网(Read/WriteWeb)的一篇文章
,介绍了Allth.at
及Swamii
和Searchbots.net
。
的概念结构。