`
须等待
  • 浏览: 210824 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

Solr 初探

    博客分类:
  • Solr
阅读更多
Solr似乎是目前开源界比较流行的全文索引工具了。

译自Solr官网。
http://lucene.apache.org/solr/index.html

Solr的主要特点:包含强大的全文索引,搜索关键词高亮,接近实时的索引,数据库集群整合,丰富的文档支持。Solr是高可用的,伸缩性强的,容错性高的,并且提供分布式索引的功能。

Solr为客户端提供近REST风格的API,支持XML, JSON, CSV or binary数据格式
基于Lucene

Solr包含了一些属性:
Schema,
定义了documents的字段信息
动态字段支持一些新加入的字段
可以允许多种索引方式索引一个字段,也可以把多个字段打包索引
显式的定义了类型,避免字段类型的歧义
外部文件定义的stopword list
额外的文字分析组件,如分词组件

Query
提供HTTP接口和可配置的返回类型(XML/XSLT, JSON, Python, Ruby, PHP, Velocity, CSV, binary)
可以根据多个字段来排序,也可以根据复杂计算之后的字段来排序
结果关键词高亮,相关性高

SolrCloud
云部署形式基于ZooKeeper
自动的创建分布式索引和分片
接近实时的索引,可以实时推送replication也可以懒拉取
事务日志保证了数据安全
自动的故障恢复
0
0
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics