lucene原理 如何理解Lucene的Index索引文档模型?

如何理解Lucene的Index索引文档模型?Lucene主要有两种文档模型:文档和字段。一个文档可以包含多个字段。每个字段都有不同的策略:1。是否要编制索引,请在分析后将字段添加到索引中,该字段不是

如何理解Lucene的Index索引文档模型?

Lucene主要有两种文档模型:文档和字段。一个文档可以包含多个字段。每个字段都有不同的策略:

1。是否要编制索引,请在分析后将字段添加到索引中,该字段不是原始文本。

2. 如果它是索引的,您可以选择是否保存“术语向量”以进行类似检索。

3. 您可以选择是否存储,直接复制原始文本而不编制索引,并将其用于检索。Lucene中的文档模型与数据库相似,但并不完全相同,主要体现在以下几个方面:1。没有标准格式,即不需要固定的架构、不需要列等预设计,同一索引中添加的文档可以包含不同的字段。2信息化。Lucene中的文档模型是一个平面结构,没有递归定义、自然连接等复杂结构。