密集索引
mongodb索引默认是密集型的。在一个有索引的集合里,每个文档都会有对应的索引项,哪怕文档中没有被索引键也是如此。例如,给文档的name字段建索引,而有的文档并没有name字段,那么name字段索引里会有null值,可以这样查询name为null值的文档:db.products.find({name: null})。
稀疏索引
在稀疏索引里,只会出现被索引键有值的文档。如果想创建稀疏索引,指定{sparse: true}就可以了。例如,可以像下面这样在name上创建一个唯一性稀疏索引:
db.products.ensureIndex({name: 1}, {unique: true, sparse: true})
比较
两种情况下不太适合使用默认的密集型索引:
一种是希望在并非出现在集合所有文档内的字段上增加唯一性索引时。举例来说,你明确希望在每个产品的sku字段上增加唯一性索引。但是出于某些原因,假设产品在还未分配sku时就加入系统了。如果sku字段上有唯一性索引,而你希望插入多个没有sku的产品,那么第一次插入会成功,但后续插入都会失败,因为索引里已经存在一个sku为null的项了。这种情况下密集型索引并不适合,你所需要的是稀疏索引(sparse index)。
另一种适用稀疏索引的情况:集合中大量文档都不包含被索引键。例如,假设允许对电子商务网站进行匿名评论。这种情况下,半数评论都可能缺少user_id字段,如果那个字段上有索引,那么该索引中一半的项都会是null。出于两个原因,这种情况的效率会很差。第一,这会增加索引的大小。第二,在添加和删除带null值user_id字段的文档时也要求更新索引。
如果很少(或不会)对匿名评论进行查询,那么可以选择在user_id上构建一个稀疏索引。