elasticsearch索引一旦建立,就无法动态修改其字段的映射类型,有时候因为人为原因污染了索引的mapping,这个时候就只能通过重建索引来修改索引的mapping设置了。
在一次项目中,有一个字段结构如下:1
2
3
4
5
6{
"logistics":{
"company":"string",
"no":"string"
}
}
由于当初创建索引的时候,既没有给这个索引中的这个字段指定合适的类型,也没有通过动态模板来为这个字段指定类型,导致 elasticsearch 默认将这种结构的数据设置成了 Object 类型,而我们真正想要设置的类型却是 Nested 类型。
第一种方案,给这个索引追加一个新的字段,同时给这个字段指定类型。1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16PUT test/_mapping/test
{
"properties": {
"logisticsV2":{
"type": "nested",
"properties": {
"company":{
"type":"keyword"
},
"no":{
"type":"keyword"
}
}
}
}
}
执行之后,index的mapping中就是这样的了:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43{
"test":{
"mappings":{
"test":{
"properties":{
"logistics":{
"properties":{
"company":{
"type":"text",
"fields":{
"keyword":{
"type":"keyword",
"ignore_above":256
}
}
},
"no":{
"type":"text",
"fields":{
"keyword":{
"type":"keyword",
"ignore_above":256
}
}
}
}
},
"logisticsV2":{
"type":"nested",
"properties":{
"company":{
"type":"keyword"
},
"no":{
"type":"keyword"
}
}
}
}
}
}
}
}
其中 logisticsV2
的类型是 nested 类型,之后依赖于 nested 类型的相关功能使用 logisticsV2字段来实现即可。
这个中方式有一些弊端,比如数据冗余问题、数据一致性问题等
第二个方案,使用 elasticsearch 提供的 reindex api 来迁移数据,创建新的索引。
首先创建好目标索引,并设置好mapping:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17PUT test_new
PUT test_new/_mapping/test
{
"properties": {
"logistics":{
"type": "nested",
"properties": {
"company":{
"type":"keyword"
},
"no":{
"type":"keyword"
}
}
}
}
}
之后,使用 reindex 将原来的索引重建到新的索引上:1
2
3
4
5
6
7
8
9POST _reindex
{
"source": {
"index": "test"
},
"dest": {
"index": "test_new"
}
}
等待 reindex 完成后, test_new 就结构就就是你想要的mapping了。
为了对线上业务做到无感,可以使用 alias 别名功能来实现,具体操作可以参考 使用 Elasticsearch alias 功能切换 indexl. 这里不再赘述.