elasticsearch中的数据类型：flattened和join

2023-08-16 11:14 由 gongzz 发表于 #后端开发

flattened：比如你有一个字段的值是一个json，这个json里面又有很多字段，你又不想一个一个的定义这些字段到mapping，就可以用flattened

直接动手：创建索引：

PUT person
{
  "mappings": {
    "properties": {
      "patient_name": {
        "type": "text"
      },
      "detail": {
        "type": "flattened"
      }
    }
  }
}

注意这里detail字段类型为flattened, 然后插入文档：

PUT person/_doc/1
{
  "patient_name": "John Doe",
  "detail": {
    "age": 143,
    "skills": [
      "java",
      "python",
      "ai"
    ],
    "history": "none",
    "friends": [
      "Neo",
      "James",
      "Tony Stark"
    ]
  }
}

然后搜索：

GET person/_search
{
  "query": {
    "match": {
      "detail": "java"
    }
  }
}

注意这里直接搜索detail，可以搜索到我们刚刚插入的那个文档，但是我们也可以搜索detail.skills,比如

"detail.skills": "java"

也能搜索到那个文档，但是如果我们这样搜索就搜索不到：

"detail.friends": "java"

还有一点，这里的每个字段会被定义成keyword类型，所以你如果这样搜索就搜索不到：

"detail.friends": "Tony"

你必须完全匹配才能搜索的到：

"detail.friends": "Tony Stark"

再来看看join类型，说的是一个索引里面一个文档和其他几个文档有关联，比如几个文档的父文档都是那一个文档,动手：

先创建索引：

PUT person2
{
  "mappings": {
    "properties": {
      "relationship": {
        "type": "join",
        "relations": {
          "star": "fans"
        }
      }
    }
  }
}

这里relationship是一个字段名，类型是join，指的明星和粉丝的关系，所以里面有一个类型的参数relations,它的取值star:fans分别表示父和子的关联类型，后面会用到。

插入文档，首先是父文档：

PUT person2/_doc/1
{
  "name": "star1",
  "relationship": {
    "name": "star"
  }
}

这里的relationship.name是star，这个值是在前面mapping里面定义的，前面提到过，如果你写个super_star,就会报错：

unknown join name [super_star] for field [relationship]

然后插入第一个子文档：

PUT person2/_doc/2?routing=tony
{
 "name":"fan1",
 "relationship":{
 "name":"fans",
 "parent":1
 }
}

注意这里有个routing参数，如果插入子文档的时候没有指定routing是会报错的，这是为了将相关的文档分配到相同的分片，比如后面插入第二个子文档真爱粉的时候也指定相同的路由参数值。

[routing] is missing for join field [relationship]

还有这里的relationship.name是fans，也是在前面mapping里面定义的。

指定parent是1，就确定了父子文档的关系。

最后插入第二个子文档：

PUT person2/_doc/3?routing=tony
{
 "name":"fan2",
 "relationship":{
 "name":"fans",
 "parent":1
 }
}

路由参数一样，下面查询：

GET person2/_search
{
  "query": {
    "parent_id": {
      "type": "fans",
      "id": 1
    }
  }
}

可以查到两个子文档，两个子文档，但是不包括父文档：

    "hits" : [
      {
        ..."_routing" : "tony",
        "_source" : {
          "name" : "fan1",
          "relationship" : {
            "name" : "fans",
            "parent" : 1
          }
        }
      },
      {
        ..."_routing" : "tony",
        "_source" : {
          "name" : "fan2",
          "relationship" : {
            "name" : "fans",
            "parent" : 1
          }
        }
      }

如果插入第二个子文档的时候指定路由参数是neo，也可以搜索到两个子文档，不影响搜索，但不建议这样做。

PUT person2/_doc/3?routing=neo

还有要注意的是如果查询的时候，指定parent_id.type为star会报错：

GET person2/_search
{
  "query": {
    "parent_id": {
      "type": "star",
      "id": 1
    }
  }
}

报错如下：

[parent_id] no relation found for child [star]

也就是说这里要指定的是子文档的关联类型

【pandas小技巧】--数据转置

所谓**数据转置**，就是是将原始数据表格沿着对角线翻折，使原来的行变成新的列，原来的列变成新的行，从而更方便地进行数据分析和处理。 `pandas`中`DataFrame`的转置非常简单，每个`DataFrame`对象都有一个`T`属性，通过这个属性就能得到转置之后的`DataFrame`。下面介 ...阅读全文

SpringBoot3集成ElasticSearch

Elasticsearch是一个分布式、RESTful风格的搜索和数据分析引擎，适用于各种数据类型，数字、文本、地理位置、结构化数据、非结构化数据； ...阅读全文

quarkus数据库篇之二：无需数据库也能运行增删改查(dev模式)

### 欢迎访问我的GitHub > 这里分类和汇总了欣宸的全部原创(含配套源码)：[https://github.com/zq2599/blog_demos](https://github.com/zq2599/blog_demos) ### 本篇概览 - 本篇内容并非数据库相关的核心知识，而是对 ...阅读全文

《Lua程序设计第四版》第二部分14~17章自做练习题答案

Lua程序设计第四版第二部分编程实操自做练习题答案，带:star:为重点。 ## 14.1 :star: > 该函数用于两个稀疏矩阵相加 ```lua function martixAdd(a, b) local c = {} for i = 1, #a, 1 do c[i] = {} for k, ...阅读全文

Python教程(9)——Python变量类型列表list的用法介绍

在Python中，列表（list）是一种有序、可变的数据结构，用于存储多个元素。列表可以包含不同类型的元素，包括整数、浮点数、字符串等。实际上列表有点类似C++语言中的数组，但仅仅只是类似，和数组还是有点不一样的。列表非常适合利用顺序和位置定位某一元素，尤其是当元素的顺序或内容经常发生改变时。在P ...阅读全文

C语言数据的存储

[TOC] ## 类型的基本归类 **整形家族：** ```c char unsigned char signed char short unsigned short [int] signed short [int] int unsigned int signed int long unsigned ...阅读全文

java死锁、线程状态、线程通信、线程池

# 1. 回顾 > 1. java实现多线程: [1]继承Thread类并重写run方法 [2]实现Runnable接口 > > 2. 线程Thread中常用的方法: setName(): Thread.currentThread().getName(): > > static void sle ...阅读全文

使用C++界面框架ImGUI开发一个简单程序

[TOC] # 简介 ImGui 是一个用于C++的用户界面库，跨平台、无依赖，支持OpenGL、DirectX等多种渲染API，是一种即时UI（Immediate Mode User Interface）库，保留模式与即时模式的区别参考[**保留模式与即时模式**](https://learn.m ...阅读全文

开源免费的文件投喂与问答工具，构建你的第二大脑

利用AI帮你读文章、利用AI帮你分析非结构化数据，这些最为潮流的AI辅助工具，相信很多读者都在各种媒体上看到过了。但还是有不少人并没有真正的使用过，这里有很多原因导致，具体就不细说了，懂的都懂。今天TJ就给大家推荐一个你可以在线使用，也可以自己搭建的AI辅助工具：[**Quivr**](https ...阅读全文

《深入理解Java虚拟机》读书笔记：Class类文件的结构

Sun公司以及其他虚拟机提供商发布了许多可以运行在各种不同平台上的虚拟机，这些虚拟机都可以载入和执行同一种平台无关的的程序存储格式——字节码（ByteCode），从而实现了程序的“一次编写，到处运行”。“Class文件”这种特定的二进制文件格式所关联，Class文件中包含了Java虚拟机指令集和符号... ...阅读全文