ES 高级实战

悟空约 4694 字大约 16 分钟...

前言

上篇我们讲到了 Elasticsearch 全文检索的原理《别只会搜日志了，求你懂点原理吧》open in new window，通过在本地搭建一套 ES 服务，以多个案例来分析了 ES 的原理以及基础使用。这次我们来讲下 Spring Boot 中如何整合 ES，以及如何在 Spring Cloud 微服务项目中使用 ES 来实现全文检索，来达到搜索题库的功能。

而且题库的数据量是非常大的，题目的答案也是非常长的，通过 ES 正好可以解决 mysql 模糊搜索的低效性。

通过本实战您可以学到如下知识点：

Spring Boot 如何整合 ES。
微服务中 ES 的 API 使用。
项目中如何使用 ES 来达到全文检索。

本篇主要内容如下：

本文案例都是基于 PassJava 实战项目来演示的。

👍Github 地址：https://github.com/Jackson0714/PassJava-Platformopen in new window

一、Elasticsearch 组件库介绍

在讲解之前，我在这里再次提下全文检索是什么：

全文检索： 指以全部文本信息作为检索对象的一种信息检索技术。而我们使用的数据库，如 Mysql，MongoDB 对文本信息检索能力特别是中文检索并没有 ES 强大。所以我们来看下 ES 在项目中是如何来代替 SQL 来工作的。

我使用的 Elasticsearch 服务是 7.4.2 的版本，然后采用官方提供的 Elastiscsearch-Rest-Client 库来操作 ES，而且官方库的 API 上手简单。

该组件库的官方文档地址：

https://www.elastic.co/guide/en/elasticsearch/client/java-rest/current/java-rest-high.html

另外这个组件库是支持多种语言的：

注意：Elasticsearch Clients 就是指如何用 API 操作 ES 服务的组件库。

可能有同学会提问，Elasticsearch 的组件库中写着 JavaScript API，是不是可以直接在前端访问 ES 服务？可以是可以，但是会暴露 ES 服务的端口和 IP 地址，会非常不安全。所以我们还是用后端服务来访问 ES 服务。

我们这个项目是 Java 项目，自然就是用上面的两种：Java Rest Client 或者 Java API。我们先看下 Java API，但是会发现已经废弃了。如下图所示：

所以我们只能用 Java REST Client 了。而它又分成两种：高级和低级的。高级包含更多的功能，如果把高级比作MyBatis的话，那么低级就相当于JDBC。所以我们用高级的 Client。

三、实战：同步 ES 数据

3.1 定义检索模型

PassJava 这个项目可以用来配置题库，如果我们想通过关键字来搜索题库，该怎么做呢？

类似于百度搜索，输入几个关键字就可以搜到关联的结果，我们这个功能也是类似，通过 Elasticsearch 做检索引擎，后台管理界面和小程序作为搜索入口，只需要在小程序上输入关键字，就可以检索相关的题目和答案。

首先我们需要把题目和答案保存到 ES 中，在存之前，第一步是定义索引的模型，如下所示，模型中有 title 和 answer 字段，表示题目和答案。

"id": {
    "type": "long"
},
"title": {
    "type": "text",
    "analyzer": "ik_smart"
},
"answer": {
    "type": "text",
    "analyzer": "ik_smart"
},
"typeName": {
    "type": "keyword"
}

3.3 定义 ES model

上面我们定义 ES 的索引，接着就是定义索引对应的模型，将数据存到这个模型中，然后再存到 ES 中。

ES 模型如下，共四个字段：id、title、answer、typeName。和 ES 索引是相互对应的。

@Data
public class QuestionEsModel {
    private Long id;
    private String title;
    private String answer;
    private String typeName;
}

3.4 触发保存的时机

当我们在后台创建题目或保存题目时，先将数据保存到 mysql 数据库，然后再保存到 ES 中。

如下图所示，在管理后台创建题目时，触发保存数据到 ES 。

第一步，保存数据到 mysql 中，项目中已经包含此功能，就不再讲解了，直接进入第二步：保存数据到 ES 中。

而保存数据到 ES 中，需要将数据组装成 ES 索引对应的数据，所以我用了一个 ES model，先将数据保存到 ES model 中。

这里的关键代码时 copyProperties，可以将 question 对象的数据取出，然后赋值到 ES model 中。不过 ES model 中还有些字段是 question 中没有的，所以需要单独拎出来赋值，比如 typeName 字段，question 对象中没有这个字段，它对应的字段是 question.type，所以我们把 type 取出来赋值到 ES model 的 typeName 字段上。如下图所示：

3.6 保存数据到 ES

我在 passjava-search 微服务中写了一个保存题目的 api 用来保存数据到 ES 中。

然后在 passjava-question 微服务中调用 search 微服务的保存 ES 的方法就可以了。

// 调用 passjava-search 服务，将数据发送到 ES 中保存。
searchFeignService.saveQuestion(esModel);

3.7 检验 ES 中是否创建成功

我们可以通过 kibana 的控制台来查看 question 索引中的文档。通过以下命令来查看：

GET question/_search

执行结果如下图所示，有一条记录：

另外大家有没有疑问：可以重复更新题目吗？

答案是可以的，保存到 ES 的数据是幂等的，因为保存的时候带了一个类似数据库主键的 id。

四、实战：查询 ES 数据

我们已经将数据同步到了 ES 中，现在就是前端怎么去查询 ES 数据中，这里我们还是使用 Postman 来模拟前端查询请求。

4.1 定义请求参数

请求参数我定义了三个：

keyword：用来匹配问题或者答案。
id：用来匹配题目 id。
pageNum：用来分页查询数据。

这里我将这三个参数定义为一个类：

@Data
public class SearchParam {
    private String keyword; // 全文匹配的关键字
    private String id; // 题目 id
    private Integer pageNum; // 查询第几页数据
}

4.2 定义返回参数

返回的 response 我也定义了四个字段：

questionList：查询到的题目列表。
pageNum：第几页数据。
total：查询到的总条数。
totalPages：总页数。

定义的类如下所示：

@Data
public class SearchQuestionResponse {
    private List<QuestionEsModel> questionList; // 题目列表
    private Integer pageNum; // 查询第几页数据
    private Long total; // 总条数
    private Integer totalPages; // 总页数
}

4.3 组装 ES 查询参数

调用 ES 的查询 API 时，需要构建查询参数。

组装查询参数的核心代码如下所示：

第一步：创建检索请求。
第二步：设置哪些字段需要模糊匹配。这里有三个字段：title，answer，typeName。
第三步：设置如何分页。这里分页大小是 5 个。
第四步：调用查询 api。

4.4 格式化 ES 返回结果

ES 返回的数据是 ES 定义的格式，真正的数据被嵌套在 ES 的 response 中，所以需要格式化返回的数据。

核心代码如下图所示：

第一步：获取查到的数据。
第二步：获取真正命中的结果。
第三步：格式化返回的数据。
第四步：组装分页参数。

再次强调：本文的代码都是辛苦调试出来的，请不要忘记点赞和转发哦~

昵称

邮箱

网址

按正序
按倒序
按热度

ES 高级实战

前言

一、Elasticsearch 组件库介绍

二、整合检索服务

1.1 添加搜索服务模块

1.2 配置 Maven 依赖

1.3 注册搜索服务到注册中心

1.4 添加 ES 配置类

1.5 测试 ES Client 自动加载

1.6 测试 ES 简单插入数据

1.7 测试 ES 查询复杂语句

1.7.1 构造检索条件

17.2 获取命中记录的详情

1.7.3 获取年龄分布聚合信息

1.7.4 获取平均薪资聚合信息

三、实战：同步 ES 数据

3.1 定义检索模型

3.2 在 ES 中创建索引

3.3 定义 ES model

3.4 触发保存的时机

3.5 用 model 来组装数据

3.6 保存数据到 ES

3.7 检验 ES 中是否创建成功

四、实战：查询 ES 数据

4.1 定义请求参数

4.2 定义返回参数

4.3 组装 ES 查询参数

4.4 格式化 ES 返回结果

4.5 测试 ES 查询

4.5.1 实验一：测试 title 匹配

4.5.2 实验二：测试 answer 匹配

4.5.2 实验三：测试 id 匹配

五、总结

预览: