Elasticsearch_7_基本操作

This commit is contained in:
罗祥 2019-12-18 16:39:28 +08:00
parent db31320323
commit 911aff38bb
6 changed files with 131 additions and 22 deletions

View File

@ -0,0 +1,24 @@
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>org.example</groupId>
<artifactId>sorting-algorithm</artifactId>
<version>1.0-SNAPSHOT</version>
<build>
<plugins>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-compiler-plugin</artifactId>
<configuration>
<source>8</source>
<target>8</target>
</configuration>
</plugin>
</plugins>
</build>
</project>

View File

@ -0,0 +1,26 @@
import java.util.Arrays;
/**
* 冒泡排序
*/
public class BubbleSort {
public static int[] sort(int[] sourceArray) {
int[] arr = Arrays.copyOf(sourceArray, sourceArray.length);
for (int i = 0; i < arr.length; i++) {
boolean flag = true;
for (int j = 0; j < arr.length - 1; j++) {
if (arr[j] > arr[j + 1]) {
int tmp = arr[j];
arr[j] = arr[j + 1];
arr[j + 1] = tmp;
flag = false;
}
}
if (flag) {
break;
}
}
return arr;
}
}

View File

@ -0,0 +1,23 @@
import java.util.Arrays;
/**
* 插入排序
*/
public class InsertSort {
public static int[] sort(int[] sourceArray) {
int[] arr = Arrays.copyOf(sourceArray, sourceArray.length);
for (int i = 0; i < arr.length; i++) {
int tmp = arr[i];
int j = i;
while (j > 0 && arr[j - 1] > tmp) {
arr[j] = arr[j - 1];
j--;
}
if (i != j) {
arr[j] = tmp;
}
}
return arr;
}
}

View File

@ -0,0 +1,25 @@
import java.util.Arrays;
/**
* 选择排序
*/
public class SelectionSort {
public static int[] sort(int[] sourceArray) {
int[] arr = Arrays.copyOf(sourceArray, sourceArray.length);
for (int i = 0; i < arr.length; i++) {
int min = i;
for (int j = i + 1; j < arr.length; j++) {
if (arr[j] < arr[min]) {
min = j;
}
}
if (min != i) {
int tmp = arr[i];
arr[i] = arr[min];
arr[min] = tmp;
}
}
return arr;
}
}

View File

@ -0,0 +1,11 @@
import java.util.Arrays;
public class ZTest {
public static void main(String[] args) {
int[] source = {1, 4, 2, 5, 3};
int[] sort01 = BubbleSort.sort(source);
int[] sort02 = SelectionSort.sort(source);
int[] sort03 = InsertSort.sort(source);
System.out.println(Arrays.toString(sort03));
}
}

View File

@ -27,13 +27,13 @@ PUT weibo/_settings
}
```
ES 支持修改索引的副本系数,但不支持随意修改索引的主分片数,这与 ES 分片的路由机制有关ES 使用以下公式来决定每条数据存储在哪个具体的分片上:
ES 支持修改索引的副本系数,但不支持随意修改索引的主分片数,这与 ES 分片的路由机制有关ES 使用以下公式来决定每条数据存储在哪个分片上:
```java
shard = hash(routing) % number_of_primary_shards
```
routing 是一个任意字符串,默认是 `_id` 同时也支持自定义。ES 对其进行哈希运算然后按 number_of_primary_shards 进行取余,之后就计算出存储分片的序号。基于这个原因,所以 ES 不允许对 number_of_primary_shards 进行修改,因为这会导致已有数据存储位置的计算规则失效。
routing 是一个任意的字符串,默认是 `_id` ,即使用 `_id` 进行分片计算当然也支持自定义分片键。ES 对其进行哈希运算然后按 `number_of_primary_shards` 取余后计算出存储分片的序号。基于这个原因,所以 ES 不允许对 `number_of_primary_shards` 进行修改,因为这会导致已有数据存储位置的失效。
## 1.3 查看与删除
@ -52,7 +52,7 @@ DELETE weibo
## 1.4 打开与关闭
ES 中的索引支持打开和关闭操作,索引关闭不能进行读写操作,后其占用的系统资源也会随之减少。索引打开和关闭的语法为:
ES 中的索引支持打开和关闭操作,索引关闭后就无法进行读写操作,因此其占用的系统资源也会随之减少。索引打开和关闭的语法为:
```shell
# 关闭索引
@ -62,7 +62,7 @@ POST weibo/_close
POST weibo/_open
```
ES 支持一次关闭多个索引,多个索引名之间使用逗号分隔,同时也支持通配符和 `_all` 关键字,示例如下:
ES 支持一次关闭多个索引,多个索引名之间需要使用逗号分隔,同时也支持使用通配符和 `_all` 关键字,示例如下:
```shell
# 关闭多个索引ignore_unavailable=true代表如果其中某个索引不存在则忽略该索引
@ -88,7 +88,7 @@ PUT weibo/_doc/1
}
```
这里需要注意的是在 7.x 版本后 ES 已经不推荐使用文档类型,所以这里的 `_doc` 表示端点名称而不是文档类型。输出如下:
这里需要注意的是在 7.x 版本后 ES 已经不推荐使用文档类型的概念,所以这里的 `_doc` 表示端点名称而不是文档类型。输出如下:
```json
{
@ -114,13 +114,13 @@ PUT weibo/_doc/1
### 2. _version
`_version` 为文档版本号,基于它可以实现乐观锁的效果,需要配合 version_type 使用version_type 有以下可选值:
`_version` 为文档版本号,基于它可以实现乐观锁的效果,需要配合 `version_type` 使用,`version_type` 有以下可选值:
+ **interna** :当给定的版本号与文档版本号相同时候,才执行对应的操作;
+ **external 或 external_gt** :如果给定版本号大于存储文档的版本或者原文档不存在时,才执行对应的操作,给定版本号将用作新的版本。
+ **external 或 external_gt** :如果给定版本号大于存储文档的版本或者原文档不存在时,才执行对应的操作,给定的版本号将用作新的版本;
+ **external_gte** :和上一条类似,等价于 gt + equal ,即给定版本号大于或等于存储文档的版本或者原文档不存在时,才执行对应的操作。
+ **external_gte** :和上一条类似,等价于 `gt + equal` ,即给定版本号大于或等于存储文档的版本或者原文档不存在时,才执行对应的操作。
使用示例:`PUT weibo/_doc/1?version=2&version_type=external { ... }`
@ -128,9 +128,9 @@ PUT weibo/_doc/1
输出结果中的 `_shards` 节点下有三个参数,其含义分别如下:
- **total** :操作涉及到的分片综述,这里由于创建 `weibo` 索引时指定主分片数量和副本系数都是1所以 只有 1个 primary 分片和 1 个 replica 分片,故总数为 2
- **successful** :这里我采用的是单节点的 ES , replica 分片实际上是不存在的。因为按照 ES 的规则primary 分片及其对应的replica 分片不能处于同一台主机上,因为处于同一台主机上时无法达到容错的效果。所以这里只有 primary 分片写入数据成功故值为1
- **failed** :执行复制操作失败的 replica 分片的数量,这里由于 replica 分片本生就不存在所以值为 0。
- **total** :操作涉及到的分片总数,这里由于创建 `weibo` 索引时指定主分片数量和副本系数都是 1所以 只有 1 个 primary 分片和 1 个 replica 分片,故总数为 2
- **successful** :这里我采用的是单节点的 ES , replica 分片实际上是不存在的。因为按照 ES 的规则primary 分片及其对应的 replica 分片不能处于同一台主机上,因为处于同一台主机上时无法达到容错的效果。所以这里只有 primary 分片写入数据成功,故值为 1
- **failed** :执行复制操作失败的 replica 分片的数量,这里由于 replica 分片本生就不存在所以值为 0
### 4. routing
@ -151,7 +151,7 @@ POST weibo/_doc?routing=kimchy
GET weibo/_doc/1
```
需要注意的是,文档的实际内容位于查询结果的 `_source` 节点下,输出如下:
文档的实际内容位于查询结果的 `_source` 节点下,输出如下:
```json
{
@ -170,7 +170,7 @@ GET weibo/_doc/1
}
```
默认情况下会返回文档全部字段,如果你只想返回部分字段或者排除部分字段,则可以使用 `_source_includes` 关键字或 `_source_excludes` 关键字
默认情况下会返回文档全部字段,如果你只想返回部分字段或者排除部分字段,则可以使用 `_source_includes` 关键字或 `_source_excludes` 关键字
```shell
GET weibo/_doc/1?_source_includes=user
@ -189,7 +189,7 @@ GET weibo/_doc/1?_source=false
GET weibo/_source/1
```
此时支持使用 `_source_includes``_source_excludes` 来包含和排除部分字段:
此时依然支持使用 `_source_includes``_source_excludes` 来包含和排除部分字段:
```
GET weibo/_source/1?_source_includes=user
@ -198,7 +198,7 @@ GET weibo/_source/1?_source_excludes=message
## 2.3 更新文档
新增相同 `_id` 的文档等价于执行更新操作,此时会用新的文档内容完全替换已有的文档内容,示例如下:
新增相同 `_id` 的文档等价于执行更新操作,此时会用新的文档内容完全替换已有的文档内容,示例如下:
```json
POST weibo/_doc/1
@ -220,7 +220,7 @@ POST weibo/_update/1
}
```
如果你的更新操作需要依赖原值,这里假设要更新的用户名需要由之前的用户名拼接而成,此时语法如下。更新完成后,新的用户名为 `Tom Cat` 。这里的 painless 是 ES 内置的一种脚本语言params 是参数的集合ctx 是上下文执行对象,其 `_source` 指向原文档的内容
如果更新操作需要依赖原值,这里假设要更新的用户名需要由之前的用户名拼接而成,此时语法如下。更新完成后,新的用户名为 `Tom Cat` 。这里的 painless 是 ES 内置的一种脚本语言params 是参数的集合ctx 是上下文执行对象,其 `_source` 指向原文档的内容
```json
POST weibo/_update/1/
@ -237,7 +237,7 @@ POST weibo/_update/1/
## 2.4 删除文档
删除文档时,可以指定版本以确保我们尝试删除的相关文档实际上已被删除,并且在此期间没有更改。对文档执行的每个写入操作(包括删除)都会导致其版本递增。删除文档的版本号在删除后仍可短时间使用,以便控制并发操作。已删除文档的版本保持可用的时间长度由 index.gc_deletes 索引设置确定默认为60秒。删除示例如下:
对文档执行的每个写入操作(包括删除)都会导致其版本号递增。删除文档时,可以通过指定版本号来确保文档在删除期间没有被其它用户更改;被删除的文档版本在删除后的短时间内仍使用,以便更好地支持并发操作。该时间长度由 `index.gc_deletes` 索引设置,默认为 60 秒。删除示例如下:
```shell
DELETE /weibo/_doc/1?version=2&version_type=interna
@ -263,7 +263,7 @@ GET /weibo/_mget
}
```
上面的查询语句也可以进行如下简写:
上面的查询语句也可以简写如下
```json
GET /weibo/_mget
@ -293,7 +293,7 @@ GET /weibo/_mget
}
```
通常我们的查询都没有这么复杂,只需要所有文档都返回特定字段即可,此时可以使用以下语法:
如果想要所有的文档都返回相同的字段,可以使用以下语法:
```json
GET /weibo/_mget?_source_includes=user,message
@ -312,7 +312,7 @@ POST _bulk
{ "script":{"source":"ctx._source.user+=params.user","lang":"painless","params":{"user" : " Cat"}}}
```
上面是一个批量更新的示例,其简化后抽象语法格式如下,需要注意的是这里语法是非常严格的:一个更新操作必须由两行 Json 组成,第一行 Json 用于说明操作、标识文档位置和其他可选配置,第二行 Json 用于存放数据或指明更新方式:
上面是一个批量更新的示例,其抽象语法格式如下。需要注意的是这里语法是非常严格的:一个更新操作必须由两行 Json 组成,第一行 Json 用于指明操作,文档位置和其他可选配置,第二行 Json 用于存放数据或指明更新方式:
```txt
POST _bulk
@ -325,7 +325,7 @@ POST _bulk
....
```
另外一个需要注意的是每行 Json 都必须遵循单行模式,不能是多行模式,即如下的语法是错误的:
另外一个需要注意的是每行 Json 都必须遵循单行模式,不能是多行模式,即如下的语法是错误的:
```json
{
@ -339,4 +339,4 @@ POST _bulk
}
```
之所以这样设计是因为如果允许多行模式,则其解析会比较麻烦且耗费性能,假设我们一次性批量执行上万个更新,则用于描述其操作的 Json 文件就会非常大,此时程序需要将其拷贝到内存中先进行解析,这个操作既浪费内存又浪费计算资源。而采用单行模式就能避免这个问题,程序只需要逐行读取记录,每读取两行则必然就是一个完整的操作,此时只需要将其发送到对应分片节点上执行即可。
之所以这样设计是因为如果允许多行模式,其解析就会比较繁琐且耗费性能,假设我们一次批量执行上万个更新,则用于描述操作的 Json 文件就会非常大,此时程序需要将其拷贝到内存中先进行解析,这个操作既浪费内存又浪费计算资源。而采用单行模式就能避免这个问题,程序只需要逐行读取记录,每读取两行则必然就是一个完整的操作,此时只需要将其发送到对应分片节点上执行即可。