From c05efd618a18c24ef7e4a258dec929a55536680f Mon Sep 17 00:00:00 2001 From: heibaiying <31504331+heibaiying@users.noreply.github.com> Date: Tue, 4 Jun 2019 14:14:20 +0800 Subject: [PATCH] Update Spark_RDD.md --- notes/Spark_RDD.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/notes/Spark_RDD.md b/notes/Spark_RDD.md index 666df90..7a0b1be 100644 --- a/notes/Spark_RDD.md +++ b/notes/Spark_RDD.md @@ -143,8 +143,8 @@ Spark支持多种缓存级别 : | ---------------------------------------------- | ------------------------------------------------------------ | | `MEMORY_ONLY` | 默认的缓存级别,将 RDD以反序列化的Java对象的形式存储在 JVM 中。如果内存空间不够,则部分分区数据将不再缓存。 | | `MEMORY_AND_DISK` | 将 RDD 以反序列化的Java对象的形式存储JVM中。如果内存空间不够,将未缓存的分区数据存储到磁盘,在需要使用这些分区时从磁盘读取。 | -| `MEMORY_ONLY_SER`
| 将 RDD 以序列化的Java对象的形式进行存储(每个分区为一个 byte 数组)。这种方式比反序列化对象节省存储空间,但在读取时会增加CPU的计算负担(仅支持Java和Scala)。 | -| `MEMORY_AND_DISK_SER`
| 类似于`MEMORY_ONLY_SER`,但是溢出的分区数据会存储到磁盘,而不是在用到它们时重新计算(仅支持Java和Scala)。 | +| `MEMORY_ONLY_SER`
| 将 RDD 以序列化的Java对象的形式进行存储(每个分区为一个 byte 数组)。这种方式比反序列化对象节省存储空间,但在读取时会增加CPU的计算负担。仅支持Java和Scala 。 | +| `MEMORY_AND_DISK_SER`
| 类似于`MEMORY_ONLY_SER`,但是溢出的分区数据会存储到磁盘,而不是在用到它们时重新计算。仅支持Java和Scala。 | | `DISK_ONLY` | 只在磁盘上缓存RDD | | `MEMORY_ONLY_2`,
`MEMORY_AND_DISK_2`, etc | 与上面的对应级别功能相同,但是会为每个分区在集群中的两个节点上建立副本。 | | `OFF_HEAP` | 与`MEMORY_ONLY_SER`类似,但将数据存储在堆外内存中。这需要启用堆外内存。 |