Redis笔记
1. Redis
简介
NoSQL
即 $Not-Only\ \ SQL$ ,是RDBMS
的补充。
Redis
是一种NoSQL
数据库,是一个使用C
语言开发的开源的高性能键值对数据库,内部使用单线程机制进行工作。
- $set\ \ [key]\ \ [value]$ 添加信息,
- $get\ \ [key]$ 查询信息,为空返回 $nil$ ,
- $del\ \ [key]$ 删除信息,$1$ 代表删除成功,
- $clear$ 清屏,
- $help\ \ [op]$ 帮助,
- $time$ 获取时间.
2. 数据类型
Redis
采用键值对的方式存储,$key$ 为字符串,$value$ 则允许多种类型。
2.1 string
最简单的数据类型,最大存储量 $512MB$ ,
可以作为数字使用,最大值为 $java.lang.Long$ 类型的最大值,
允许以JSON
对象的方式存储数据,值中间不能有空白符
- $mset/mget$ 获取多个数据
- $strlen$ 获取字符个数
- $append$ 追加,返回总长度,也可以用于添加信息
- $incr/incrby/incrbyfloat$ 指定数据增加指定值,允许负数,返回数值
- $decr/decrby$ 指定数据减少指定的值,允许负数,返回数值
- $setex/psetex$ 设定数据周期,秒/毫秒
2.2 hash
hash
属于 $value$ ,其中包含多组键值对,键称为 $field$ ,键值对较少时为类数组结构,较多时为 $HashMap$ 结构,$value$ 只能为 string
,且最多只能有 $2^{32} - 1$ 组。
- $hset/hmset$ ,
- $hget/hmget/hgetall$ ,
- $hdel$ ,
- $hlen$ 字段数量,
- $hexists$ 字段存在,
- $hkeys$ 获取所有 $key$ ,
- $hvals$ 获取所有 $value$ ,
- $hincrby/hincrbyfloat$ ,
- $hsetnx$ 当前 $key$ 的 $field$ 不存在时才设置.
2.3 list
保存多个数据,底层使用双向链表实现
内部数据都是string
类型,可以进行索引操作,最多保存 $2^{32} - 1$ 个元素
- $lpush/rpush$ 添加
- $lrange/lindex$ 获取,可以通过 $0\ \ -1$ 查询全部数据
- $llen$ 长度
- $lpop/rpop$ 删除
- $blpop/brpop$ 周期内等待获取并删除(阻塞)
- $lrem$ 移除指定数据,$count$ 可以指定删除个数
2.4 set
用于存储大量数据,拥有高效的查询机制。
set
与hash
结构相同,但仅使用 $field$ ,$value$ 为 $nil$
- $sadd$ 添加
- $smembers$ 获取全部
- $srem$ 删除
- $scard$ 个数
- $sismember$ 存在
- $srandmember$ 随机
- $spop$ 随机并移除
- $sinter/sunion/sdiff$ 交并差,差具有方向
- $sinterstore/sunionstore/sdiffstore$ 交并差并存储
- $smove$ 移动
2.5 sorted_set
/zset
保存可排序的数据,在set
的基础上添加可排序字段,称为 $score$。
保存的数据空间是 $64$ 位,可以是一个 $double$ 值。
- $zadd$ ,
- $zrange/zrevrange$ 升序/降序,最后添加 $withscores$ 可以显示 $score$ ,
- $zrem$ ,
- $zrangebyscore/zrevrangebyscore$ 条件查询,
- $zremrangebyrank/zremrangebyscore$ 条件删除,
- $zcard/zcount$ ,
- $zinterstore/zunionstore$ 可以通过 $aggregate$ 指定 $score$ 值得处理方式,
- $zrank/zrevrank$ 获取排位,
- $zscore/zincrby$ $score$ 设置.
3. 通用命令
3.1 key
- $del/exists/type$ 删除/存在/类型,
- $expire/pexpire/expireat/pexpireat$ 设置周期,后两者指定 $timestamp$ ,
- $ttl/pttl$ 获取周期,$-2/-1$ 分别代表不存在和永久,
- $persist$ 转换为永久,
- $keys$ 查询,
- $rename/renamenx$ 重命名,后者只有不存在时才会执行,
- $sort$ ,
- $help\ \ @generic$ 查询所有相关命令,
3.2 db
Redis
为每个服务提供了 $16$ 个数据库,相互独立。
- $select$ 切换,
- $ping$ 测试服务器连接,
- $echo$ ,
- $move$ 如果指定数据库包含同名 $key$ ,则不会移动,
- $flushdb/flushall$ 清除,
- $dbsize$ 当前数据库大小查询.
4. Jedis
Redis
中的指令名称与Jedis
中的方法名相同。
// 连接
Jedis jedis = new Jedis("127.0.0.1", 6379);
// 操作
jedis.set("name", "example");
// 关闭
jedis.close();
$JedisPool$ 对象
public class JedisUtils {
private static JedisPool jedisPool = null;
private static String host;
private static int port;
private static int maxTotal;
private static int maxIdle;
static {
ResourceBundle resourceBundle = ResourceBundle.getBundle("redis");
host = resourceBundle.getString("redis.host");
port = Integer.parseInt(resourceBundle.getString("redis.port"));
maxTotal = Integer.parseInt(resourceBundle.getString("redis.maxTotal"));
maxIdle = Integer.parseInt(resourceBundle.getString("redis.maxIdle"));
JedisPoolConfig jedisPoolConfig = new JedisPoolConfig();
jedisPoolConfig.setMaxTotal(maxTotal);
jedisPoolConfig.setMaxIdle(maxIdle);
jedisPool = new JedisPool(jedisPoolConfig, host, port);
}
public static Jedis getJedis() {
return jedisPool.getResource();
}
}
5. Linux
下的Redis
操作
- $redis-server\ \ –port$ 更改端口,
- $redis-cli\ \ -h\ \ -p$ 设置主机和端口,
- $redis.conf$ .
# 端口
port 6379
# 保护模式,开启后只能通过本地访问
protected-mode no
# 以守护进程方式启动, docker 环境下启动需设置为 no
daemonize no
# 日志文件名
logfile "6379.log"
# 日志文件路径
dir /data
6. 持久化
利用永久性存储介质保存数据,用于防止数据意外丢失。
RDB
保存当前数据,速度较快,但是不能保证实时性,且当数据较多时会明显变慢,快照形式,AOF
保存操作,能够实现实时性,日志形式.
6.1 RDB
指令
6.1.1 save
通过RDB
模式进行持久化,文件默认保存在 $/data/dump.rdb$ 中。执行过程中会阻塞服务器,直到RDB
过程完成,不建议在线上环境中使用。
# 文件名
dbfilename "dump-6379.rdb"
# 文件路径
dir /data
# 是否压缩(LZF压缩)
rdbcompression no
# 是否进行数据校验
rdbchecksum no
6.2.2 bgsave
后台进行持久化,会调用 $fork$ 函数生成一个子进程,可以在日志文件中查询记录。
# 后台保存出错时是否停止操作,默认开启
stop-writes-on-bgsave-error yes
6.2.3 自动
# 如果在10秒内有2个key改变,就执行bgsave
bgsave 10 2
6.2 RDB
特殊启动模式
- 全量复制
- $debug\ \ reload$ 服务器运行过程中重启,
- $shutdown\ \ save$ 关闭服务器时保存.
6.3 AOF
写指令会先被发送到AOF
写命令刷新缓冲区,生成 $.aof$ 文件。
# 开启AOF
appendonly yes
# AOF策略,always/everysec/no
appendfsync everysec
# 文件名
appendfilename "appendonly-6379.aof"
# 路径
dir /data
AOF
策略:
- $always$ 每次,通过 $fork$ 生成子进程进行,
- $everysec$ 每秒,通过 $fork$ 生成子进程,将操作存储在
AOF
缓存区中,如果是重写,还会有aof
重写缓存区,时间到达后写入, - $no$ 系统控制.
6.4 AOF
重写
- $bgrewriteaof$ 后台重写,
- 自动
- $auto-aof-rewrite-min-size$ 最小重写大小,
- $auto-aof-rewirte-percentage$ 自动重写百分比.
执行 $info\ \ Persistence$ 指令可以查询持久化信息。
当
$$ aof_-current_-size > \\ auto-aof-rewrite-min-size \times \\ \frac{aof_-current_-size\ - \ aof_-base_-base_-size}{aof_-base_-size} >= \\ auto-aof-rewrite-percentage $$
时触发自动重写。
6.5 对比
RDB |
AOF |
|
---|---|---|
占用存储空间 | 小(压缩) | 大(重写) |
存储速度 | 慢 | 快 |
恢复速度 | 快 | 慢 |
数据安全性 | 会丢失 | 依据策略 |
资源消耗 | 高 | 低 |
启动优先级 | 低 | 高 |
7. 事务
类似于DBMS
中的事务,命令在事务内并不会立即执行。
- $multi$ 开启事务,
- $exec$ 执行事务,
- $discard$ 取消事务.
7.1 流程
- 服务器接收到指令后会判断是否处于事务状态,
- 接收到 $multi$ 指令后会创建队列,转换为事务状态,
- 之后再接收指令时,会把指令加入队列,
- 接收到 $exec$ 指令时,依次执行队列中的指令,
- 如果接收到 $discard$ 指令,销毁队列.
如果命令中存在语法错误,则整个事务都会被销毁。
7.2 锁
- $watch$ 添加监视锁,如果在 $exec$ 之前发生了变化则终止事务执行($exec$ 返回 $nil$),监视锁要在开启事务之前设置,
- $unwatch$ 取消全部监视锁,
- $setnx$ 添加公共锁,若有返回值则设置失败,
- $del$ 删除公共锁,
- $expire/pexpire$ 为锁添加时效,防止长时间被占用.
8. 删除策略
在使用 $expire$ 等操作设置数据周期时,会将数据地址和过期时间以哈希键值对的方式存储在 $expires$ 块中,Redis
的每个数据库都有一个 $expires$ 区域。
- 定时删除,
到达指定时间后同时删除存储区和 $expires$ 区中的数据,对CPU
负担较大,会抢占当前线程. - 惰性删除,
到达指定时间后不删除,下次访问时再进行删除。采取此种策略时,每个访问都要调用一次 $expireIfNeeded()$ 函数,用于判断数据是否过期。占用较多内存. - 定期删除,
- 使用 $info\ \ Server$ 命令可以得到一个 $hz$ 值,代表每秒执行的 $serverCron()$ 函数的次数,轮询服务器,
- 该函数调用 $databaseCron()$ 函数,轮询 $expires$,
- 在这些块内调用 $activeExpireCycle()$ 函数,每次执行 $\Large\frac{250}{hz}\normalsize ms$,
- 随机挑选 $W$ 个 $key$ 进行检测并删除超时数据,如果删除的数量 $>\Large\frac{W}{4}$ ,循环,
- 通过 $active_-expire_-cycle_-lookups_-per_-loop$配置可以设置 $W$ 的值,$current_-db$ 记录当前轮询的$expires$ 块.
8.1 逐出算法
Redis
在执行命令前会调用 $freeMemoryIfNeeded()$ 函数,用于检测内存是否充足,如果不足,则会删除一些数据,而清理过程中使用的算法称为逐出算法。当逐出算法失败时,会抛出错误信息。
- $maxmemory$ 设置
Redis
的最大可支配内存,默认为全部, - $maxmemory-samples$ 随机获取数据时每次获取的个数,
- $maxmemory-policy$ 挑选删除数据的策略,
- 检测易失数据($expires$),
- $volatile-lru$ 最近最久未使用,
- $volatile-lfu$ 最近最少次数使用,
- $volatile-ttl$ 最接近过期,
- $volatile-random$ 随机,
- 全库数据,
- $allkeys-lru$,
- $allkeys-lfu$,
- $allkeys-random$,
- 不驱逐 $no-enviction$.
- 检测易失数据($expires$),
通过 $info$ 命令中的 $keyspace$_$hits$ 和 $keyspace$_$misses$ 可以得到命中率。
9. 服务器配置
- $daemonize$ 守护进程,
Docker
中要设为 $no$, - $bind$ 绑定主机地址,绑定之后只能通过该地址访问,
- $port$ 端口号,
- $database$ 数据库数量,
- $loglevel\ \ [debug|verbose|notice|warning]$ 日志记录级别,默认为 $verbose$ ,生产环境中可以设为 $notice$,
- $logfile$ 日志文件名,
- $maxclients$ 最大客户端连接数,默认为无限,
- $timeout$ 最大闲置时间,$0$ 为关闭该功能,
- $include$ 导入其他配置.
10. 高级数据类型
10.1 Bitmaps
Bitmaps
相当于对string
类型进行二进制操作的一个接口。
- $getbit$ 获取指定偏移量上的
bit
值, - $setbit$ 设置,
- $bitop$ 对 $key$ 之间进行 $and/or/not/xor$ 操作并保存到指定 $key$ 中,
- $bitcount$ 统计指定范围内
bit
为 $1$ 的数量.
10.2 HyperLogLog
统计不重复的数据数,运用了LogLog
算法,是一个估算算法,在大量数据时存在误差,估计结果是一个带有 $0.81%$ 标准错误的近似值。每个 $HyperLogLog key$ 只占用最多 $12K$ 内存用于标基数。
- $pfadd$ 添加,
- $pfcount$ 统计,
- $pfmerge$ 合并.
10.3 GEO
计算坐标点之间的距离
- $geoadd$ 添加,通过经纬度的方式添加,
- $geopos$ 获取,
- $geodist$ 计算,可以指定单位,
- $georadius$ 获取指定范围内符合条件的坐标,
- $georadiusbymember$,
- $geohash$ 获取对应坐标哈希.
11. 主从复制
主服务器为 $master$ ,收集数据(写数据),提供给多台服务器,称为 $slave$ ,用于提供数据(读数据)。一个 $master$ 可以对应多个 $slave$ ,而一个 $slave$ 只能对应一个 $master$ ,一个服务器可以既是 $slave$ 也是 $master$。主从复制即将 $master$ 的数据即时有效的复制到 $slave$ 中。
11.1 连接
$slave$ 连接 $master$ 。
- $slaveof\ \ [ip]\ \ [port]$ 可以添加在配置文件中,
- 发送指令后 $master$ 响应,
- 保存 $masterhost$ 和 $masterport$,
- 根据保存的信息创建 $socket$,
- 周期性地发送 $ping-pong$ 消息,
- $auth\ \ password$ 验证授权,
- $replconflistening-port\ \ [port]$ 发送监听端口到 $master$,
- $master$ 保存监听端口,
- $slaveof\ \ no\ \ one$ 断开连接.
11.1.1 授权访问
- $master$ 配置文件中设置密码 $requirepass$ $[password]$,
- $master$ 客户端发送命令设置密码 $config$ $set$ $requirepass$ $[password]$ / $config$ $get$ $requirepass$,
- $slave$ 配置文件设置密码 $masterauth$ $[password]$,
- $slave$ 客户端发送命令设置密码 $auth$ $[password]$,
- 启动客户端设置密码 $redis-cli$ $-a$ $[password]$.
11.2 数据同步
- $slave$ 发送 $psync2$ 请求同步,
- $master$ 执行 $bgsave$ ,在第一个 $slave$ 连接时,创建一个命令缓冲区,用于以
AOF
形式缓冲RDB
过程中添加的新命令, - 生成
RDB
文件,通过 $socket$ 发送给 $slave$, - $slave$ 接收
RDB
,清空数据并执行RDB
恢复, - 发送消息通知恢复完成,请求部分同步,
- $master$ 复制缓冲区信息,以
AOF
形式发送, - $slave$ 执行 $bgrewriteaof$ 恢复部分同步数据.
$1-4$ 称为全量复制,$5-7$ 称为部分复制,复制完成后 $slave$ 端保有 $master$ 端的全部数据以及复制过程接收的数据,$master$ 保有 $slave$ 当前同步的位置。
在进行全量复制时,如果数据量过大,时间过长导致缓冲区中数据溢出,则必须重新进行全量复制,可以通过在配置文件中设置 $repl-backlog-size$ 改变缓冲区大小。
设置 $repl-backlog-size$ 的流程:
- 测算 $master$ 和 $slave$ 的重连时长 $second$,
- 获取 $master$ 的 $write_-size_-per_-second$,
- $repl-backlog-size$ $=$ $2$ $\times$ $second$ $\times$ $write_-size_-per_-second$.
在复制过程中,通过设置 $slave-serve-stale-data$ 来令 $slave$ 关闭对外服务。如果 $slave$ 过多导致 $master$ 带宽不足,应调整结构,最好为树状结构。
11.3 命令传播
在 $master$ 和 $slave$ 建立连接后,应实时保持数据同步。在该阶段内如果发生短时间网络中断,就要进行部分复制,同步短时间内的改变。
11.3.1 部分复制的核心要素
- 服务器运行
id
服务器运行时的身份识别码,在多次运行中可以生成多个,是一个由 $40$ 位字符组成的随机十六进制字符串,用于身份识别。使用 $info\ \ Server$ 内可以查询到运行id
$run_-id$ 。 - $master$ 的复制缓冲区
命令发送给 $master$ ,$master$ 在将命令同步到 $slave$ 时,还会把命令发送到复制缓冲区中。复制缓冲区是一个队列,由偏移量和字节值组成,每台服务器启动时,如果开启了AOF
或者成为 $master$ ,都要创建复制缓冲区。 - $master$ 和 $slave$ 间的复制偏移量
$master$ 通过 $offset$ 记录不同 $slave$ 间传播数据的量。$offset$ 既记录在 $master$ 中,也记录在 $slave$ 中,在每次发送时记录,用于断线后恢复(部分复制)。
11.3.2 流程
- $slave$ 发送 $psync2\ \ [run_-id]\ \ [offset]$ ,在首次连接时通过发送 $psync2\ \ ?\ \ -1$ 获取
id
和偏移量, - $master$ 执行 $bgsave$ 记录偏移量,
- 发送 $+FULLRESYNC\ \ [run_-id]\ \ [offset]$ 进行全量复制,再通过 $socket$ 发送
RDB
文件, - $slave$ 接收到
id
和偏移量,进行全量复制, - $slave$ 发送 $psync2\ \ [run_-id]\ \ [offset]$,
- $master$ 判断
id
是否匹配,偏移量是否存在于复制缓冲区中,若不存在,重新进行全量复制, - 如果接收到的偏移量与存储的偏移量相同则忽略,不同则发送 $+CONTINUE\ \ [offset]$ ,再通过 $socket$ 发送复制缓冲区中新增的数据,
- $slave$ 接收到部分复制的消息,更新偏移量,执行 $bgrewriteaof$ 恢复数据.
11.4 心跳机制
- $master$ 心跳指令 $PING$ ,判断 $slave$ 是否在线,默认周期 $10$ 秒,可以通过设置 $repl-ping-slave-period$ 改变,查询 $info\ \ replication$ 可以获取最后一次连接时间间隔,
- $slave$ 心跳指令 $REPLCONF\ \ ACK\ \ [offset]$,默认周期 $1$ 秒,用于汇报偏移量和判断 $master$ 是否在线.
$min-slaves-to-write$ 最小写数量,小于就不再写数据,
$min-slaves-max-lag$ 最长延迟时间,若超过这个时间,不再写数据,
$slave-serve-stale-data$ 如果 $slave$ 延迟过大,是否暂时屏蔽程序对 $slave$ 的数据访问,
$slave$ 的数量和延迟由 $REPLCONF ACK$ 命令得到。
11.4.1 流程
接上,命令传播阶段,在该过程中 $master$ 也会发送 $PING$ 指令。
- 发送 $REPLCONF\ \ ACK\ \ [offset]$,
- $master$ 判断是否处于缓冲区,
- 执行全量复制/部分复制,
- $slave$ 执行复制.
11.5 内部优化
当数据过多时,每次重启都要进行一次全量复制,内部优化机制可以缓解问题。
- $master$ 创建 $mater_-replid$ ,使用 $run_-id$ 生成,发送给所有 $slave$,
- $master$ 关闭时执行 $shutdown\ \ save$ ,将 $run_-id$ 和 $offset$ 保存到
RDB
文件中,使用 $redis-check-rdb\ \ [*.rdb]$ 可以查看 $repl-id$ 和 $repl-offset$, - $master$ 重启后加载
RDB
,同时加载 $repl-id$ 和 $repl-offset$ ,通过 $info$ 可以查看 $master_-repl_-id$ 和 $master_-repl_-offset$.
12. 哨兵模式
如果当前 $master$ 宕机,需要一个 $slave$ 作为新的 $master$ ,这时需要通知所有 $slave$ 。哨兵( $sentinel$ ) 是一个分布式系统,也是一台Redis
服务器,用于监控主从结构中的每台服务器,并通过投票机制选出新的 $master$ ,通常配置奇数个哨兵。
- 监控 $master$ 和 $slave$ 是否正常运行,
- 如果服务器出现问题,向其他哨兵和客户端发送通知,
- 断开 $mater$ 和 $slave$ 的连接,选择一个 $slave$ 作为新的 $master$ ,将其他 $slave$ 连接到新的 $master$ ,并通知客户端新的服务器地址。
$redis-sentinel\ \ [*.conf]$ 启动哨兵,指定配置文件。哨兵在启动后会在配置文件中添加 $myid$ 以及一些主从配置信息,并且会随着状态更新信息。
设置哨兵后可以通过 $redis-cli\ \ -p\ \ [port]$ 连接哨兵服务器,但是不能进行 $get/set$ 等操作,只能进行哨兵的指令,通过 $info$ 的 $Sentinel$ 下可以获取相关信息。
12.1 配置
# 端口
port 26379
# 守护进程模式
daemonize no
# 日志文件名
logfile "26379.log"
# 日志路径
dir /data
# 监控的 master,2 代表当存在 2 台哨兵认为宕机时即判断该
# master 已经宕机,通常设置为哨兵数的一半加一
sentinel monitor mymaster 127.0.0.1 6379 2
# master 多久未响应即为宕机, ms
sentinel down-after-milliseconds mymaster 30000
# 新的 master 的并行同步数
sentinel parallel-syncs mymaster 1
# 同步的最长时间,ms
sentinel failover-timeout mymaster 180000
12.2 原理
12.2.1 监控
- 连接 $master$ ,通过 $INFO$ 获取 $run_-id$ 和 $role$ 以及各个 $slave$ 和 $sentinel$ 的信息,建立一个
CMD
连接, - 获取 $sentinel$ 的状态,通过 $PING$ ,建立起一个通道,用于相互之间传输信息,在之后也会不断发送 $PING$ 用于确认是否在线,
- 获取 $slave$ 的信息,通过 $INFO$ ,获取 $run_-id$ , $role$ , $master_-host$ , $master_-port$ , $offest$ 等,同样建立起
CMD
连接.
12.2.2 通知
$sentinel$ 周期性的给各个服务器发送信息,确认其是否在线,再将取得的信息发送给其他 $sentinel$。
12.2.3 故障转移
- 如果一个 $master$ 没有及时响应,$sentinel$ 会通知其他 $sentinel$ ,将其标志为 $SRI_-S_-DOWN$ ,即主观下线。
- 其他 $sentinel$ 也会发送信息给该 $master$ ,如果有达到数量的 $sentinel$ 标记其为 $SRI_-S_-DOWN$ ,那么它就会被标记为 $SRI_-O_-DOWN$ ,即客观下线。
- $sentinel$ 发送自己的信息,并通过投票机制(接收到信息的先后顺序),直到获得半数以上的票数后,选出的 $sentinel$ 负责选出新的 $master$ 。
- $sentinel$ 根据响应速度和与之前 $master$ 断开时间,再通过优先原则(优先级、偏移量和 $run_-id$ 大小)决出新的 $master$ 。
- $sentinel$ 通知新的 $master$ 和其他 $slave\ \ master$ 改变的信息。
13. 集群
Redis
服务器将所有的存储空间计划切割成 $16384$ 个槽( $slot$ ),每台主机均保存部分槽,在进行 $key$ 存储时,要先计算出其存储的槽。如果在后续有增加主机,则从现有的主机中每台选出部分槽存储在新主机上。
在集群内部,各个数据库之间相互通信,保存各个库中槽的编号数据。当未命中时,数据库可以通过保存的数据给出要查找的 $key$ 所在的数据库。
在集群模式中,如果 $slave$ 下线,不会影响集群,下线 $slave$ 的 $master$ 会将下线状态发送给其他 $master$ 。当 $slave$ 重新上线后,会清除自己和其他 $master$ 的下线状态。
如果 $master$ 下线,$slave$ 会重复连接( 周期为 $1s$ )直到超时,超时后会选出 $slave$ 成为新的 $master$ 。$master$ 重新连接后,新的 $master$ 清除掉下线状态,将其作为 $slave$ 同步。
13.1 配置
使用集群前要更改配置,添加在 $redis.conf$ 文件内。
# 启动集群
cluster-enabled yes
# 集群配置文件,集群开启后会生成在 dir 指定的路径
cluster-config-file node-6379.conf
# 集群超时时间, ms
cluster-node-timeout 30000
# master 连接的 slave 的最小数量
# cluster-migration-barrier 1
13.2 启动
redis-cli --cluster create --replicas [num] [master_host:ip]... [slave_host:ip]
开启集群,可以通过 $–replicas$ 指定内部结构,$num$ 代表一台 $master$ 有 $num$ 台 $slave$ ,后续输入的主从地址要符合结构,先输入所有的 $master$ ,再按序输入所有的 $slave$ 。
在连接集群服务器时,使用 $redis-cli\ \ -c$ ,会将不属于当前服务器管理的槽的数据自动转到其他服务器或者从其他服务器取出当前服务器管理的槽的数据。
13.3 操作
- $cluster\ \ nodes$ 查看节点信息,
- $cluster\ \ replicate\ \ [master_-run_-id]$ 切换一个 $slave$ 的 $master$,
- $cluster\ \ meet\ \ [host:ip]$ 为新节点添加 $master$,
- $cluster\ \ forget\ \ [run_-id]$ 忽略一个没有槽的节点,
- $cluster\ \ failover$ 手动故障转移.
14. 解决方案
14.1 缓存预热
在Redis
服务器部署后,如果发生请求数高,吞吐量大,同步操作频繁,容易发生宕机。
14.1.1 解决
- 前置,
- 统计高频数据,
- 利用
LRU
构建数据留存队列( $storm/kafka$ ),
- 准备,
Redis
优先加载高频数据,- 利用分布式技术加快数据读取,
- 实施,
- 使用脚本触发数据预热,
- 使用
CDN
.
14.2 缓存雪崩
数据库连接量激增导致 $408$, $500$ 等错误页面的出现,客户反复刷新导致流量居高不下。通常是Redis
中一个较短时间内大量 $key$ 过期导致。
14.2.1 解决
- 更多静态页面
- 多级缓存( $Nginx$, $Redis$, $Ehcache$ 等)
- 优化
SQL
语句 - 监控服务器性能指标(
CPU
占用率,内存占用率,平均响应时间,线程数等) - 限流
也可以针对过期问题解决
- 切换删除策略(
LRU
,LFU
等), - 调整有效期,错峰删除(分类,增加随机时间等),
- 对于高频数据使用永久 $key$,
- 定期维护,分析数据访问量,
- 锁.
14.3 缓存击穿
Redis
某个高频数据过期导致数据库访问量激增,从而使数据库崩溃。
14.3.1 解决
- 统计高频数据
- 定时任务,在高峰期前刷新数据有效期
- 实时监控,将高频数据延长周期或设置为永久
- 错峰删除
- 锁
14.4 缓存穿透
Redis
命中率下降导致数据库崩溃。通常由于数据库中没有对应数据或者Redis
未持久化 $null$ 数据导致,也可能是黑客攻击导致。
14.4.1 解决
- 缓存 $null$ ,设置短时限
- 拦截异常访问/布隆过滤器
- 监控
Redis
命中率,使用黑名单进行防控 - 启动防灾业务 $key$ ,如设置加密 $key$ ,拦截不符合规则的访问
14.5 监控
监控工具:
- $Cloud\ \ Insight\ \ Redis$,
- $Prometheus$,
- $Redis-stat$,
- $Redis-faina$,
- $RedisLive$,
- $zabbix$.
监控命令:
- $redis-benchmark$ $-h$ $[host]$ $-p$ $[port]$ $-c$ $[connect]$ $-n[request]$,
$-c$ 指定连接数,$-n$ 指定请求数. - $redis-cli$,
- $monitor$,
开启监控. - $slowlog\ \ get/len/reset$,
获取慢日志/获取慢日志条目/重置慢日志, 相关配置:- $slowlog-log-slower-than$ 慢查询时间下限,微秒,
- $slowlog-max-len$ 慢查询日志长度.
- $monitor$,
14.5.1 性能
- $latency$ 响应延迟,
- $instantaneous_-ops_-per_-sec$ 每秒处理请求数,
- $hit\ \ rate$ 命中率.
14.5.2 内存
- $used_-memory$ 内存占用,
- $mem_-fragmentation_-ratio$ 碎片率,
- $evicted_-keys$ 由于内存限制而移除的 $key$ 的数量,
- $blocked_-clients$ 由于阻塞操作( $blpop$ , $brpop$ 等)而阻塞的客户端数量.
14.5.3 活动
- $connected_-clients$ 客户端连接数,
- $connected_-slaves$ 连接的$slave$ 数,
- $master_-last_-io_-second_-ago$ 最近一次交互距今,
- $keyspace$ 数据库中 $key$ 的数量.
14.5.4 持久化
- $rdb_-last_-save_-time$ 最近一次
RDB
时间 - $rdb_-changes_-since_-last_-save$ 最近一次
RDB
至今改变的数据量
14.5.5 错误
- $rejected_-connections$ 客户端数量达到上限后拒绝的连接数
- $keyspace_-misses$ 未命中次数
- $master_-link_-down_-since_-seconds$ 主从断连持续时间