Set是Redis中的单列集合,其特点为不保证有序性、保证元素唯一、可以求交集、并集、差集。

从上面我们可以看出,Set对查询元素的效率要求非常高,那么什么样的数据结构合适呢?
HashTable
也就是Redis中的Dict,不过Dict是双列集合(可以存键、值对)Set是Redis中的集合,不一定确保元素有序,可以满足元素唯一、查询效率要求极高。
set-max-intset-entries时,Set会采用IntSet编码,以节省内存。快速回顾
「Redis数据结构」整数集合(intSet)
「Redis数据结构」哈希表(Dict)


当集合对象可以同时满足以下两个条件时, 对象使用 intset 编码:
集合对象保存的所有元素都是整数值;
集合对象保存的元素数量不超过 512 个;
不能满足这两个条件的集合对象需要使用 hashtable 编码。
对于使用 intset 编码的集合对象来说, 当使用 intset 编码所需的两个条件的任意一个不能被满足时, 对象的编码转换操作就会被执行: 原本保存在整数集合中的所有元素都会被转移并保存到字典里面, 并且对象的编码也会从 intset 变为 hashtable 。
编码转换案例
创建了一个只包含整数元素的集合对象, 该对象的编码为 intset :
redis> SADD numbers 1 3 5
(integer) 3redis> OBJECT ENCODING numbers
"intset"
不过, 只要我们向这个只包含整数元素的集合对象添加一个字符串元素, 集合对象的编码转移操作就会被执行hashtable:
redis> SADD numbers "seven"
(integer) 1redis> OBJECT ENCODING numbers
"hashtable"
除此之外, 如果我们创建一个包含 512 个整数元素的集合对象, 那么对象的编码应该会是 intset :
redis> EVAL "for i=1, 512 do redis.call('SADD', KEYS[1], i) end" 1 integers
(nil)redis> SCARD integers
(integer) 512redis> OBJECT ENCODING integers
"intset"
但是, 只要我们再向集合添加一个新的整数元素, 使得这个集合的元素数量变成 513 , 那么对象的编码转换操作就会被执行:
redis> SADD integers 10086
(integer) 1redis> SCARD integers
(integer) 513redis> OBJECT ENCODING integers
"hashtable"
set-max-intset-entries时,Set会采用IntSet编码,目的是节省内存。参考
《Redis 设计与实现》
黑马程序员