Oracle Database 19c 新特性之 ANY_VALUE 聚合函数
创始人
2024-03-22 10:32:19
0

ANY_VALUE 函数是 Oracle 19c 新增的一个聚合函数,可以为分组操作之后的每个组返回一个任意值,可以解决查询字段不属于 GROUP BY 字段的问题。

假如我们想要获取每个部门中的员工数量,可以使用 COUNT 函数和 GROUP BY 子句(示例数据):

SELECT d.dept_id, d.dept_name, COUNT(e.emp_id)
FROM department d
LEFT JOIN employee e 
ON e.dept_id = d.dept_id
GROUP BY d.dept_id, d.dept_name;DEPT_ID|DEPT_NAME|COUNT(E.EMP_ID)|
-------+---------+---------------+1|行政管理部|              3|2|人力资源部|              3|3|财务部   |              2|4|研发部   |              9|5|销售部   |              8|6|保卫部   |              0|

我们需要将所有非聚合函数中的字段(d.dept_id 以及 d.dept_name)写在 GROUP BY 子句中,否则查询将会返回错误。例如:

SELECT d.dept_id, d.dept_name, COUNT(e.emp_id)
FROM department d
LEFT JOIN employee e 
ON e.dept_id = d.dept_id
GROUP BY d.dept_id;SQL 错误 [979] [42000]: ORA-00979: 不是 GROUP BY 表达式

在以上查询中,d.dept_name 字段由 d.dept_id 字段唯一决定,逻辑上并不需要出现在 GROUP BY 子句中,但是 SQL 语法上必须这样写。另外,GROUP BY 中的字段会带来额外的性能开销。一个常用的解决方法就是使用 MIN 或者 MAX 函数。例如:

SELECT d.dept_id, MAX(d.dept_name), COUNT(e.emp_id)
FROM department d
LEFT JOIN employee e 
ON e.dept_id = d.dept_id
GROUP BY d.dept_id;DEPT_ID|MAX(D.DEPT_NAME)|COUNT(E.EMP_ID)|
-------+----------------+---------------+1|行政管理部        |              3|2|人力资源部        |              3|3|财务部           |              2|4|研发部           |              9|5|销售部           |              8|6|保卫部           |              0|

这种方法可以避免在 GROUP BY 子句中使用额外的字段,但是新增的 MIN 或者 MAX 函数仍然会带来一定的性能开销。

为了彻底解决这个问题,我们可以使用 ANY_VALUE 聚合函数。该函数的使用方法和 MIN 或者 MAX 相同,但是它的开销更小,因为它会直接返回组内第一个非空的数据。例如:

SELECT d.dept_id, ANY_VALUE(d.dept_name), COUNT(e.emp_id)
FROM department d
LEFT JOIN employee e 
ON e.dept_id = d.dept_id
GROUP BY d.dept_id;DEPT_ID|ANY_VALUE(D.DEPT_NAME)|COUNT(E.EMP_ID)|
-------+----------------------+---------------+1|行政管理部              |              3|2|人力资源部              |              3|3|财务部                 |              2|4|研发部                 |              9|5|销售部                 |              8|6|保卫部                 |              0|

除此之外,当我们想要为每个部门返回一个任意的员工姓名,也可以使用 ANY_VALUE 函数实现:

SELECT d.dept_id, ANY_VALUE(d.dept_name), ANY_VALUE(e.emp_name), COUNT(e.emp_id)
FROM department d
LEFT JOIN employee e 
ON e.dept_id = d.dept_id
GROUP BY d.dept_id;DEPT_ID|ANY_VALUE(D.DEPT_NAME)|ANY_VALUE(E.EMP_NAME)|COUNT(E.EMP_ID)|
-------+----------------------+---------------------+---------------+1|行政管理部              |张飞                  |              3|2|人力资源部              |诸葛亮                |              3|3|财务部                 |孙尚香                |              2|4|研发部                 |赵氏                  |              9|5|销售部                 |法正                  |              8|6|保卫部                 |                     |              0|

使用 ANY_VALUE 函数时,需要注意它是一个不确定性的函数,不确保每次调用都返回相同的结果。

数据量不大的时候 ANY_VALUE 函数性能提升不明显。但是随着数据量的增加,它的性能比 GROUP BY 子句增加字段或者使用 MIN 或者 MAX 函数更好。

使用 MIN 或者 MAX 函数获取任意数据时可能会引起误解,因为它们通常表示获取最小值或者最大值。而使用 ANY_VALUE 函数含义更加明确。

另外,虽然 ANY_VALUE 函数的参数支持 ALL 以及 DISTINCT 关键字,但是它们并不会影响结果。

相关内容

热门资讯

新华社消息|三部重要法律案将提... 记者:魏冠宇、赵博 编导:季晓庄 新华社国内部 新华社音视频部 联合制作
北京公安机关十年共审查违法犯罪... 光明网记者 陈畅 孙满桃 创新推行“48小时速裁+不起诉案件快速办理+取保候审案件集中快审”三种模式...
河套合作区深圳园区条例获通过 12月26日上午,深圳市七届人大常委会第四十二次会议在举行第二次全体会议后闭幕。会议表决通过《深圳经...
依法严厉打击节日市场食品领域突... 2026年元旦、春节将至,节令食品和假期餐饮进入消费高峰期。为切实保障群众餐桌安全,公安部环境资源和...
连宿连淮高速开通 连云港市区高... 12月25日,连云港市召开“连宿”“连淮”高速公路建设工程开通运营暨市区部分高速公路路段差异化收费政...
四部门打出就业创业政策组合拳 ... 昨天,财政部等四部门出台指导意见,要求进一步发挥政府性融资担保体系增信分险作用,引导更多金融资源精准...
三部重要法律案将提请2026年... 新华社北京12月27日电(记者冯家顺)十四届全国人大常委会第十九次会议12月27日表决通过相关议案,...
演员保剑锋发布律师声明 12月26日,@保剑锋工作室 账号发布声明: 近期,部分网络用户在我方发布声明后仍持续、恶意散播关于...
一次性信用修复政策哪些情况能享... 极目新闻记者 刘闪 实习生 刘佳妮 12月22日,中国人民银行发布《关于实施一次性信用修复政策有关安...