Spark SQL-Pivot
Contents
类似Excel的数据透视表,分类聚合。也可以协助实现行转列,Pivoting “Wide” to “Long” Format
在统计分析时总会遇到分类汇总的场景,类似Excel的数据透视表。SQL中按照 case when
或 IF
的写法往往会显得臃肿,较为方便的便是通过 pivot
1实现,但 Hive 不支持😢
以下基于 spark-2.4.5U3 及以上版本
基本语法
|
|
The
PIVOT
clause can be specified after the table name or subquery.
实际应用
假设有张存有各个地区、各个产品的月销量的表(sales_table),我们需要统计各个月份所有地区产品销量的加总,形如👇
|
|