【数据分析面试】大厂高频SQL笔试题(一)

01、写在前面

秋高气爽,金桂飘香,十月份即将结束,对于求职的小伙伴们来说,“金九银十”已经接近尾声,不知道小伙伴们有没有找到自己心仪的工作呢?相信大多数的小伙伴都经历过数据分析的面试流程了,在数据分析的面试过程中,除了常规的业务问题外,还会重点考查数据分析的技术能力,这里就不得不提SQL了,SQL作为数据分析的笔试必考题,常常被用来检验候选人的技术水平,而且有些题目也是非常的刁钻,这对于初入职场的“小白”也是非常不友好。不过不用担心,结合自己多年的数据分析的求职和工作经验,我们接下来会有一系列文章,详细讲解数据分析面试中那些高频出现的SQL笔试题以及各大厂的SQL笔试题,学习了这些笔试题的常见套路和解法,把这些题目都刷一遍,在接下来的笔试中应该可以一往无前,势如破竹!,收割offer啦! 

数据分析笔试中比较常考查的一个知识点就是行/列转换,以及一行/多行转换,因为在实际的业务中数据原本的存储方式可能不便于我们进行分析,所以我们需要进行行/列的转换,以及一行/多行的转换,这个转换过程非常常见也比较的tricky,所以也是数据分析面试中经常考查的内容!下面我们就通过实际的案例来进行讲解。


02、行/列转换

行/列转换在做数据分析时会经常遇到,所谓的行/列转换就是如下图所示两种展示形式的互相转换。

我们假设有4款产品ABCD,分别在三个电商平台天猫、淘宝和京东上进行销售,下表分别以两种形式记录了某个月各产品(Product)在各个平台(Platform)的销售数量(Quqntity)。我们为了分析的方便,需要对两种形式进行转换,也就是我们常说的行/列转换。

行转列

假如我们有下表,由Product、Platform、Quantity三个字段组成,但是为了方便展示,我们需要将Platform中的每一平台展示为一列,也就是行转列。

方法一:PIVOT

在SQL SERVER中,提供了专门进行行列转换的函数:PIVOT,PIVOT的一般语法是:

FROM table_source    -- 表名称,即数据源

    PIVOT(

    聚合函数(value_column)    -- value_column 要转换为 列值 的列名

    FOR pivot_column        -- pivot_column 指定要转换的列

    IN(column_list)        -- column_list 自定义的目标列名

)

使用PIVOT进行行转列的代码如下:

SELECT *

FROM table

PIVOT (

    SUM(quantity) FOR platform IN ('天猫','淘宝','京东')

)

通过上面 SQL 语句即可得到下面的结果:

PIVOT 后跟一个聚合函数SUM来拿到结果,FOR 后面跟的平台Platform是我们要转换的列,这样的话平台中的天猫、淘宝、京东就就被转换为列。IN 后面跟的就是具体的平台名称。

方法二:聚合函数+CASE WHEN

需要注意的是PIVOT是SQL SERVER的内置函数,对于行列转换非常方便,但Oracle、MySQL是不支持PIVOT函数的。我们可以用聚合函数配合CASE语句实现。使用 CASE WHEN 可以得到和 PIVOT 同样的结果,但是没有 PIVOT 简单直观。

SELECT Product,

  MAX(CASE WHEN Platform='天猫' THEN quantity ELSE 0 END) AS "天猫",

  MAX(CASE WHEN Platform='淘宝' THEN quantity ELSE 0 END) AS "淘宝",

  MAX(CASE WHEN Platform='京东' THEN quantity ELSE 0 END) AS "京东"

FROM table

GROUP BY Product

列转行

反过来,假设我们有下表 table,各个平台已经作为一列出现,我们需要将各个平台汇总为一列,也就是列转行。

方法一:UNPIVOT

与行转列类似,在SQL SERVER中,提供了列转行的函数:UNPIVOT,UNPIVOT的一般语法是:

FROM table_source    -- 表名称,即数据源

    UNPIVOT(

    value_column    -- value_column 要转换为 行值 的列名

    FOR pivot_column    -- pivot_column 指定要转换为指定的列

    IN(column_list )    -- column_list 目标列名

)

使用UNPIVOT进行列转行的代码如下:

SELECT *

FROM table

UNPIVOT (

    quantity FOR Platform IN ("天猫","淘宝","京东")

)

通过 UNPIVOT 可得到如下结果:

方法二:聚合函数+UNION

同理,Oracle,MySQL也是不支持UNPIVOT函数的,对于这种情况我们可以通过聚合函数+UNION的方式将数据组合起来。

SELECT

    Product,

    '天猫' AS Platform ,

    MAX("天猫") AS Quantity

FROM table GROUP BY Product

UNION

SELECT

    Product,

    '淘宝' AS Platform ,

    MAX("淘宝") AS Quantity

FROM table GROUP BY Product

UNION

SELECT

    Product,

    '京东' AS Platform ,

    MAX("京东") AS Quantity

FROM table GROUP BY Product

03、一行/多行转换

在数据分析中,还有一个非常常见的场景,就是需要将一行数据拓展为多行数据,或者将多行数据汇总为一行数据,这种一行/多行的数据转换问题也是面试中频繁考查的知识点之一,举例如下图所示。

一行转多行

原数据如下:table表中有两个字段,产品(Product)和供应商(Supplier),每个产品有多个供应商,各个供应商以逗号分割汇总为一行。现在需要将各个供应商分别展开为一行。

针对这种情况,Hive中提供了一个很高效的方法:lateral view和explode等函数一起使用,能将一行数据拆分成多行数据,在此基础上可以对拆分的数据进行聚合,使用的时候需要注意:

1、explode接受一个数组(或一个map)作为输入,并将数组元素(map)作为单独的行输出。UDTF可以在SELECT表达式列表中使用,也可以作为LATERAL VIEW的一部分使用。

2、LATERAL VIEW是配合explode(或者其他的UDTF),把单行数据拆解成多行后的数据结果集。

3、LATERAL VIEW explode要放置于from之后,where之前

SELECT DISTINCT Product,Supplier

FROM table

LATERAL VIEW explode (split(Supplier,',')) as t -- t为新表别名

拆成后结果:

多行转一行

反过来,我们想把多行再变回一行,需要怎么处理呢?我们可以使用:collect_set +concat_ws来实现。代码如下:

SELECT Product,concat_ws(',',collect_set(Supplier)) Product_Supplier

FROM table

GROUP BY Product

最终还原为一行数据如下:

注意:上述用的到的collect_set函数,有两个作用,第一个是去重,去除group by后的重复元素,

第二个是形成一个集合,将group by后属于同一组的集合起来成为一个集合。与contact_ws结合使用就是将这些元素以逗号分隔的形式形成字符串。

以上就是数据分析面试—SQL高频面试题部分的内容,部分数据分析文章请翻看历史文章,更多数据分析面试笔试的文章请移步共粽号:【数据分析星球】,敬请期待,如果觉得不错,也欢迎分享、点赞和点收藏哈~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,132评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,802评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,566评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,858评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,867评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,695评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,064评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,705评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,915评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,677评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,796评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,432评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,041评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,992评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,223评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,185评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,535评论 2 343

推荐阅读更多精彩内容