BAT数据工程师面试原题.docx

BAT数据工程师面试原题.docx

ID:52563412

大小:18.88 KB

页数:6页

时间:2020-03-28

BAT数据工程师面试原题.docx_第1页
BAT数据工程师面试原题.docx_第2页
BAT数据工程师面试原题.docx_第3页
BAT数据工程师面试原题.docx_第4页
BAT数据工程师面试原题.docx_第5页
资源描述:

《BAT数据工程师面试原题.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、SQL面试题1.用一条SQL语句查询出每门课都大于80分的学生姓名(5分)namekechengfenshu张三语文81张三数学75李四语文76李四数学90王五语文81王五数学100王五英语90答案:2.按照分数对数据进行排序(5分)表名scoresnumnamescore111tom100114nick89112rouse95113jery89116miss83排序结果:namescoreranktom1001rouse952nick893jery893miss835答案:3.hive表tmp_row_num,按muid分组,然后同muid组内按muid,time

2、排序(10分)muidchannelostime242443391Y1android20150319242443391Y2iOS201503202443391Y1android201503192443391Y3ios201503212423391Y1android201503192423391Y4ios20150311预期结果:channelmuidtimerankY12423391201503191Y42423391201503112Y42424430391201503231Y22424430391201503222Y12424430391201503123Y22

3、42443391201503201Y1242443391201503192答案:4.请说明hive中SortBy,OrderBy,ClusterBy,DistrbuteBy各代表什么意思(5分)5.hive一行变多行(5分)表名tb_splitdateAB20141018aa7

4、8

5、520141019bb9

6、10

7、11预期结果:dateAB20141018aa720141018aa820141018aa520141019bb920141019bb1020141019bb11答案:6.自动统计分布:(10分)table:包含订单id和每个订单的预估时长(eta)单位m

8、inorder_ideta123410245515135530实现结果:得到订单的eta分布且左边的eta的分段按照大小排列,分段要求小于30分钟按照每5min间隔分段>=30min&<60min按照每10分钟分段,大于60分钟-300分钟按照每30分钟分段,最后>=300分钟:结果:[0,5)订单数[5,10)订单数.....[30,40)订单数….[60,90)订单数….[300,+]订单数7.groupby,With ROLLUP, With CUBE有什么作用(10分)8.按比例抽样抽样10%抽样50%(10分)1.怎么理解皮尔逊相关系数2.什么是辛普森悖论

9、,怎么避免辛普森悖论?3.什么是闵科夫斯基距离,怎么理解4.什么是:协同过滤、n-grams,mapreduce、余弦距离?每个人的发展都是动态的,但也各自核心的特质。就我来说,我最大的性格特点是稳重,包容性强,积极主动。我相信人的不断进步是通过不断突破自己的安全边界来实现的。日常生活中我一直对周围环境保持着好奇与开放的态度,乐于与不同领域的人交流学习,不管是出租车司机还是教授,与不同领域的人交流后产生的思想火花经常会为我打开一个看待世界的新角度。同时在处理日常问题时,我倾向于以宏观的思维来提前预估事物可能的发展趋势与不同风险,在有一定把握后再进行实施。而且一旦我认

10、准了一件事,就会全力以赴把它做好。但这样有时也会产生一些问题,因为有些事情不直接实施的话很难对问题的本质有一个清晰的认识。对这些问题,行动是提升把握程度的最好方法。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。