1.排序语法,默认是降序吗
默认 asc 升序
2.限制多少行语法
limit
3.分组函数有哪些
GROUP BY 是分组查询, 一般 GROUP BY 是和聚合函数配合使用
分组函数:(五个)
1···max(expr):求expr的最大值 }\
2···min(expr):求expr的最小值 }-- 数据类型是有规定的
3···sum(expr):求expr的总和 }-- 必须是字符型或数字
4···avg(expr):求expr的平均值 }/
5···count(expr):求expr的个数
expr的类型不能是空,如果是空,则不计入其中, 因此需要用到nvl()来进行转换
4.分组语法是什么
group by expr1,expr2,...的用法:
group by 的后面跟的是炫耀分组的条件,
例如用 department_id 进行分组,可以写成 group by department_id
如果需要多重分组,只需要在后面急需添加筛选条件即可;
Tips:select 语句中不包含分组函数的列,如果用group by 语句,
那么就需要全部出现在group by的语句中;
5.分组语法的注意点是什么
6.join有哪几种
left join(左联接) 返回包括左表中的所有记录和右表中联结字段相等的记录
right join(右联接) 返回包括右表中的所有记录和左表中联结字段相等的记录
inner join(等值连接) 只返回两个表中联结字段相等的行
7.left join是哪个表数据全
a left join b ; a最全
8.union 和union all 区别是什么
union 会去重
union all 不会
9.谈谈你们觉得什么是子表
任何一个查询结果都可以是子表,相当于临时表,或者缓存
10.模糊查询名称ename的有s字符的名称有哪些?
查询姓名以S开头的\以S结尾\包含S字符\第二个字母为L __
SELECT emp.ename FROM emp WHERE emp.ename LIKE 'S%';
SELECT emp.ename FROM emp WHERE emp.ename LIKE '%S';
SELECT emp.ename FROM emp WHERE emp.ename LIKE '%S%';
SELECT emp.ename FROM emp WHERE emp.ename LIKE '_L%';
11.like查询语法,比如是第三个字符是s,那么前面是不是要用两个占位符?
是的 LIKE '_s%';
12.谈谈你们对hadoop的理解
13.hadoop包含哪三大组件,分别是做什么的
hdfs 存储
mapreduce 计算
yarn资源和作业调度
HDFS:
HDFS 是Hadoop上分布式文件系统
HDFS采用主从模式,其架构主要包含
NameNode DataNode Client三个部分
NameNode : 用于存储生成文件系统的元数据。运行一个实列,因此需要解决单点故障问题
DataNode :用于存储实际的数据,并将自己管理的数据块信息上报给NameNode,运行多个实例。一个数据默认存储3个副本
分布在3个不同的DataNode以保证可用性。
Client: 支持使用者读写HDFS,从NameNode获取元数据或实际数据返回给使用者。可以有多个实例,和业务一起运行。
MapReduce是Google提出的一种并行计算框架:
Map:映射,对一些独立元素组成的列表的每一个元素进行指定的操作。每个元素都是被独立操作的,而
原始列表没有被更改。Map操作是可以高度并行的,这对高性能应用以及并行计算领域的需求非常有用。
Reduce: 化简,对一个列表的元素进行适当的合并,虽然它不如Map那么并行,但是因为化简总是一个简单的答案,
大规模的运算相对独立,所以化简函数在高度并行环境下也很有用。
适合:大规模数据集的离线批处理计算;任务分而治之,子任务相对独立
不适合:实时的交互式计算,要求快速响应和低延迟,比如BI;流失计算,实时分析,比如广告点击计算;子任务之间相互依赖的迭代计算。
Yarn:
是Hadoop2.0后的资源管理系统,它是一个通用的资源管理模块,可为各类应用程序进行资源管理和调度
yarn是轻量级弹性计算平台,除了MapReduce框架,还可以支持其他框架,比如Spark,Storm等
多种框架统计管理,共享集群资源:
*资源利用率高
*运维成本低
14.hadoop官网地址是什么
hadoop.apache.org
15.maven编译是不是需要pom.xml
需要
16.maven的默认仓库文件夹在哪
可改变默认的 .m2 目录下的默认本地存储库文件夹
通过修改${user.home}/.m2/settings.xml 配置本地仓库路径 ,没有settings这个xml文件就新建,或者如下复制个;具体看图:
17.我们进行hadoop部署是什么模式?有进程吗
单机部署 进程没有
伪分布式部署 进程存在+1节点 开发
集群部署 进程存在+n节点 开发/生产
18.hdfs的存储也是从 根目录 开始的吗
是的
19.伪分布式部署时要配置jdk和ssh,那么请问你们 配置ssh无密码的访问,这个流程会吗
哈哈 会
20.tar解压时,特别要留意一个东西是什么
用户用户组
·