hive执行计划


查看SQL的执行计划Hive提供的执行计划目前可以查看的信息有以下几种:
● 查看执行计划的基本信息,即explain;
● 查看执行计划的扩展信息,即explain extended;
● 查看SQL数据输入依赖的信息,即explain dependency;
● 查看SQL操作相关权限的信息,即explain authorization;
● 查看SQL的向量化描述信息,即explain vectorization。

查看执行计划的基本信息在查询语句的SQL 前面加上关键字explain 是查看执行计划的基本方法。用explain打开的执行计划包含以下两部分:
● 作业的依赖关系图,即STAGE DEPENDENCIES;
● 每个作业的详细信息,即STAGE PLANS。

explain extended,顾名思义就是对explain的扩展,打印的信息会比explain更加丰富,包含以下三部分的内容。
● 抽象语法树(Abstract Syntax Tree, AST):是SQL转换成MapReduce或其他计算引擎的任务中的一个过程。在Hive 3.0版本中,AST会从explainextended中移除,要查看AST,需要使用explain ast命令。
● 作业的依赖关系图,即STAGE DEPENDENCIES,其内容和explain所展现的一样,不做重复介绍。
● 每个作业的详细信息,即STAGE PLANS。在打印每个作业的详细信息时,explain extend 会打印出更多的信息,除了explain 打印出的内容,还包括每个表的HDFS读取路径,每个Hive表的表配置信息等。


文章作者: Callable
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Callable !
评论
  目录