Spark-shell批量命令执行脚本的方法
更新时间:2018年06月19日 16:34:58 作者:小蜗牛也有梦想
今天小编就为大家分享一篇Spark-shell批量命令执行脚本的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
批量执行spark-shell命令,并指定提交参数
#!/bin/bash source /etc/profile exec $SPARK_HOME/bin/spark-shell --queue tv --name spark-sql-test --executor-cores 8 --executor-memory 8g --num-executors 8 --conf spark.cleaner.ttl=240000 <<!EOF import org.apache.spark.sql.SaveMode sql("set hive.exec.dynamic.partition=true") sql("set hive.exec.dynamic.partition.mode=nonstrict") sql("use hr") sql("SELECT * FROM t_abc ").rdd.saveAsTextFile("/tmp/out") sql("SELECT * FROM t_abc").rdd.map(_.toString).intersection(sc.textFile("/user/hdfs/t2_abc").map(_.toString).distinct).count !EOF
以上这篇Spark-shell批量命令执行脚本的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS
这篇文章主要介绍了iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS的相关资料,需要的朋友可以参考下2015-10-10Shell脚本中使用for循环和cat命令实现按顺序合并文件
这篇文章主要介绍了Shell脚本中使用for循环和cat命令实现按顺序合并文件,本文先是用sed命令来实现,发现不能完成需求,后使用for循环解决,需要的朋友可以参考下2015-01-01
最新评论