Spark 集群优化配置 |
iServer 的分布式分析服务是基于 Spark 计算平台,提供 GIS 分布式分析处理的能力。不同的硬件环境、Spark 集群环境,以及不同大小的分析数据,都会影响分布式分析的性能表现。要达到最优的性能,就需要依据不同的使用场景进行优化配置。下面提供一些常用的优化配置方法,您可以根据具体环境来配置Spark,具体如下:
进入 Spark 安装包的 conf 目录,例如【iServer 安装目录】support\spark\conf,将 spark-defaults.conf.template 文件重命名为 spark-defaults.conf
用文档编辑器打开 spark-defaults.conf,添加:spark.executor.memory 8g
修改 spark driver 内存
进入 Spark 安装包的 conf 目录,例如【iServer 安装目录】support\spark\conf,将 spark-defaults.conf.template 文件重命名为 spark-defaults.conf
用文档编辑器打开 spark-defaults.conf,添加:spark.driver.memory 5g
如果使用的是 iServer 内置的 spark ,则可以设置 Spark 主节点不参与分析任务
依次点击 spark 主节点所在的 iServer“集群”“加入集群”,取消掉“是否分布式分析节点”的集群报告器。
进入 Spark 安装包的 conf 目录,例如【iServer 安装目录】support\spark\conf,将 spark-defaults.conf.template 文件重命名为 spark-defaults.conf
用文档编辑器打开 spark-defaults.conf,添加:spark.scheduler.mode FIFO