您现在的位置是：首页 >其他 >spark on k8s 部署的一点理解网站首页 其他

spark on k8s 部署的一点理解

Jason不在家 2023-06-17 20:00:02

简介spark on k8s 部署的一点理解

Running Spark on Kubernetes - Spark 3.4.0 Documentation (apache.org)

前提条件

1. 本地有spark安装包，以便于执行 spark submit 命令

2. k8s 集群，以及本地的有 kubectl 并且配置的用户包含相关权限，具体可以参考官网

一些观念的转变

spark on k8s 并不会启动一个常驻的集群，而是再 submit 提交任务时启动对应的pod作为driver 和 executor，任务结束后，这些pod 都会被释放

./bin/spark-submit 
    --master k8s://https://<k8s-apiserver-host>:<k8s-apiserver-port> 
    --deploy-mode cluster 
    --name spark-pi 
    --class org.apache.spark.examples.SparkPi 
    --conf spark.executor.instances=5 
    --conf spark.kubernetes.container.image=<spark-image> 
    local:///path/to/examples.jar

上面是官网上提供的启动示例，主要分为几步

1. 调用本地的 spark-submit 命令

2. spark-submit 进程请求 k8s API 创建dirver pod （使用本地的 ~/.kubi/config 获取权限）

3. driver pod 创建 executor pod 作为执行器来执行任务

4. 任务结束后pod会完成，释放资源，所以没有任务的时候不会占用资源

5. 实时任务则一直执行

关于spark配置

使用spark难免会需要一些 hdfs 、hive-metastore 等配置、xml 等，把这些配置打到镜像里显然可以，但很不灵活。

本地spark-submit 进程创建pod时会将本地的spark配置作为configMap挂在到pod中

所以只要维护好本地提交的spark环境即可，

可以先通过 kubectl describe pod ** 来找到对相应的configMap

然后通过 kubectl describe configmap 来确认配置

关于权限

本地提交是使用的用户权限，来自 ~/.kube/config

提交后driver后，driver 需要创建pod的权限，这里可以使用的是 serviceAccout 的权限，创建权限以及如何指定serviceAccount 参考官网RBAC部分

风语者！平时喜欢研究各种技术，目前在从事后端开发工作，热爱生活、热爱工作。

上一篇
用于自动化的 10 个杀手级 Python 脚本...

下一篇
详解设计模式之单例模式

站长推荐

U8W/U8W-Mini使用与常见问题解决
U8W/U8W-Mini使用与常见问题解决
分享几个国内免费的ChatGPT镜像网址(亲测有效)
分享几个国内免费的ChatGPT镜像网址(亲测有效)
stm32使用HAL库配置串口中断收发数据（保姆级教程）
stm32使用HAL库配置串口中断收发数据（保姆级教程）
QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。
QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。...
SpringSecurity实现前后端分离认证授权
SpringSecurity实现前后端分离认证授权