这个仓库用来自己学习 Spark 写的一些代码总结
这里主要是参考网上其他文章自己定义的 sql 优化规则
官网API:https://spark.apache.org/docs/latest/api/scala/org/apache/spark/sql/index.html
课程上一些简单的 spark 实践
学习 Spark 调优专栏的一些优化案例整理
1、字节跳动在 Spark SQL 上的核心优化实践(Bucket Join)
2、利用 Delta Lake 使 Spark SQL 支持跨表 CRUD 操作
3、Spark 3.3.0 中 DS V2 Push-down 的重构与新特性
4、SPARK的计算向量化-已有的向量化项目
5、SparkSQL 在有赞大数据的实践