Spark原理 (1) 基本工作原理与RDD

优速盾-小U • 2022年8月9日 02:34 • 行业资讯 • 阅读 796

某台能链接 spark 服务器的电脑,提交 spark 程序

多节点,

从 Hadoop /HDFS/Hise读取数据,读取数据分别存到节点,主要存储到节点的内存中.

在节点中对数据进行处理,处理后的数据可能存储到别的节点的内存上.

所有计算操作都是多个节点并行计算

处理后的数据可能会回到 Hadoop,HDFS,Hive 等,或者 MySQL 这种DB 里.或者直接把结果返回客户端

spark 提供的核心抽象

弹性分布式数据集

一个 RDD 在逻辑上抽象的代表了一个 HDFS 文件,但是实际上是被分区的,多个分区散落在多个节点上

让 RDD 中的数据可以并行操作

通常通过 Hadoop 上的文件 ,即 HDFS 文件或者 Hive 表来进行创建,有时也可以通过应用程序中的集合来创建.

RDD 提供了容错性,可以自动从节点失败中恢复过来,假如某一个节点上的数据出错,RDD 可以通过自己的数据来源重新计算该 partition.

RDD 数据默认放在内存中,但内存不足时,会自动将 RDD 存入磁盘

定义初始的 RDD 从哪里读取数据,

定义 RDD 的计算操作,这个在 spark 称之为算子,map reduce ,等等

循环往复的过程

获得最终的数据,将数据保存起来

底层都是 RDD 和计算操作

原文链接：https://blog.csdn.net/xm961217/article/details/106558204

原创文章，作者：优速盾-小U，如若转载，请注明出处：https://www.cdnb.net/bbs/archives/6428

赞 (0)

0 0

租用速度快的海外大带宽服务器首选台湾服务器

上一篇 2022年8月9日 02:29

云原生时代，2个方案轻松加速百万级镜像

下一篇 2022年8月9日 02:43

linux负载均衡集群收费,全面讲述linux集群负载均衡

学习linux时，你可能会遇到linux集群的问题，这里将介绍linux集群负载均衡的方法，通过仔细整理，在这里拿出来和你们…

优速盾-小U
行业资讯 2022年10月15日
000633
cdn回源php_简述回源原理和CDN缓存

回源原理 – 什么是回源？网上查了下资料，回源大致是指浏览器在发送请求报文时，响应该请求报文的是源站点的服务器&#xff0c…

优速盾-小U
行业资讯 2022年8月23日
000843
行业资讯

企业如何搭建属于自己的网站？

网站，作为互联网时代企业的一张名片，得到越来越多人的认可与重视。企业网站不仅承担着企业品牌宣传重要的窗口角色，而且也具备开拓渠道、联络客…

优速盾-小U
2022年7月30日
000773
跨境电商卖家的福音来啦！全球首款4S加速器AgileCDN在沪亮相

当前，跨境电商已成为我国稳外贸的重要力量。据统计，仅2020年我国跨境电商进出口额就高达1.69万亿元，同比上涨31.1%。随着跨境出海体量的不断增大，市场对于内容分发网络（cdn…

优速盾-小U
行业资讯 2022年11月16日
000896
华为云助跑广东“专精特新”企业高质量发展

为推进广东省“专精特新”企业高质量发展，扶持更多中小企业走向“专精特新”，4月20日，华为云联合软通动力及南方日报共同举办了“广东专精特新企业发展论坛”。东莞市工业和信息化局四级调…

优速盾-小U
行业资讯 2022年8月19日
000923
行业资讯

jsdelivr cdn报错无法访问

背景很多接触开源的朋友可能知道jsdelivr，而且经常使用这个cdn服务，这是一个非常快的免费的cdn服务，所有公开的javascri…

优速盾-小U
2022年8月15日
000966
行业资讯

本地网站和服务器同步的软件,本地网站和服务器同步

本地网站和服务器同步内容精选换一换华为云帮助中心，为用户提供产品简介、价格说明、购买指南、用户指南、API参考、最佳实践、常见问题、视频帮助等技术文档&#xff…

优速盾-小U
2022年7月30日
000671
自建CDN防御DDoS（2）：架构设计、成本与部署细节

下面，我们将介绍自建cdn的具体建设规划，主要从以下几个方面进行考量：硬件成本、带宽成本、架构设计、实际部署。硬件成本在硬件上&#xf…

优速盾-小U
行业资讯 2022年8月23日
0001.1K
中国最大的香港服务器提供商

作为中国最大的香港服务器提供商的天下数据基于对香港自由的经济环境、开放的网络、充足的带宽资源、高性价的服务器产品的认识,十几年前就开始部署香港海外服务器市场,目前已经成为内地众多企…

优速盾-小U
行业资讯 2025年5月22日
000250
行业资讯

cloudflare免费证书_【建站必知】使用 Cloudflare 免费 CDN 加速和保护自己的网站

点击蓝字关注我获取高效/实用/好玩的工具软件和教程前言之前也发布过 Cloudflare 系列教程，但时间久了，界面和操作有些变化&#xff0…

优速盾-小U
2022年8月19日
0001.6K

发表回复

优速盾注册领取大礼包www.cdnb.net

/sitemap.xml