成人色网站免费观看,天堂www在线资源天堂在线,高清国产亚洲精品自在久久,两个人的免费视频,真人强讦试看20分钟真

軟件介紹

軟件標簽: spark編程指南 spark教程

spark編程指南 pdf是一部非常實用的spark教程，這部電子書詳細講解了spark編程方法以及技巧，能夠讓你快速入門，需要的朋友歡迎來綠色資源網免費下載！

spark編程指南pdf

Spark編程指南電子書介紹

總體上來說，每個Spark應用都包含一個驅動器（driver）程序，驅動器運行用戶的main函數，并在集群上執行各種并行操作。

Spark最重要的一個抽象概念就是彈性分布式數據集（resilient distributed dataset – RDD），RDD是一個可分區的元素集合，其包含的元素可以分布在集群各個節點上，并且可以執行一些分布式并行操作。RDD通常是通過，HDFS（或者其他Hadoop支持的文件系統）上的文件，或者驅動器中的Scala集合對象，來創建或轉換得到；其次，用戶也可以請求Spark將RDD持久化到內存里，以便在不同的并行操作里復用之；最后，RDD具備容錯性，可以從節點失敗中自動恢復數據。

Spark第二個重要抽象概念是共享變量，共享變量是一種可以在并行操作之間共享使用的變量。默認情況下，當Spark把一系列任務調度到不同節點上運行時，Spark會同時把每個變量的副本和任務代碼一起發送給各個節點。但有時候，我們需要在任務之間，或者任務和驅動器之間共享一些變量。Spark提供了兩種類型的共享變量：廣播變量和累加器，廣播變量可以用來在各個節點上緩存數據，而累加器則是用來執行跨節點的“累加”操作，例如：計數和求和。

Spark編程指南pdf目錄

1. Introduction

2. 快速上手

i. SparkShell

ii. 獨立應用程序

iii. 開始翻滾吧!

3. 編程指南

i. 引入Spark

ii. 初始化Spark

iii. SparkRDDs

i. 并行集合

ii. 外部數據集

iii. RDD操作

i. 傳遞函數到Spark

ii. 使用鍵值對

iii. Transformations

iv. Actions

iv. RDD持久化

iv. 共享變量

v. 從這里開始

4. SparkStre

i. 一個快速的例子

ii. 基本概念

i. 關聯

ii. 初始化StreamingContext

iii. 離散流

iv. 輸入DStreams

v. DStream中的轉換

vi. DStream的輸出操作

vii. 緩存或持久化

viii. Checkpointing

ix. 部署應用程序

x. 監控應用程序

iii. 性能調優

i. 減少批數據的執行時間

ii. 設置正確的批容量

iii. 內存調優

iv. 容錯語義

5. SparkSQL

i. 開始

ii. 數據源

i. RDDs

ii. parquet文件

iii. JSON數據集

iv. Hive表

iii. 性能調優

iv. 其它SQL接口

v. 編寫語言集成(Language-Integrated)的相關查詢

vi. SparkSQL數據類型

6. GraphX編程指南

i. 開始

ii. 屬性圖

iii. 圖操作符

TableofContentsiv. PregelAPI

v. 圖構造者

vi. 頂點和邊RDDs

vii. 圖算法

viii. 例子

7. 部署

i. 提交應用程序

ii. 獨立運行Spark

iii. 在yarn上運行Spark

8. 更多文檔

i. Spark配置

軟件截圖

上一張下一張(1 / 1)

安裝詳細截圖

下載地址電腦版

spark編程指南中文版

點擊報錯軟件無法下載或下載后無法使用，請點擊報錯，謝謝！

關閉報錯反饋

請描述您所遇到的錯誤，我們將盡快予以修正，謝謝！

*必填項，請輸入內容

spark編程指南中文版

同類相關軟件

廈門繪玩編程 v3.9 安卓版

浮云識音軟件官方版 v1.5.9 最新版

學習強企官方 v1.0 安卓版

喜書郎電話手表ipad版客戶端 v3.1.3 ios越獄版

蝦米音樂ipad客戶端 v8.1.5 蘋果ios版

軟件介紹

Spark編程指南電子書介紹

Spark編程指南pdf目錄

軟件截圖

下載地址電腦版

spark編程指南中文版

關閉報錯反饋

用戶評論

熱門評論

最新評論

發表評論查看所有評論(0)

Spark編程指南電子書介紹

Spark編程指南pdf目錄

spark編程指南中文版

關閉報錯反饋

熱門評論

最新評論

發表評論 查看所有評論(0)

發表評論查看所有評論(0)