马克java社区,马克吐温社区,Spark，Scala，Spark Scala当中reduceByKey的用法,马克-to-win,青少年Java,教程,入门,零基础,小白,菜鸟,初学者,自学者

Spark Scala当中reduceByKey的用法

马克- to-win：马克 java社区：防盗版实名手机尾号： 73203。
    /*reduceByKey(function)
reduceByKey就是对元素为KV对的RDD中Key相同的元素的Value进行function的reduce操作(如前所述)，因此，Key相同的多个元素的值被reduce为一个值，然后与原RDD中的Key组成一个新的KV对。
马克-to-win @ 马克java社区：reduceByKey(_+_)是reduceByKey((x,y) => x+y)的一个简洁的形式
*/

    val rdd08 = sc.parallelize(List((1, 1), (1, 4),(1, 3), (3, 7), (3, 5)))
    val rdd08_1 = rdd08.reduceByKey((x, y) => x + y)
    println("reduceByKey 用法 " + rdd08_1.collect().mkString(","))

    sc.stop()
}

def myunion(rdd05: RDD[Int], rdd06: RDD[Int]): Unit = {
    val res: RDD[Int] = rdd05.union(rdd06)
    /*马克-to-win @ 马克java社区：collect: 收集一个弹性分布式数据集的所有元素到一个数组中,这样便于我们观察，毕竟分布式数据集比较抽象。Spark的collect方法，是Action类型的一个算子，会从远程集群拉取数据到driver端。最后，将大量数据
汇集到一个driver节点上，将数据用数组存放，占用了jvm堆内存，非常用意造成内存溢出，只用作小型数据的观察。*/
    val arr = res.collect();
    println("arr(0) is " + arr(0) + " arr(2) is " + arr(2) + " arr(4) is " + arr(4));
}
}

输出结果：

map 用法 is 1,16,9,49,25
filter 用法 1,4,3
map2 用法 is 马克-to-win @ 马克java社区：2,5,4,8,6
filter2 用法马克-to-win @ 马克java社区：4,7,5
arr(0) is 1 arr(2) is 3 arr(4) is 5
sum is 55
reduceByKey 用法 (1,8),(3,12)

Spark,Scala 入门

数据库初级

Spark,Scala 入门

数据库 初级

数据库初级