• Spark 提供了数据的核心抽象,称为弹性分布式数据集 (RDD)。此数据集的全部或部分可以缓存在内存中,并在多次计算期间重复使用。RDD实际上是一个分布在多个节点上的数据集。RDD的主要特点如下:RDD是不可变的,但它可以转换为新的RDD
    admin9小时前
    60