databricks.koalas.DataFrame.spark.repartition¶

spark.repartition(num_partitions: int) → ks.DataFrame¶

Returns a new DataFrame partitioned by the given partitioning expressions. The resulting DataFrame is hash partitioned.

Parameters

num_partitionsint: The target number of partitions.

Returns

DataFrame

Examples

>>> kdf = ks.DataFrame({"age": [5, 5, 2, 2],
...         "name": ["Bob", "Bob", "Alice", "Alice"]}).set_index("age")
>>> kdf.sort_index()  
      name
age
2    Alice
2    Alice
5      Bob
5      Bob
>>> new_kdf = kdf.spark.repartition(7)
>>> new_kdf.to_spark().rdd.getNumPartitions()
7
>>> new_kdf.sort_index()   
      name
age
2    Alice
2    Alice
5      Bob
5      Bob

databricks.koalas.DataFrame.spark.apply

databricks.koalas.DataFrame.spark.coalesce