输入: 此阶段从存储中读取的数据量。 这可以从 Delta、Parquet、CSV 等进行读取。 输出: 此阶段写入存储的数据量。 这可能写入 Delta、Parquet、CSV 等。 随机读取: 此阶段读取的随机数据量。 随机写入: 这个阶段写了多少随机数据。

如果你不熟悉洗牌是什么,现在是 了解 这意味着什么的好时机。

记下这些数字,因为稍后可能需要这些数字。

较长的阶段中任务的数量可以指引你找到问题的方向。 可以通过查看此处来确定任务数: