What are the data formats supported by Spark?

Question

1 Answer

rajeshsharma · Answer 1 · 2024-09-14T23:27:09+0000

Spark supports a variety of data formats, including but not limited to:

Text Files: Plain text files (e.g., CSV, JSON).

SequenceFiles: A Hadoop data format.

Parquet: A columnar storage format.

ORC: Optimized Row Columnar format.

Avro: A binary format used for serializing data.

Image Files: For processing images.

LibSVM: Common format for support vector machine algorithms.