Fixes #3589: Add support for Parquet files similar to CSV/Arrow #3711

vga91 · 2023-08-03T09:48:50Z

This PR adds the support for Apache Parquet export/import/load

Added 4 export procedures that streams a list of byte[] one per each batch: apoc.export.parquet.all.stream, apoc.export.parquet.graph.stream, apoc.export.parquet.query.stream, apoc.export.parquet.data.stream
Added 4 export procedures which create a Parquet file and return a ProgressInfo result, like the CSV ones: apoc.export.parquet.all, apoc.export.parquet.graph, apoc.export.parquet.query, apoc.export.parquet.data
Added one load procedure apoc.load.parquet that reads a Parquet byte[] or a Parquet file and returns a map for each row
Added one import procedure apoc.import.parquet that import data from a Parquet byte[] or a Parquet file

In order to load/import complex data not recognized by parquet, like Duration, Point, List of Duration, etc... , which will be stringified during export,
we can use the mapping: {keyToConvert: valueTypeName} config to convert them.
For example apoc.import.parquet(fileName, {mapping: {foo: "DurationArray"}}) in order to convert a key foo to a List of Duration

Created a follow-up card to create doc files and any other additions

… (#3731)

Fixes #3589: Add support for Parquet files similar to CSV/Arrow

0c61979

vga91 added extended-functionality dev labels Aug 3, 2023

conker84 approved these changes Aug 21, 2023

View reviewed changes

conker84 merged commit ce24439 into dev Aug 21, 2023

conker84 deleted the load-export-parquet branch August 21, 2023 08:15

vga91 added a commit that referenced this pull request Aug 22, 2023

Fixes #3589: Add support for Parquet files similar to CSV/Arrow (#3711)

5be24c7

vga91 added a commit that referenced this pull request Aug 22, 2023

Fixes #3589: Add support for Parquet files similar to CSV/Arrow (#3711)

2908c1e

vga91 added a commit that referenced this pull request Aug 22, 2023

Fixes #3589: Add support for Parquet files similar to CSV/Arrow (#3711)…

9a00d99

… (#3731)

vga91 mentioned this pull request Aug 22, 2023

[YM9jwcK7] Follow up parquet procedures - Added documentation #3736

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fixes #3589: Add support for Parquet files similar to CSV/Arrow #3711

Fixes #3589: Add support for Parquet files similar to CSV/Arrow #3711

vga91 commented Aug 3, 2023 •

edited

Loading

Fixes #3589: Add support for Parquet files similar to CSV/Arrow #3711

Fixes #3589: Add support for Parquet files similar to CSV/Arrow #3711

Conversation

vga91 commented Aug 3, 2023 • edited Loading

vga91 commented Aug 3, 2023 •

edited

Loading