AbsaOSS · dk1844 · Nov 9, 2020 · Oct 26, 2020 · Oct 26, 2020 · Oct 26, 2020
diff --git a/...k-jobs/src/main/scala/za/co/absa/enceladus/standardization/StandardizationExecution.scala b/...k-jobs/src/main/scala/za/co/absa/enceladus/standardization/StandardizationExecution.scala
@@ -57,8 +57,6 @@ trait StandardizationExecution extends CommonJobExecution {
     val rawFs = preparationResult.pathCfg.raw.fileSystem
     val rawFsUtils = rawFs.toFsUtils
 
-    val stdFs = preparationResult.pathCfg.standardization.fileSystem
-
     val stdDirSize = rawFsUtils.getDirectorySize(preparationResult.pathCfg.raw.path)
     preparationResult.performance.startMeasurement(stdDirSize)
 
@@ -112,10 +110,9 @@ trait StandardizationExecution extends CommonJobExecution {
 
   protected def readStandardizationInputData[T](schema: StructType,
                                                 cmd: StandardizationConfigParser[T],
-                                                path: String,
+                                                rawInput: PathWithFs,
                                                 dataset: Dataset)
                                                (implicit spark: SparkSession,
-                                                rawFs: FileSystem,
                                                 dao: MenasDAO): DataFrame = {
     val numberOfColumns = schema.fields.length
     val standardizationReader = new StandardizationPropertiesProvider()
@@ -127,9 +124,9 @@ trait StandardizationExecution extends CommonJobExecution {
         val inputSchema = PlainSchemaGenerator.generateInputSchema(schema, optColumnNameOfCorruptRecord)
         dfReaderConfigured.schema(inputSchema)
     }
-    val dfWithSchema = readerWithOptSchema.load(s"$path/*")
+    val dfWithSchema = readerWithOptSchema.load(s"${rawInput.path}/*")
 
-    ensureSplittable(dfWithSchema, path, schema)(spark, rawFs.toFsUtils)
+    ensureSplittable(dfWithSchema, rawInput, schema)
   }
 
   private def getColumnNameOfCorruptRecord[R](schema: StructType, cmd: StandardizationConfigParser[R])
@@ -222,9 +219,10 @@ trait StandardizationExecution extends CommonJobExecution {
 
   //scalastyle:off parameter.number
 
-  private def ensureSplittable(df: DataFrame, path: String, schema: StructType)
-                              (implicit spark: SparkSession, fsUtils: DistributedFsUtils): DataFrame = {
-    if (fsUtils.isNonSplittable(path)) {
+  private def ensureSplittable(df: DataFrame, input: PathWithFs, schema: StructType)
+                              (implicit spark: SparkSession): DataFrame = {
+    implicit val fsUtils = input.fileSystem.toFsUtils
+    if (fsUtils.isNonSplittable(input.path)) {
       convertToSplittable(df, schema)
     } else {
       df

diff --git a/spark-jobs/src/main/scala/za/co/absa/enceladus/standardization/StandardizationJob.scala b/spark-jobs/src/main/scala/za/co/absa/enceladus/standardization/StandardizationJob.scala
@@ -39,8 +39,7 @@ object StandardizationJob extends StandardizationExecution {
 
     val preparationResult = prepareJob()
     val schema =  prepareStandardization(args, menasCredentials, preparationResult)
-    implicit val rawFs: FileSystem = preparationResult.pathCfg.raw.fileSystem
-    val inputData = readStandardizationInputData(schema, cmd, preparationResult.pathCfg.raw.path, preparationResult.dataset)
+    val inputData = readStandardizationInputData(schema, cmd, preparationResult.pathCfg.raw, preparationResult.dataset)
 
     try {
       val result = standardize(inputData, schema, cmd)

diff --git a/...a/za/co/absa/enceladus/standardization_conformance/StandardizationAndConformanceJob.scala b/...a/za/co/absa/enceladus/standardization_conformance/StandardizationAndConformanceJob.scala
@@ -36,8 +36,7 @@ object StandardizationAndConformanceJob extends StandardizationAndConformanceExe
 
     val preparationResult = prepareJob()
     val schema = prepareStandardization(args, menasCredentials, preparationResult)
-    implicit val rawFs = preparationResult.pathCfg.raw.fileSystem
-    val inputData = readStandardizationInputData(schema, cmd, preparationResult.pathCfg.raw.path, preparationResult.dataset)
+    val inputData = readStandardizationInputData(schema, cmd, preparationResult.pathCfg.raw, preparationResult.dataset)
 
     try {
       val standardized = standardize(inputData, schema, cmd)