ITMO-NSS-team · staeros · Jan 30, 2023 · Sep 6, 2022 · Sep 9, 2022 · Sep 13, 2022
diff --git a/Dockerfile b/Dockerfile
@@ -1,7 +1,7 @@
 FROM tensorflow/tensorflow:1.15.5
 RUN pip install keras==2.3.1 scikit_learn==0.22.1 dataclasses networkx==2.2 pandas==0.25.3 xgboost==1.0.1 anytree==2.8.0 
 RUN pip install h2o==3.28.1.2 tpot==0.11.1 statsmodels==0.11.1 matplotlib==3.0.3 Pillow==7.0.0 imageio==2.8.0
-RUN apt-get update ##[edited]
+RUN apt-get _update ##[edited]
 RUN apt-get install ffmpeg libsm6 libxext6  -y
 RUN pip install opencv-python
 
diff --git a/Dockerfile_gpu b/Dockerfile_gpu
@@ -5,7 +5,7 @@ COPY ./nas /home/nas
 
 RUN pip install keras==2.3.1 scikit_learn==0.22.1 dataclasses networkx==2.2 pandas==0.25.3 xgboost==1.0.1 anytree==2.8.0 
 RUN pip install h2o==3.28.1.2 tpot==0.11.1 statsmodels==0.11.1 matplotlib Pillow==7.0.0 imageio==2.8.0
-RUN apt-get update ##[edited]
+RUN apt-get _update ##[edited]
 RUN apt-get install ffmpeg libsm6 libxext6  -y
 RUN pip install opencv-python
 
diff --git a/cases/butterfly_classification.py b/cases/butterfly_classification.py
@@ -1,36 +1,47 @@
 import datetime
+import os
 import pathlib
 
+from golem.core.optimisers.genetic.gp_params import GPAlgorithmParameters
+
+import nas.data.nas_data
+
+os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
+
 import tensorflow as tf
-from fedot.core.composer.advisor import DefaultChangeAdvisor
+
+from golem.core.adapter.adapter import DirectAdapter
+from golem.core.optimisers.advisor import DefaultChangeAdvisor
 from fedot.core.composer.composer_builder import ComposerBuilder
-from fedot.core.dag.verification_rules import has_no_cycle, has_no_self_cycled_nodes
+from golem.core.dag.verification_rules import has_no_cycle, has_no_self_cycled_nodes
 from fedot.core.data.data_split import train_test_data_setup
-from fedot.core.optimisers.adapters import DirectAdapter
-from fedot.core.optimisers.gp_comp.gp_optimizer import GPGraphOptimizerParameters, GeneticSchemeTypesEnum
-from fedot.core.optimisers.gp_comp.operators.crossover import CrossoverTypesEnum
-from fedot.core.optimisers.gp_comp.operators.mutation import MutationTypesEnum
-from fedot.core.optimisers.gp_comp.operators.regularization import RegularizationTypesEnum
-from fedot.core.optimisers.optimizer import GraphGenerationParams
+
+from golem.core.optimisers.genetic.operators.crossover import CrossoverTypesEnum
+from golem.core.optimisers.genetic.operators.inheritance import GeneticSchemeTypesEnum
+from golem.core.optimisers.genetic.operators.mutation import MutationTypesEnum
+from golem.core.optimisers.genetic.operators.regularization import RegularizationTypesEnum
+from golem.core.optimisers.optimizer import GraphGenerationParams
 from fedot.core.repository.quality_metrics_repository import ClassificationMetricsEnum, MetricsRepository
 from fedot.core.repository.tasks import TaskTypesEnum, Task
 
 import nas.composer.nn_composer_requirements as nas_requirements
-import nas.data.load_images as loader
-from nas.composer.nn_composer import NNComposer
-from nas.data.data_generator import DataGenerator
-from nas.data.data_generator import Preprocessor
-from nas.data.setup_data import setup_data
-from nas.graph.cnn.cnn_builder import CNNBuilder
-from nas.graph.cnn.cnn_graph import NNGraph, NNNode
-from nas.graph.nn_graph_builder import NNGraphBuilder
-from nas.graph.node_factory import NNNodeFactory
+from nas.composer.nn_composer import NasComposer
+from nas.data import KerasDataset
+from nas.data.dataset.builder import BaseNasDatasetBuilder
+from nas.data.preprocessor import Preprocessor
+from nas.graph.cnn_graph import NasNode
+from nas.graph.graph_builder.resnet_builder import ResNetGenerator
+from nas.graph.graph_builder import NNGraphBuilder
+from nas.graph.node.node_factory import NNNodeFactory
 from nas.operations.evaluation.metrics.metrics import calculate_validation_metric, get_predictions
-from nas.operations.validation_rules.cnn_val_rules import has_no_flatten_skip, flatten_count, \
-    graph_has_several_starts, graph_has_wrong_structure, unique_node_types
+from nas.operations.validation_rules.cnn_val_rules import *
 from nas.optimizer.objective.nas_cnn_optimiser import NNGraphOptimiser
+from nas.repository.layer_types_enum import LayersPoolEnum
 from nas.utils.utils import set_root, project_root
 
+gpus = tf.config.list_physical_devices('GPU')
+print(gpus)
+
 set_root(project_root())
 
 
@@ -39,83 +50,95 @@ def build_butterfly_cls(save_path=None):
     task = Task(TaskTypesEnum.classification)
     objective_function = MetricsRepository().metric_by_id(ClassificationMetricsEnum.logloss)
     dataset_path = pathlib.Path('../datasets/butterfly_cls/train')
-    data = loader.NNData.data_from_folder(dataset_path, task)
+    data = nas.data.nas_data.BaseNasImageData.data_from_folder(dataset_path, task)
 
-    cv_folds = 3
-    image_side_size = 20
-    batch_size = 8
-    epochs = 1
+    cv_folds = None
+    image_side_size = 64
+    batch_size = 64
+    epochs = 2
     optimization_epochs = 1
-
-    train_data, test_data = train_test_data_setup(data, shuffle_flag=True)
-
-    data_requirements = nas_requirements.DataRequirements(split_params={'cv_folds': cv_folds})
-    conv_requirements = nas_requirements.ConvRequirements(input_shape=[image_side_size, image_side_size],
-                                                          color_mode='RGB',
-                                                          min_filters=32, max_filters=128,
-                                                          kernel_size=[3, 3], conv_strides=[1, 1],
-                                                          pool_size=[2, 2], pool_strides=[2, 2],
-                                                          pool_types=['max_pool2d', 'average_pool2d'])
-    fc_requirements = nas_requirements.FullyConnectedRequirements(min_number_of_neurons=32,
-                                                                  max_number_of_neurons=128)
-    nn_requirements = nas_requirements.NNRequirements(conv_requirements=conv_requirements,
-                                                      fc_requirements=fc_requirements,
-                                                      primary=['conv2d'], secondary=['dense'],
-                                                      epochs=epochs, batch_size=batch_size,
-                                                      max_nn_depth=3, max_num_of_conv_layers=10,
-                                                      has_skip_connection=True
-                                                      )
-    optimizer_requirements = nas_requirements.OptimizerRequirements(opt_epochs=optimization_epochs)
-
-    requirements = nas_requirements.NNComposerRequirements(data_requirements=data_requirements,
-                                                           optimizer_requirements=optimizer_requirements,
-                                                           nn_requirements=nn_requirements,
-                                                           timeout=datetime.timedelta(hours=200),
-                                                           pop_size=1,
-                                                           num_of_generations=1)
+    conv_layers_pool = [LayersPoolEnum.conv2d_1x1, LayersPoolEnum.conv2d_3x3, LayersPoolEnum.conv2d_5x5,
+                        LayersPoolEnum.conv2d_7x7]
 
     mutations = [MutationTypesEnum.single_add, MutationTypesEnum.single_drop, MutationTypesEnum.single_edge,
-                 MutationTypesEnum.single_change, MutationTypesEnum.simple]
+                 MutationTypesEnum.single_change]
 
-    validation_rules = [has_no_flatten_skip, flatten_count, graph_has_several_starts, graph_has_wrong_structure,
-                        has_no_cycle, has_no_self_cycled_nodes, unique_node_types]
+    train_data, test_data = train_test_data_setup(data, shuffle_flag=True)
 
-    optimizer_parameters = GPGraphOptimizerParameters(genetic_scheme_type=GeneticSchemeTypesEnum.steady_state,
-                                                      mutation_types=mutations,
-                                                      crossover_types=[CrossoverTypesEnum.subtree],
-                                                      regularization_type=RegularizationTypesEnum.none)
+    fc_requirements = nas_requirements.BaseLayerRequirements(min_number_of_neurons=32,
+                                                             max_number_of_neurons=128)
+    conv_requirements = nas_requirements.ConvRequirements(
+        min_number_of_neurons=32, max_number_of_neurons=256,
+        conv_strides=[[1, 1]],
+        pool_size=[[2, 2]], pool_strides=[[2, 2]])
+    model_requirements = nas_requirements.ModelRequirements(input_data_shape=[image_side_size, image_side_size],
+                                                            color_mode='color',
+                                                            num_of_classes=data.num_classes,
+                                                            conv_requirements=conv_requirements,
+                                                            fc_requirements=fc_requirements,
+                                                            primary=conv_layers_pool,
+                                                            secondary=[LayersPoolEnum.dense],
+                                                            epochs=epochs, batch_size=batch_size,
+                                                            max_nn_depth=1, max_num_of_conv_layers=36)
+
+    requirements = nas_requirements.NNComposerRequirements(opt_epochs=optimization_epochs,
+                                                           model_requirements=model_requirements,
+                                                           timeout=datetime.timedelta(minutes=5),
+                                                           num_of_generations=3,
+                                                           early_stopping_iterations=100,
+                                                           early_stopping_timeout=float(datetime.timedelta(minutes=30).
+                                                                                        total_seconds()),
+                                                           n_jobs=1,
+                                                           cv_folds=cv_folds)
+
+    validation_rules = [ConvNetChecker.check_cnn, has_no_cycle, has_no_self_cycled_nodes, ]
+
+    optimizer_parameters = GPAlgorithmParameters(genetic_scheme_type=GeneticSchemeTypesEnum.steady_state,
+                                                 mutation_types=mutations,
+                                                 crossover_types=[CrossoverTypesEnum.subtree],
+                                                 pop_size=10,
+                                                 regularization_type=RegularizationTypesEnum.none)
 
     graph_generation_parameters = GraphGenerationParams(
-        adapter=DirectAdapter(base_graph_class=NNGraph, base_node_class=NNNode),
-        rules_for_constraint=validation_rules, node_factory=NNNodeFactory(requirements, DefaultChangeAdvisor()))
+        adapter=DirectAdapter(base_graph_class=NasGraph, base_node_class=NasNode),
+        rules_for_constraint=validation_rules, node_factory=NNNodeFactory(requirements.model_requirements,
+                                                                          DefaultChangeAdvisor()))
 
     graph_generation_function = NNGraphBuilder()
-    graph_generation_function.set_builder(CNNBuilder(requirements=requirements))
+    graph_generation_function.set_builder(ResNetGenerator(model_requirements=requirements.model_requirements))
 
-    builder = ComposerBuilder(task).with_composer(NNComposer).with_optimiser(NNGraphOptimiser). \
-        with_requirements(requirements).with_metrics(objective_function).with_optimiser_params(optimizer_parameters). \
-        with_initial_pipelines_generation_function(graph_generation_function.create_nas_graph). \
-        with_graph_generation_param(graph_generation_parameters).with_history('../_results/debug/master')
-    composer = builder.build()
+    builder = ComposerBuilder(task).with_composer(NasComposer).with_optimizer(NNGraphOptimiser). \
+        with_requirements(requirements).with_metrics(objective_function).with_optimizer_params(optimizer_parameters). \
+        with_initial_pipelines(graph_generation_function.build()). \
+        with_graph_generation_param(graph_generation_parameters)
 
-    transformations = [tf.convert_to_tensor]
-    data_preprocessor = Preprocessor()
-    data_preprocessor.set_image_size((image_side_size, image_side_size)).set_features_transformations(transformations)
-    composer.set_preprocessor(data_preprocessor)
+    data_preprocessor = Preprocessor((image_side_size, image_side_size))
+
+    data_transformer = BaseNasDatasetBuilder(dataset_cls=KerasDataset,
+                                             batch_size=requirements.model_requirements.batch_size,
+                                             shuffle=True).set_data_preprocessor(data_preprocessor)
+
+    composer = builder.build()
+    composer.set_data_transformer(data_transformer)
 
     optimized_network = composer.compose_pipeline(train_data)
 
     train_data, val_data = train_test_data_setup(train_data, shuffle_flag=True)
 
-    train_generator = setup_data(train_data, requirements.nn_requirements.batch_size, data_preprocessor, 'train',
-                                 DataGenerator, True)
-    val_generator = setup_data(val_data, requirements.nn_requirements.batch_size, data_preprocessor, 'train',
-                               DataGenerator, True)
+    train_generator = data_transformer.build(train_data, mode='train')
+    val_generator = data_transformer.build(val_data, mode='val')
 
-    optimized_network.fit(train_generator, val_generator, requirements=requirements, num_classes=train_data.num_classes,
-                          verbose=1, optimization=False, shuffle=True)
+    optimized_network.compile_model(model_requirements.input_shape, 'categorical_crossentropy',
+                                    metrics=[tf.metrics.Accuracy()], optimizer=tf.keras.optimizers.Adam,
+                                    n_classes=model_requirements.num_of_classes)
+    optimized_network.fit(train_generator, val_generator, model_requirements.epochs, model_requirements.batch_size,
+                          [tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=3, verbose=1,
+                                                            mode='min'),
+                           tf.keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=.1, patience=3,
+                                                                verbose=1,
+                                                                min_delta=1e-4, mode='min')])
 
-    predicted_labels, predicted_probabilities = get_predictions(optimized_network, test_data, data_preprocessor)
+    predicted_labels, predicted_probabilities = get_predictions(optimized_network, test_data, data_transformer)
     roc_on_valid_evo_composed, log_loss_on_valid_evo_composed, accuracy_score_on_valid_evo_composed = \
         calculate_validation_metric(test_data, predicted_probabilities, predicted_labels)
 
@@ -128,6 +151,5 @@ def build_butterfly_cls(save_path=None):
 
 
 if __name__ == '__main__':
-    path = f'_results/debug/master/{datetime.datetime.now().date()}'
-    print(tf.config.list_physical_devices('GPU'))
+    path = f'_results/debug/master_2/{datetime.datetime.now().date()}'
     build_butterfly_cls(path)
diff --git a/cases/load_from_fitted_case.py b/cases/load_from_fitted_case.py
@@ -0,0 +1,84 @@
+import datetime
+import os
+import pathlib
+
+import tensorflow as tf
+from fedot.core.composer.advisor import DefaultChangeAdvisor
+from golem.core.optimisers.adapters import DirectAdapter
+from golem.core.optimisers.genetic.individual import Individual
+from golem.core.optimisers.genetic.operators.mutation import MutationTypesEnum, Mutation
+from golem.core.optimisers.opt_history import OptHistory
+from golem.core.optimisers.optimizer import GraphGenerationParams
+
+import nas.composer.nn_composer_requirements as nas_requirements
+from nas.graph.cnn_graph import NasGraph
+from nas.graph.node.nas_graph_node import NasNode
+from nas.graph.node.node_factory import NNNodeFactory
+from nas.utils.utils import project_root, set_root
+
+set_root(project_root())
+
+
+def from_fitted():
+    # path_to_model = pathlib.Path('../_results/debug/master/2022-09-05/fitted_model.h5')
+    # # model = tf.keras.models.load_model(path_to_model)
+    # model = tf.keras.applications.resnet.ResNet152()
+    graph_path = os.path.join('/home/staeros/_results/resnet_comp/2/2022-10-04/graph.json')
+    model_path = os.path.join('/home/staeros/_results/resnet_comp/2/2022-10-04/fitted_model.h5')
+    model = tf.keras.models.load_model(model_path)
+    graph = NasGraph.load(str(graph_path))
+    graph.model = model
+    history = OptHistory.load('/home/staeros/_results/resnet_comp/2/2022-10-04/history.json')
+    history.show(per_time=False)
+    # history = OptHistory.load('/home/staeros/_results/debug/master_2/2022-09-07/history.json')
+    # history.show.fitness_line_interactive(per_time=False)
+
+    cv_folds = 3
+    image_side_size = 20
+    batch_size = 8
+    epochs = 1
+    optimization_epochs = 1
+
+    data_requirements = nas_requirements.DataRequirements(split_params={'cv_folds': cv_folds})
+    conv_requirements = nas_requirements.ConvRequirements(input_shape=[image_side_size, image_side_size],
+                                                          color_mode='RGB',
+                                                          min_number_of_neurons=32, max_number_of_neurons=64,
+                                                          conv_strides=[[1, 1]],
+                                                          pool_size=[[2, 2]], pool_strides=[[2, 2]],
+                                                          pool_types=['max_pool2d', 'average_pool2d'])
+    fc_requirements = nas_requirements.BaseLayerRequirements(min_number_of_neurons=32,
+                                                             max_number_of_neurons=64)
+    nn_requirements = nas_requirements.ModelRequirements(conv_requirements=conv_requirements,
+                                                         fc_requirements=fc_requirements,
+                                                         primary=['conv2d'], secondary=['dense'],
+                                                         epochs=epochs, batch_size=batch_size,
+                                                         max_nn_depth=2, max_num_of_conv_layers=5,
+                                                         has_skip_connection=True
+                                                         )
+    optimizer_requirements = nas_requirements.OptimizerRequirements(opt_epochs=optimization_epochs)
+
+    requirements = nas_requirements.NNComposerRequirements(data_requirements=data_requirements,
+                                                           optimizer_requirements=optimizer_requirements,
+                                                           model_requirements=nn_requirements,
+                                                           timeout=datetime.timedelta(hours=200),
+                                                           pop_size=10,
+                                                           num_of_generations=10)
+
+    graph_generation_parameters = GraphGenerationParams(
+        adapter=DirectAdapter(base_graph_class=NasGraph, base_node_class=NasNode),
+        rules_for_constraint=[], node_factory=NNNodeFactory(requirements, DefaultChangeAdvisor()))
+
+    path = pathlib.Path('/home/staeros/_results/broken_mutation/graph.json')
+    graph = Individual(NasGraph.load(path))
+
+    mutation = MutationTypesEnum.simple
+
+    mutator = Mutation([mutation], requirements, graph_generation_parameters)
+
+    mutator(graph)
+
+    print('Done!')
+
+
+if __name__ == '__main__':
+    from_fitted()
diff --git a/nas/__init__.py b/nas/__init__.py
@@ -1,2 +1,3 @@
-from .data import data_generator, load_images
-from .graph import nn_graph_builder, node_factory
+from .data import preprocessor, loader
+from .graph import graph_builder
+from .graph.node import node_factory
diff --git a/nas/graph/cnn/__init__.py → nas/caching/__init__.py b/nas/graph/cnn/__init__.py → nas/caching/__init__.py
diff --git a/nas/caching/graph_cache.py b/nas/caching/graph_cache.py
@@ -0,0 +1,6 @@
+from fedot.core.caching.base_cache import BaseCache
+
+
+class GraphCache(BaseCache):
+    def __init__(self):
+        pass