neuraxle.union¶

Module-level documentation for neuraxle.union. Here is an inheritance diagram, including dependencies to other base modules of Neuraxle:

Union of Features¶

This module contains steps to perform various feature unions and model stacking, using parallelism is possible.

Classes

`AddFeatures`(steps_as_tuple, …)	Parallelize the union of many pipeline steps AND concatenate the new features to the received inputs using Identity.
`FeatureUnion`(steps_as_tuple, …)	Parallelize the union of many pipeline steps.
`ModelStacking`(steps_as_tuple, …)	Performs a `FeatureUnion` of steps, and then send the joined result to the above judge step.
`ZipFeatures`([concatenate_inner_features])	This class receives an iterable of DataContainer and zips their feature together.

Examples using `neuraxle.union.AddFeatures`¶

Examples using `neuraxle.union.FeatureUnion`¶

Examples using `neuraxle.union.ModelStacking`¶

class neuraxle.union.FeatureUnion(steps_as_tuple: List[Union[Tuple[str, BaseTransformerT], BaseTransformerT]], joiner: neuraxle.base.BaseTransformer = None, n_jobs: int = None, backend: str = 'threading', cache_folder_when_no_handle: str = None)[source]¶

Bases: neuraxle.base.ForceHandleOnlyMixin, neuraxle.base.TruncableSteps

Parallelize the union of many pipeline steps.

p = Pipeline([
    FeatureUnion([
        Mean(),
        Std(),
    ], joiner=NumpyConcatenateInnerFeatures())
])

data_inputs = np.random.randint((1, 20))

__init__(steps_as_tuple: List[Union[Tuple[str, BaseTransformerT], BaseTransformerT]], joiner: neuraxle.base.BaseTransformer = None, n_jobs: int = None, backend: str = 'threading', cache_folder_when_no_handle: str = None)[source]¶: Create a feature union. :type cache_folder_when_no_handle: str :type backend: str :type n_jobs: int :type joiner: BaseTransformer :param steps_as_tuple: the NamedStepsList of steps to process in parallel and to join. :param joiner: What will be used to join the features. NumpyConcatenateInnerFeatures() is used by default. :param n_jobs: The number of jobs for the parallelized joblib.Parallel loop in fit and in transform. :param backend: The type of parallelization to do with joblib.Parallel. Possible values: “loky”, “multiprocessing”, “threading”, “dask” if you use dask, and more.

_fit_data_container(data_container, context)[source]¶: Fit the parallel steps on the data. It will make use of some parallel processing. :param data_container: The input data to fit onto :param context: execution context :return: self

_transform_data_container(data_container, context)[source]¶: Transform the data with the unions. It will make use of some parallel processing. :param data_container: data container :param context: execution context :return: the transformed data_inputs.

_did_transform(data_container, context)[source]¶

Apply side effects after transform.

Parameters

data_container – data container
context – execution context

Returns

data container

_fit_transform_data_container(data_container, context)[source]¶: Transform the data with the unions. It will make use of some parallel processing. :param data_container: data container :param context: execution context :return: the transformed data_inputs.

_save_fitted_steps(fitted_steps)[source]¶

_did_fit_transform(data_container, context)[source]¶

Apply side effects after fit transform.

Parameters

data_container – data container
context – execution context

Returns

(fitted self, data container)

_abc_impl = <_abc_data object>¶

class neuraxle.union.ZipFeatures(concatenate_inner_features=False)[source]¶

Bases: neuraxle.base.NonFittableMixin, neuraxle.base.BaseStep

This class receives an iterable of DataContainer and zips their feature together. If concatenate_inner_features is True, then features are concatenated after being zipped.

__init__(concatenate_inner_features=False)[source]¶: Initialize self. See help(type(self)) for accurate signature.

transform(data_inputs)[source]¶

Transform given data inputs.

Parameters: data_inputs – data inputs
Returns: transformed data inputs

_transform_data_container(data_container: neuraxle.data_container.DataContainer, context: neuraxle.base.ExecutionContext) → neuraxle.data_container.DataContainer[source]¶

Transform data container.

Return type

DataContainer

Parameters

data_container (DataContainer) – data container
context (ExecutionContext) – execution context

Returns

data container

_abc_impl = <_abc_data object>¶

class neuraxle.union.AddFeatures(steps_as_tuple: List[Union[Tuple[str, BaseTransformerT], BaseTransformerT]], **kwargs)[source]¶

Bases: neuraxle.union.FeatureUnion

Parallelize the union of many pipeline steps AND concatenate the new features to the received inputs using Identity.

pipeline = Pipeline([
    AddFeatures([
        PCA(n_components=2),
        FastICA(n_components=2),
    ])
])

neuraxle.union¶

Union of Features¶

Examples using neuraxle.union.AddFeatures¶

Examples using neuraxle.union.FeatureUnion¶

Examples using neuraxle.union.ModelStacking¶

Examples using `neuraxle.union.AddFeatures`¶

Examples using `neuraxle.union.FeatureUnion`¶

Examples using `neuraxle.union.ModelStacking`¶