Source code for r2x_reeds.parser

"""
Example usage of ReEDSParser.

The :class:`ReEDSParser` is used to build an infrasys.System from ReEDS model output.
"""

from __future__ import annotations

import calendar
from datetime import datetime, timedelta
from functools import partial
from typing import TYPE_CHECKING, Any

import numpy as np
import polars as pl
from infrasys import Component, SingleTimeSeries
from loguru import logger

from r2x_core import BaseParser, ComponentCreationError, Err, Ok, ParserError, Result, Rule

from .enum_mappings import RESERVE_TYPE_MAP
from .getters import (
    build_generator_name,
    build_load_name,
    build_region_name,
    build_reserve_name,
    build_transmission_interface_name,
    build_transmission_line_name,
    resolve_emission_generator_identifier,
)
from .models.components import (
    ReEDSDemand,
    ReEDSEmission,
    ReEDSGenerator,
    ReEDSInterface,
    ReEDSRegion,
    ReEDSReserve,
    ReEDSReserveRegion,
    ReEDSTransmissionLine,
)
from .models.enums import ReserveType
from .parser_checks import check_dataset_non_empty, check_required_values_in_column
from .parser_utils import (
    _collect_component_kwargs_from_rule,
    _resolve_generator_rule_from_row,
    calculate_reserve_requirement,
    get_generator_class,
    get_rule_for_target,
    get_rules_by_target,
    merge_lazy_frames,
    monthly_to_hourly_polars,
    prepare_generator_inputs,
    tech_matches_category,
)
from .rules_helper import create_parser_context
from .upgrader.helpers import LATEST_COMMIT

if TYPE_CHECKING:
    from r2x_core.store import DataStore

    from .config import ReEDSConfig



[docs]
class ReEDSParser(BaseParser):
    """Parser for ReEDS model data following r2x-core framework patterns.

    This parser builds an :class:`infrasys.System` from ReEDS model output through three main phases:

    1. **Component Building** (:meth:`build_system_components`):
       - Regions from hierarchy data with regional attributes
       - Generators split into renewable (aggregated by tech-region) and non-renewable (with vintage)
       - Transmission interfaces and lines with bi-directional ratings
       - Loads with peak demand by region
       - Reserves by transmission region and type
       - Emissions as supplemental attributes on generators

    2. **Time Series Attachment** (:meth:`build_time_series`):
       - Load profiles filtered by weather year and solve year
       - Renewable capacity factors from CF data
       - Reserve requirements calculated from wind/solar/load contributions

    3. **Post-Processing** (:meth:`postprocess_system`):
       - System metadata and description

    Key Implementation Details
    --------------------------
    - Renewable generators are aggregated by technology and region (no vintage)
    - Non-renewable generators retain vintage information
    - Reserve requirements are calculated dynamically based on wind capacity, solar capacity,
      and load data with configurable percentage contributions
    - Time series data is filtered to match configured weather years and solve years
    - Component caches are used during building for efficient cross-referencing

    Parameters
    ----------
    config : ReEDSConfig
        ReEDS-specific configuration with solve years, weather years, etc.
    data_store : DataStore
        Initialized DataStore with ReEDS file mappings loaded
    auto_add_composed_components : bool, default=True
        Whether to automatically add composed components
    skip_validation : bool, default=False
        Skip Pydantic validation for performance (use with caution)
    **kwargs
        Additional keyword arguments passed to parent :class:`BaseParser`

    Attributes
    ----------
    system : infrasys.System
        The constructed power system model
    config : ReEDSConfig
        The ReEDS configuration instance
    data_store : DataStore
        The DataStore for accessing ReEDS data files

    Methods
    -------
    build_system()
        Build and return the complete infrasys.System
    build_system_components()
        Construct all system components (regions, generators, transmission, loads, reserves)
    build_time_series()
        Attach time series data to components
    postprocess_system()
        Apply post-processing steps to the system

    See Also
    --------
    :class:`BaseParser` : Parent class with core system building logic
    :class:`ReEDSConfig` : Configuration class for ReEDS parser
    :class:`DataStore` : Data storage and access interface

    Examples
    --------
    Build a ReEDS system from test data:

    >>> from pathlib import Path
    >>> from r2x_core.store import DataStore
    >>> from r2x_reeds.config import ReEDSConfig
    >>> from r2x_reeds.parser import ReEDSParser
    >>>
    >>> config = ReEDSConfig(solve_years=2030, weather_years=2012, case_name="High_Renewable")
    >>> mapping_path = ReEDSConfig.get_file_mapping_path()
    >>> data_folder = Path("tests/data/test_Pacific")
    >>> data_store = DataStore.from_json(mapping_path, path=data_folder)
    >>> parser = ReEDSParser(config, store=data_store, name="ReEDS_System")
    >>> system = parser.build_system()

    Notes
    -----
    The parser uses internal caches for regions and generators to optimize cross-referencing
    during component construction. These caches are populated during :meth:`build_system_components`
    and are used for all subsequent operations.
    """

    def __init__(
        self,
        /,
        config: ReEDSConfig,
        *,
        store: DataStore,
        auto_add_composed_components: bool = True,
        skip_validation: bool = False,
        overrides: dict[str, Any] | None = None,
        **kwargs,
    ) -> None:
        """Initialize the ReEDS parser with configuration and data access.

        Parameters
        ----------
        config : ReEDSConfig
            Configuration object specifying solve years, weather years, case name, and scenario
        store : DataStore
            Initialized DataStore with ReEDS file mappings and data access
        auto_add_composed_components : bool, optional
            Whether to automatically add composed components to the system, by default True
        skip_validation : bool, optional
            Skip Pydantic validation for performance (use with caution), by default False
        overrides : dict[str, Any] | None, optional
            Configuration overrides to apply, by default None
        **kwargs
            Additional keyword arguments passed to parent BaseParser class

        Attributes
        ----------
        system : infrasys.System
            The constructed power system model (populated by build_system())
        config : ReEDSConfig
            The ReEDS configuration instance
        data_store : DataStore
            The DataStore for accessing ReEDS data files
        """
        self._config_overrides = overrides
        self._config_assets: dict[str, Any] | None = None
        self._defaults: dict[str, Any] | None = None
        self._parser_rules: list[Rule] | None = None
        self._rules_by_target: dict[str, list[Rule]] = {}

        super().__init__(
            config=config,
            data_store=store,
            auto_add_composed_components=auto_add_composed_components,
            skip_validation=skip_validation,
            **kwargs,
        )


[docs]
    def validate_inputs(self) -> Result[None, ParserError]:
        """Validate input data and configuration before building the system.

        Performs comprehensive validation including:
        - Presence of required datasets
        - Validity of configured solve and weather years
        - Loading and parsing of configuration assets
        - Rule validation from parser configuration

        Returns
        -------
        Result[None, ParserError]
            Ok() if all validation checks pass, Err() with detailed error message otherwise

        Raises
        ------
        ParserError
            If required datasets are missing, configured years don't exist in data,
            or configuration files cannot be loaded
        """
        assert self._store, "REeDS parser requires DataStore object."
        logger.debug("Validating input files")
        logger.trace(
            "Solve year(s): {}, weather year(s): {}, case: {}, scenario: {}",
            self.config.solve_year,
            self.config.weather_year,
            self.config.case_name,
            self.config.scenario,
        )

        res = self._ensure_config_assets()
        if res.is_err():
            return res

        res = self._prepare_rules_by_target()
        if res.is_err():
            return res

        placeholders = self.config.model_dump()
        res = check_required_values_in_column(
            store=self._store,
            dataset="modeled_years",
            required_values=self.config.solve_year,
            what="Solve year(s)",
            placeholders=placeholders,
        )
        if res.is_err():
            return Err(res.err())

        res = check_required_values_in_column(
            store=self._store,
            dataset="hour_map",
            column_name="year",
            required_values=self.config.weather_year,
            what="Weather year(s)",
            placeholders=placeholders,
        )
        if res.is_err():
            return Err(res.err())

        required_inputs = []
        for dataset_name in self._store.list_data():
            data_file = self._store[dataset_name]
            info = data_file.info
            if info and info.is_optional:
                continue
            if info and not info.is_input:
                continue
            required_inputs.append(dataset_name)

        logger.trace("Validating presence of {} required datasets", len(required_inputs))
        for dataset_name in required_inputs:
            presence_result = check_dataset_non_empty(self._store, dataset_name, placeholders=placeholders)
            if presence_result.is_err():
                return Err(ParserError(f"{dataset_name}: {presence_result.err()}"))

        return Ok()



[docs]
    def prepare_data(self) -> Result[None, ParserError]:
        """Prepare and normalize configuration, time arrays, and component datasets.

        Initializes internal caches and datasets required for component building:
        - Parser context with configuration and defaults
        - Time indices and calendar mappings for the weather year
        - Generator datasets separated into variable and non-variable groups
        - Hydro capacity factor data for budget calculations
        - Reserve requirement configuration and costs

        Returns
        -------
        Result[None, ParserError]
            Ok() on successful preparation, Err() with ParserError if any step fails

        Notes
        -----
        This method must be called after validate_inputs() and before build_system_components().
        It populates internal caches used throughout the build process.
        """
        logger.trace("Preparing parser data caches and context")
        self._initialize_caches()
        logger.trace("Parser caches initialized")

        res = self._initialize_parser_globals()
        if res.is_err():
            return res

        res = self._prepare_time_arrays()
        if res.is_err():
            return res

        self._ctx = create_parser_context(self.system, self.config, self._defaults)
        logger.trace("Parser context created")

        generator_data_result = self._prepare_generator_datasets()
        if generator_data_result.is_err():
            return generator_data_result
        logger.trace("Generator datasets prepared")

        hydro_result = self._prepare_hydro_datasets()
        if hydro_result.is_err():
            return hydro_result
        logger.trace("Hydro datasets prepared")

        reserve_data_result = self._prepare_reserve_datasets()
        if reserve_data_result.is_err():
            return reserve_data_result
        logger.trace("Reserve datasets prepared")

        return Ok()



[docs]
    def build_system_components(self) -> Result[None, ParserError]:
        """Create all system components from ReEDS data in dependency order.

        Builds the complete set of power system components by calling builder methods
        in sequence: regions, generators, transmission interfaces/lines, loads,
        reserves, and emissions. Each step validates success before proceeding to
        the next.

        Returns
        -------
        Result[None, ParserError]
            Ok() if all components created successfully, Err() with ParserError
            listing any creation failures

        Notes
        -----
        Components are built in strict dependency order:
        1. Regions (required by all other components)
        2. Generators (requires regions)
        3. Transmission interfaces and lines
        4. Loads (requires regions)
        5. Reserves and reserve regions (requires transmission regions)
        6. Emissions (requires generators)
        """
        logger.info("Building ReEDS system components")
        starting_components = len(list(self.system.get_components(Component)))
        logger.trace("System has {} components before build", starting_components)

        region_result = self._build_regions()
        if region_result.is_err():
            return region_result
        generator_result = self._build_generators()
        if generator_result.is_err():
            return generator_result
        transmission_result = self._build_transmission()
        if transmission_result.is_err():
            return transmission_result
        load_result = self._build_loads()
        if load_result.is_err():
            return load_result
        reserve_result = self._build_reserves()
        if reserve_result.is_err():
            return reserve_result
        emission_result = self._build_emissions()
        if emission_result.is_err():
            return emission_result

        total_components = len(list(self.system.get_components(Component)))
        logger.info(
            "Attached {} total components.",
            total_components,
        )
        return Ok()



[docs]
    def build_time_series(self) -> Result[None, ParserError]:
        """Attach time series data to all system components in a specific sequence.

        Populates time series data for various component types in dependency order:
        1. Reserve membership associations (which reserves apply to which generators)
        2. Load profiles (hourly demand by region)
        3. Renewable capacity factors (hourly availability for wind/solar)
        4. Reserve requirement profiles (dynamic requirements based on load/wind/solar)
        5. Hydro budget constraints (daily energy constraints by month)

        Time series data is filtered to match configured weather and solve years,
        and multiple time series per component are supported for multi-year scenarios.

        Returns
        -------
        Result[None, ParserError]
            Ok() if all time series attached successfully, Err() with ParserError
            if any attachment step fails

        Raises
        ------
        ParserError
            If required time series datasets are empty or mismatched with
            configured years
        """
        logger.info("Building time series data")
        logger.trace(
            "Attaching time series for {} components",
            len(list(self.system.get_components(Component))),
        )
        reserve_membership_result = self._attach_reserve_membership()
        if reserve_membership_result.is_err():
            return reserve_membership_result

        load_result = self._attach_load_profiles()
        if load_result.is_err():
            return load_result

        renewable_result = self._attach_renewable_profiles()
        if renewable_result.is_err():
            return renewable_result

        reserve_result = self._attach_reserve_profiles()
        if reserve_result.is_err():
            return reserve_result

        hydro_result = self._attach_hydro_budgets()
        if hydro_result.is_err():
            return hydro_result

        logger.info("Time series attachment complete")
        return Ok()



[docs]
    def postprocess_system(self) -> Result[None, ParserError]:
        """Perform post-processing and finalization of the constructed system.

        Sets system-level metadata and logs summary statistics:
        - Data format version (from repository commit hash)
        - System description incorporating case name, scenario, solve/weather years
        - Component statistics and system validation information

        This is the final step after components and time series are built,
        ensuring the system is properly documented and ready for export.

        Returns
        -------
        Result[None, ParserError]
            Ok() on successful post-processing, Err() with ParserError if metadata
            application fails

        Notes
        -----
        This method should be called after both build_system_components() and
        build_time_series() have completed successfully.
        """
        logger.info("Post-processing ReEDS system...")
        logger.trace("Setting data format version to {}", LATEST_COMMIT)

        self.system.data_format_version = LATEST_COMMIT
        self.system.description = (
            f"ReEDS model system for case '{self.config.case_name}', "
            f"scenario '{self.config.scenario}', "
            f"solve years: {self.config.solve_year}, "
            f"weather years: {self.config.weather_year}"
        )

        total_components = len(list(self.system.get_components(Component)))
        logger.info("System name: {}", self.system.name)
        logger.info("Total components: {}", total_components)
        logger.info("Post-processing complete")
        return Ok()


    def _build_regions(self) -> Result[None, ParserError]:
        """Build region components from hierarchy data."""
        logger.info("Building regions...")

        hierarchy_data = self.read_data_file("hierarchy").collect()
        logger.trace("Hierarchy dataset rows: {}", hierarchy_data.height)

        region_rule_result = get_rule_for_target(
            self._rules_by_target, name="region", target_type=ReEDSRegion.__name__
        )
        if region_rule_result.is_err():
            return Err(region_rule_result.err())
        region_rules = region_rule_result.ok()

        region_kwargs_result = _collect_component_kwargs_from_rule(
            data=hierarchy_data,
            rule_provider=region_rules,
            parser_context=self._ctx,
            row_identifier_getter=partial(build_region_name, self._ctx),
        )
        if region_kwargs_result.is_err():
            return region_kwargs_result

        creation_errors: list[str] = []
        created = 0
        for identifier, kwargs in region_kwargs_result.ok() or []:
            try:
                region = self.create_component(ReEDSRegion, **kwargs)
            except ComponentCreationError as exc:
                creation_errors.append(f"{identifier}: {exc}")
                logger.error("Failed to create region {}: {}", identifier, exc)
                continue

            self.add_component(region)
            self._region_cache[region.name] = region
            created += 1

        if creation_errors:
            failure_list = "; ".join(creation_errors)
            return Err(ParserError(f"Failed to build the following regions: {failure_list}"))

        logger.info("Attached {} region components", created)
        return Ok()

    def _build_generators(self) -> Result[None, ParserError]:
        """Build generator components from cached datasets."""
        logger.info("Building ReEDS generator components")

        if self._variable_generator_df is None or self._non_variable_generator_df is None:
            return Err(ParserError("Generator datasets were not prepared"))
        logger.trace(
            "Generator dataset sizes - variable: {}, non-variable: {}",
            self._variable_generator_df.height,
            self._non_variable_generator_df.height,
        )

        variable_result = self._build_generator_group(self._variable_generator_df, "variable renewable")
        if variable_result.is_err():
            return variable_result

        non_variable_result = self._build_generator_group(self._non_variable_generator_df, "non-variable")
        if non_variable_result.is_err():
            return non_variable_result

        total_built = (variable_result.ok() or 0) + (non_variable_result.ok() or 0)
        if total_built == 0:
            logger.warning("No generators were created")
            logger.info("Attached 0 generator components")
        else:
            logger.info(
                "Attached {} generator components ({} variable renewables, {} others)",
                total_built,
                variable_result.ok() or 0,
                non_variable_result.ok() or 0,
            )
        return Ok()

    def _build_generator_group(
        self,
        df: pl.DataFrame,
        label: str,
    ) -> Result[int, ParserError]:
        """Build a group of generators (variable renewable or non-variable) from DataFrame."""
        logger.info("Starting {} generator build", label)
        logger.trace("Processing {} {} generator rows", df.height, label)
        if df.is_empty():
            logger.info("No {} generator data found; attached 0 generators", label)
            return Ok(0)

        kwargs_result = _collect_component_kwargs_from_rule(
            data=df,
            rule_provider=lambda row: _resolve_generator_rule_from_row(
                row,
                self._tech_categories or {},
                self._category_to_class_map,
                self._rules_by_target,
            ),
            parser_context=self._ctx,
            row_identifier_getter=partial(build_generator_name, self._ctx),
        )
        if kwargs_result.is_err():
            return kwargs_result

        creation_errors: list[str] = []
        built = 0
        for identifier, component_kwargs in kwargs_result.ok() or []:
            creation_result = self._instantiate_generator(identifier, component_kwargs)
            if creation_result.is_err():
                creation_errors.append(f"{identifier}: {creation_result.err()}")
                continue

            generator = creation_result.ok()
            self.add_component(generator)
            self._generator_cache[generator.name] = generator
            built += 1

        if creation_errors:
            failure_list = "; ".join(creation_errors)
            return Err(ParserError(f"Failed to create the following {label} generators: {failure_list}"))

        logger.info("Attached {} {} generators", built, label)
        return Ok(built)

    def _instantiate_generator(
        self,
        identifier: str,
        kwargs: dict[str, Any],
    ) -> Result[ReEDSGenerator, ParserError]:
        """Instantiate a generator component with technology-specific class resolution."""
        technology = kwargs.get("technology")
        if technology is None:
            return Err(ParserError(f"Generator {identifier} missing technology"))

        class_result = get_generator_class(
            str(technology),
            self._tech_categories or {},
            self._category_to_class_map,
        )
        if class_result.is_err():
            return Err(ParserError(f"Generator {identifier} class lookup failed: {class_result.err()}"))

        generator_class = class_result.ok()

        try:
            generator = self.create_component(generator_class, **kwargs)
        except ComponentCreationError as exc:
            return Err(ParserError(f"Generator {identifier} creation failed: {exc}"))
        return Ok(generator)

    def _build_transmission(self) -> Result[None, ParserError]:
        """Build transmission interface and line components with bi-directional ratings."""
        logger.info("Building transmission interfaces...")

        trancap_data = self.read_data_file("transmission_capacity")
        if trancap_data is None:
            logger.warning("No transmission capacity data found, skipping transmission")
            logger.info("Attached 0 transmission interfaces and 0 lines")
            return Ok(None)

        trancap = trancap_data.collect()
        logger.trace("Transmission capacity rows: {}", trancap.height)

        if trancap.is_empty():
            logger.warning("Transmission capacity data is empty, skipping transmission")
            logger.info("Attached 0 transmission interfaces and 0 lines")
            return Ok(None)

        if self._ctx is None:
            return Err(ParserError("Parser context is missing"))

        interfaces_result = self._build_transmission_interfaces(trancap)
        if interfaces_result.is_err():
            return interfaces_result
        interface_count, creation_errors = interfaces_result.ok()

        line_result = self._build_transmission_lines(trancap)
        if line_result.is_err():
            return line_result
        line_count, line_errors = line_result.ok()
        creation_errors.extend(line_errors)

        logger.info("Attached {} transmission interfaces and {} lines", interface_count, line_count)

        if creation_errors:
            failure_list = "; ".join(creation_errors)
            return Err(ParserError(f"Failed to create transmission components: {failure_list}"))

        return Ok(None)

    def _build_transmission_interfaces(
        self, trancap: pl.DataFrame
    ) -> Result[tuple[int, list[str]], ParserError]:
        """Create interface components from deduplicated transmission rows."""
        if self._ctx is None:
            return Err(ParserError("Parser context is missing"))

        interface_rule_result = get_rule_for_target(
            self._rules_by_target, name="transmission_interface", target_type=ReEDSInterface.__name__
        )
        if interface_rule_result.is_err():
            return interface_rule_result
        interface_rule = interface_rule_result.ok()

        interface_rows = (
            trancap.select(
                pl.col("from_region"),
                pl.col("to_region"),
                pl.col("trtype"),
            )
            .with_columns(
                pl.when(pl.col("from_region") <= pl.col("to_region"))
                .then(pl.col("from_region"))
                .otherwise(pl.col("to_region"))
                .alias("region_a"),
                pl.when(pl.col("from_region") <= pl.col("to_region"))
                .then(pl.col("to_region"))
                .otherwise(pl.col("from_region"))
                .alias("region_b"),
            )
            .select(
                pl.col("region_a"),
                pl.col("region_b"),
                pl.col("trtype"),
            )
            .unique(subset=["region_a", "region_b"])
            .select(
                pl.col("region_a").alias("from_region"),
                pl.col("region_b").alias("to_region"),
                pl.col("trtype"),
            )
        )
        logger.trace("Derived {} unique transmission interface rows", interface_rows.height)

        interface_kwargs_result = _collect_component_kwargs_from_rule(
            data=interface_rows,
            rule_provider=interface_rule,
            parser_context=self._ctx,
            row_identifier_getter=partial(build_transmission_interface_name, self._ctx),
        )
        if interface_kwargs_result.is_err():
            return interface_kwargs_result

        creation_errors: list[str] = []
        interface_count = 0
        for identifier, kwargs in interface_kwargs_result.ok() or []:
            try:
                interface = self.create_component(ReEDSInterface, **kwargs)
            except ComponentCreationError as exc:
                creation_errors.append(f"{identifier}: {exc}")
                logger.error("Failed to create transmission interface {}: {}", identifier, exc)
                continue

            self.add_component(interface)
            self._interface_cache[identifier] = interface
            interface_count += 1

        return Ok((interface_count, creation_errors))

    def _build_transmission_lines(self, trancap: pl.DataFrame) -> Result[tuple[int, list[str]], ParserError]:
        """Instantiate transmission lines using the raw transmission capacity table."""
        if self._ctx is None:
            return Err(ParserError("Parser context is missing"))

        line_rule_result = get_rule_for_target(
            self._rules_by_target, name="transmission_line", target_type=ReEDSTransmissionLine.__name__
        )
        if line_rule_result.is_err():
            return line_rule_result
        line_rule = line_rule_result.ok()

        line_kwargs_result = _collect_component_kwargs_from_rule(
            data=trancap,
            rule_provider=line_rule,
            parser_context=self._ctx,
            row_identifier_getter=partial(build_transmission_line_name, self._ctx),
        )
        if line_kwargs_result.is_err():
            return line_kwargs_result

        creation_errors: list[str] = []
        line_count = 0
        for identifier, kwargs in line_kwargs_result.ok() or []:
            try:
                line = self.create_component(ReEDSTransmissionLine, **kwargs)
            except ComponentCreationError as exc:
                creation_errors.append(f"{identifier}: {exc}")
                logger.error("Failed to create transmission line {}: {}", identifier, exc)
                continue

            self.add_component(line)
            line_count += 1

        return Ok((line_count, creation_errors))

    def _build_loads(self) -> Result[None, ParserError]:
        """Build load components from demand data."""
        logger.info("Building loads...")

        load_profiles = self.read_data_file("load_profiles").collect()
        logger.trace("Load profile columns: {}", load_profiles.columns)

        region_columns = [col for col in load_profiles.columns if col not in {"datetime", "solve_year"}]
        if not region_columns:
            msg = "Load data has no region columns"
            logger.warning(msg)
            return Err(ParserError(msg))
        logger.trace("Found {} load regions", len(region_columns))

        rows = []
        for region in region_columns:
            peak_load = float(load_profiles.select(pl.col(region)).max().item())
            rows.append({"region": region, "max_active_power": peak_load})

        loads_df = pl.DataFrame(rows)
        if self._ctx is None:
            return Err(ParserError("Parser context is missing"))

        load_rule_result = get_rule_for_target(
            self._rules_by_target, name="load", target_type=ReEDSDemand.__name__
        )
        if load_rule_result.is_err():
            return load_rule_result
        load_rule = load_rule_result.ok()

        load_kwargs_result = _collect_component_kwargs_from_rule(
            data=loads_df,
            rule_provider=load_rule,
            parser_context=self._ctx,
            row_identifier_getter=partial(build_load_name, self._ctx),
        )
        if load_kwargs_result.is_err():
            return load_kwargs_result

        creation_errors: list[str] = []
        load_count = 0
        for identifier, kwargs in load_kwargs_result.ok() or []:
            try:
                demand = self.create_component(ReEDSDemand, **kwargs)
            except ComponentCreationError as exc:
                creation_errors.append(f"{identifier}: {exc}")
                logger.error("Failed to create load {}: {}", identifier, exc)
                continue

            self.add_component(demand)
            load_count += 1

        if creation_errors:
            failure_list = "; ".join(creation_errors)
            return Err(ParserError(f"Failed to build the following loads: {failure_list}"))

        logger.info("Attached {} load components", load_count)
        return Ok(None)

    def _build_reserves(self) -> Result[None, ParserError]:
        """Build reserve requirement components for each transmission region and type."""
        logger.info("Building reserves...")
        reserve_region_count = 0
        reserve_count = 0

        hierarchy_data = self.read_data_file("hierarchy")
        if hierarchy_data is None:
            logger.warning("No hierarchy data found, skipping reserves")
            logger.info("Attached 0 reserve regions and 0 reserve components")
            return Ok(None)

        df = hierarchy_data.collect()
        if df.is_empty():
            logger.warning("Hierarchy data is empty, skipping reserves")
            logger.info("Attached 0 reserve regions and 0 reserve components")
            return Ok(None)

        # Load defaults via classmethod to keep PluginConfig as a pure model
        defaults = self._defaults
        reserve_types = defaults.get("default_reserve_types", [])
        reserve_duration = defaults.get("reserve_duration", {})
        reserve_time_frame = defaults.get("reserve_time_frame", {})
        reserve_vors = defaults.get("reserve_vors", {})
        reserve_direction = defaults.get("reserve_direction", {})

        if not reserve_types:
            logger.debug("No reserve types configured, skipping reserves")
            logger.info("Attached 0 reserve regions and 0 reserve components")
            return Ok(None)

        if "transmission_region" in df.columns:
            transmission_regions = df["transmission_region"].unique().to_list()
        else:
            transmission_regions = []
        logger.trace(
            "Preparing reserves for {} transmission regions and {} reserve types",
            len(transmission_regions),
            len(reserve_types),
        )

        reserve_region_errors: list[str] = []
        for region_name in transmission_regions:
            if region_name in self._reserve_region_cache:
                continue
            try:
                reserve_region = self.create_component(ReEDSReserveRegion, name=region_name)
            except ComponentCreationError as exc:
                reserve_region_errors.append(f"{region_name}: {exc}")
                logger.error("Failed to create reserve region {}: {}", region_name, exc)
                continue

            self.add_component(reserve_region)
            self._reserve_region_cache[region_name] = reserve_region
            reserve_region_count += 1

        if reserve_region_errors:
            failure_list = "; ".join(reserve_region_errors)
            return Err(ParserError(f"Failed to create reserve regions: {failure_list}"))

        rows: list[dict[str, Any]] = []
        for region_name in transmission_regions:
            for reserve_type_name in reserve_types:
                if reserve_type_name not in RESERVE_TYPE_MAP:
                    logger.warning("Unknown reserve type: {}", reserve_type_name)
                    continue
                pct_cfg = self._reserve_percentages.get(reserve_type_name.upper(), {})
                cost_cfg = self._reserve_costs.get(reserve_type_name.upper(), {})
                rows.append(
                    {
                        "region": region_name,
                        "reserve_type": reserve_type_name,
                        "duration": reserve_duration.get(reserve_type_name),
                        "time_frame": reserve_time_frame.get(reserve_type_name),
                        "vors": reserve_vors.get(reserve_type_name),
                        "direction": reserve_direction.get(reserve_type_name, "Up"),
                        "or_load_percentage": pct_cfg.get("or_load_percentage"),
                        "or_wind_percentage": pct_cfg.get("or_wind_percentage"),
                        "or_pv_percentage": pct_cfg.get("or_pv_percentage"),
                        "spin_cost": cost_cfg.get("spin_cost"),
                        "reg_cost": cost_cfg.get("reg_cost"),
                        "flex_cost": cost_cfg.get("flex_cost"),
                    }
                )

        if not rows:
            logger.debug("No reserve rows generated, skipping reserves")
            logger.info("Attached {} reserve regions and 0 reserve components", reserve_region_count)
            return Ok(None)
        logger.trace("Generated {} reserve component rows", len(rows))

        rows_df = pl.DataFrame(rows)
        if self._ctx is None:
            return Err(ParserError("Parser context is missing"))

        reserve_rule_result = get_rule_for_target(
            self._rules_by_target, name="reserve", target_type=ReEDSReserve.__name__
        )
        if reserve_rule_result.is_err():
            return reserve_rule_result
        reserve_rule = reserve_rule_result.ok()

        reserve_kwargs_result = _collect_component_kwargs_from_rule(
            data=rows_df,
            rule_provider=reserve_rule,
            parser_context=self._ctx,
            row_identifier_getter=partial(build_reserve_name, self._ctx),
        )
        if reserve_kwargs_result.is_err():
            return reserve_kwargs_result

        creation_errors: list[str] = []
        for identifier, kwargs in reserve_kwargs_result.ok() or []:
            try:
                reserve = self.create_component(ReEDSReserve, **kwargs)
            except ComponentCreationError as exc:
                creation_errors.append(f"{identifier}: {exc}")
                logger.error("Failed to create reserve {}: {}", identifier, exc)
                continue

            self.add_component(reserve)
            reserve_count += 1

        if creation_errors:
            failure_list = "; ".join(creation_errors)
            return Err(ParserError(f"Failed to build the following reserves: {failure_list}"))

        logger.info(
            "Attached {} reserve regions and {} reserve components",
            reserve_region_count,
            reserve_count,
        )
        return Ok(None)

    def _build_emissions(self) -> Result[None, ParserError]:
        """Attach emission supplemental attributes to generators."""
        logger.info("Building emission components")

        emit_data = self.read_data_file("emission_rates")
        if emit_data is None:
            logger.warning("No emission rates data found, skipping emissions")
            logger.info("Attached 0 emission components")
            return Ok(None)

        df = emit_data.collect()
        logger.trace("Emission dataset rows: {}", df.height)
        if df.is_empty():
            logger.warning("Emission rates data is empty, skipping emissions")
            logger.info("Attached 0 emission components")
            return Ok(None)

        if self._ctx is None:
            return Err(ParserError("Parser context is missing"))

        emission_rule_result = get_rule_for_target(
            self._rules_by_target, name="emission", target_type=ReEDSEmission.__name__
        )
        if emission_rule_result.is_err():
            return emission_rule_result
        emission_rule = emission_rule_result.ok()

        generated = list(self._generator_cache.values())
        if not generated:
            logger.warning("No generators available for emission matching")
            logger.info("Attached 0 emission components")
            return Ok(None)

        rename_map = {
            "i": "technology",
            "v": "vintage",
            "r": "region",
        }
        emit_df = df.rename({k: v for k, v in rename_map.items() if k in df.columns}).with_columns(
            pl.col("vintage").fill_null("__missing_vintage__").alias("vintage_key")
        )

        generator_lookup: dict[tuple[str | None, str | None, str], list[str]] = {}
        for generated_name in generated:
            vintage_key = generated_name.vintage or "__missing_vintage__"
            key = (generated_name.technology, generated_name.region.name, vintage_key)
            generator_lookup.setdefault(key, []).append(generated_name.name)

        matched_rows: list[dict[str, Any]] = []
        for row in emit_df.iter_rows(named=True):
            key = (row.get("technology"), row.get("region"), row.get("vintage_key"))
            generator_names = generator_lookup.get(key)
            if not generator_names:
                continue
            row_data = dict(row)
            row_data["name"] = generator_names[0]
            matched_rows.append(row_data)

        if not matched_rows:
            logger.warning("No emission rows matched existing generators, skipping emissions")
            logger.info("Attached 0 emission components")
            return Ok(None)

        emission_matches = pl.DataFrame(matched_rows).drop("vintage_key")

        if emission_matches.is_empty():
            logger.warning("No emission rows matched existing generators, skipping emissions")
            logger.info("Attached 0 emission components")
            return Ok(None)

        emission_kwargs_result = _collect_component_kwargs_from_rule(
            data=emission_matches,
            rule_provider=emission_rule,
            parser_context=self._ctx,
            row_identifier_getter=lambda row: resolve_emission_generator_identifier(self._ctx, row),
        )
        if emission_kwargs_result.is_err():
            return emission_kwargs_result

        creation_errors: list[str] = []
        attached = 0
        for identifier, kwargs in emission_kwargs_result.ok() or []:
            generator = self._generator_cache.get(identifier)
            if generator is None:
                logger.debug("Generator %s not found for emission, skipping", identifier)
                continue

            try:
                emission = self.create_component(ReEDSEmission, **kwargs)
            except ComponentCreationError as exc:
                creation_errors.append(f"{identifier}: {exc}")
                logger.error("Failed to create emission {}: {}", identifier, exc)
                continue

            self.system.add_supplemental_attribute(generator, emission)
            attached += 1

        if creation_errors:
            failure_list = "; ".join(creation_errors)
            return Err(ParserError(f"Failed to attach the following emissions: {failure_list}"))

        logger.info("Attached {} emission components to generators", attached)
        return Ok(None)

    def _attach_load_profiles(self) -> Result[None, ParserError]:
        """Attach load time series to demand components."""
        logger.info("Starting load profile attachment")

        load_profiles = self.read_data_file("load_profiles").collect()
        logger.trace(
            "Load profile dataset size: {} rows, {} columns",
            load_profiles.height,
            load_profiles.width,
        )
        attached_count = 0
        for demand in self.system.get_components(ReEDSDemand):
            region_name = demand.name.replace("_load", "")
            if region_name in load_profiles.columns:
                ts = SingleTimeSeries.from_array(
                    data=load_profiles[region_name].to_numpy(),
                    name="max_active_power",
                    initial_timestamp=self.initial_timestamp,
                    resolution=timedelta(hours=1),
                )
                self.system.add_time_series(ts, demand)
                attached_count += 1

        logger.info("Attached load profiles to {} demand components", attached_count)
        return Ok()

    def _attach_renewable_profiles(self) -> Result[None, ParserError]:
        """Attach renewable capacity factor profiles to generator components.

        Matches renewable profile columns (format: technology|region) to generators.
        Validates that weather years in profiles match configured weather years.

        Returns
        -------
        Result[None, ParserError]
            Ok() on success, Err() with ParserError if data is empty or years mismatch

        Raises
        ------
        ParserError
            If renewable profiles are empty or contain unexpected weather years
        """
        logger.info("Starting renewable profile attachment")

        renewable_profiles = self.read_data_file("renewable_profiles").collect()
        logger.trace(
            "Renewable profiles dataset size: {} rows, {} columns",
            renewable_profiles.height,
            renewable_profiles.width,
        )

        profile_count = 0
        tech_regions = (
            pl.DataFrame({"col": renewable_profiles.columns})
            .filter(pl.col("col") != "datetime")
            .with_columns(
                [
                    pl.col("col").str.split("|").alias("parts"),
                    pl.col("col").str.split("|").list.len().alias("len"),
                ]
            )
            .filter(pl.col("len") == 2)
            .with_columns(
                [
                    pl.col("parts").list.get(0).alias("tech"),
                    pl.col("parts").list.get(1).alias("region"),
                ]
            )
            .select("col", "tech", "region")
        )
        logger.trace("Parsed {} tech-region renewable profile columns", tech_regions.height)

        for row in tech_regions.iter_rows(named=True):
            tech = row["tech"]
            region_name = row["region"]
            col_name = row["col"]

            matching_generators = [
                gen
                for gen in self._generator_cache.values()
                if gen.technology == tech and gen.region.name == region_name
            ]

            if not matching_generators:
                continue

            data = renewable_profiles[col_name].to_numpy()
            ts = SingleTimeSeries.from_array(
                data=data,
                name="max_active_power",
                initial_timestamp=self.initial_timestamp,
                resolution=timedelta(hours=1),
            )

            for generator in matching_generators:
                self.system.add_time_series(ts, generator)
                profile_count += 1

        logger.info("Attached renewable profiles to {} generator components", profile_count)
        return Ok()

    def _attach_reserve_profiles(self) -> Result[None, ParserError]:
        """Attach reserve requirement time series to reserve components.

        Calculates dynamic reserve requirements from wind, solar, and load contributions
        using configurable percentages from defaults. Applies requirements to reserve
        components by transmission region.

        Returns
        -------
        Result[None, ParserError]

        See Also
        --------
        :meth:`_calculate_reserve_requirement` : Computes individual reserve requirements
        """
        logger.info("Starting reserve requirement attachment")
        attached_count = 0
        reserves = list(self.system.get_components(ReEDSReserve))
        logger.trace("Attaching reserve requirements for {} reserve components", len(reserves))
        for reserve in reserves:
            logger.trace("Calculating reserve requirement for {}", reserve.name)
            reserve_type_name = reserve.reserve_type.value.upper()
            if reserve_type_name in ("FLEXIBILITY_UP", "FLEXIBILITY_DOWN"):
                reserve_type_name = "FLEXIBILITY"

            region_name = reserve.name.rsplit("_", 1)[0]

            wind_pct = self._defaults.get("wind_reserves", {}).get(reserve_type_name, 0.0)
            solar_pct = self._defaults.get("solar_reserves", {}).get(reserve_type_name, 0.0)
            load_pct = self._defaults.get("load_reserves", {}).get(reserve_type_name, 0.0)

            wind_generators = [
                {
                    "capacity": gen.capacity,
                    "time_series": self.system.get_time_series(gen).data
                    if self.system.has_time_series(gen)
                    else None,
                }
                for gen in self.system.get_components(ReEDSGenerator)
                if gen.region
                and gen.region.transmission_region == region_name
                and tech_matches_category(gen.technology, "wind", self._tech_categories)
            ]

            solar_generators = [
                {
                    "capacity": gen.capacity,
                    "time_series": self.system.get_time_series(gen).data
                    if self.system.has_time_series(gen)
                    else None,
                }
                for gen in self.system.get_components(ReEDSGenerator)
                if gen.region
                and gen.region.transmission_region == region_name
                and tech_matches_category(gen.technology, "solar", self._tech_categories)
            ]

            loads = [
                {
                    "time_series": self.system.get_time_series(load).data
                    if self.system.has_time_series(load)
                    else None,
                }
                for load in self.system.get_components(ReEDSDemand)
                if load.region and load.region.transmission_region == region_name
            ]
            logger.trace(
                "Reserve {} inputs - wind: {}, solar: {}, loads: {}",
                reserve.name,
                len(wind_generators),
                len(solar_generators),
                len(loads),
            )

            calc_result = calculate_reserve_requirement(
                wind_generators=wind_generators,
                solar_generators=solar_generators,
                loads=loads,
                hourly_time_index=self.hourly_time_index,
                wind_pct=wind_pct,
                solar_pct=solar_pct,
                load_pct=load_pct,
            )
            if calc_result.is_err():
                return calc_result

            requirement_profile = calc_result.ok()
            if requirement_profile is None or len(requirement_profile) == 0:
                logger.warning("No reserve requirement calculated for {}, skipping", reserve.name)
                continue

            ts = SingleTimeSeries.from_array(
                data=requirement_profile,
                name="requirement",
                initial_timestamp=self.initial_timestamp,
                resolution=timedelta(hours=1),
            )
            self.system.add_time_series(ts, reserve)
            attached_count += 1

        logger.info("Attached reserve requirements to {} reserve components", attached_count)
        return Ok()

    def _attach_reserve_membership(self) -> Result[None, ParserError]:
        """Attach reserves to generators in the same transmission region, excluding configured techs."""
        excluded_map = self._defaults.get("excluded_from_reserves", {})
        logger.info("Starting reserve membership attachment")
        attached_memberships = 0
        if not excluded_map:
            logger.info("Attached 0 reserve membership links")
            return Ok()

        reserves = list(self.system.get_components(ReEDSReserve))
        generators = list(self.system.get_components(ReEDSGenerator))
        logger.trace(
            "Evaluating reserve membership for {} reserves across {} generators",
            len(reserves),
            len(generators),
        )

        for reserve in reserves:
            reserve_type_name = reserve.reserve_type.value.upper()
            if reserve_type_name in ("FLEXIBILITY_UP", "FLEXIBILITY_DOWN"):
                reserve_type_name = "FLEXIBILITY"

            excluded_categories = excluded_map.get(reserve_type_name, [])
            region_name = reserve.name.rsplit("_", 1)[0]

            for gen in generators:
                if not gen.region or gen.region.transmission_region != region_name:
                    continue

                if any(
                    tech_matches_category(gen.technology, cat, self._tech_categories)
                    for cat in excluded_categories
                ):
                    continue

                reserve_list = gen.ext.get("reserves", [])
                if reserve.name not in reserve_list:
                    reserve_list.append(reserve.name)
                    gen.ext["reserves"] = reserve_list
                    attached_memberships += 1

        logger.info("Attached {} reserve membership links", attached_memberships)
        return Ok()

    def _attach_hydro_budgets(self) -> Result[None, ParserError]:
        """Attach daily energy budgets to hydro dispatch generators.

        Creates daily energy constraints based on monthly capacity factors.
        Budget = capacity * monthly_cf * hours_in_month
        """
        logger.info("Starting hydro budget attachment")
        attached_budgets = 0

        hydro_generators = [
            gen
            for gen_name, gen in self._generator_cache.items()
            if tech_matches_category(gen.technology, "hydro", self._tech_categories)
        ]
        logger.trace("Hydro generators detected: {}", len(hydro_generators))

        if not hydro_generators:
            logger.warning("No hydro generators found, skipping hydro budgets")
            logger.info("Attached 0 hydro budget profiles")
            return Ok()

        if self._hydro_cf_prepared is None:
            logger.warning("Hydro CF data not prepared, skipping hydro budgets")
            logger.info("Attached 0 hydro budget profiles")
            return Ok()
        logger.trace("Hydro CF prepared rows: {}", self._hydro_cf_prepared.height)

        hydro_capacity = pl.DataFrame(
            [
                (gen.name, gen.technology, gen.region.name, gen.capacity, gen.vintage)
                for gen in hydro_generators
            ],
            schema=["name", "technology", "region", "capacity", "vintage"],
            orient="row",
        )

        hydro_data = hydro_capacity.join(self._hydro_cf_prepared, on=["technology", "region"], how="left")

        hydro_data = hydro_data.with_columns(
            (
                pl.col("hydro_cf") * pl.col("hours_in_month") * pl.col("capacity") / pl.col("days_in_month")
            ).alias("daily_energy_budget")
        )

        for generator in hydro_generators:
            tech_region_filter = (
                (pl.col("technology") == generator.technology)
                & (pl.col("region") == generator.region.name)
                & (pl.col("vintage") == generator.vintage)
            )
            for row, month_budget_by_vintage in hydro_data.filter(tech_region_filter).group_by(
                ["year", "vintage"]
            ):
                year = row[0]
                monthly_profile = month_budget_by_vintage["daily_energy_budget"].to_list()
                if len(monthly_profile) != 12 or any(value is None for value in monthly_profile):
                    logger.warning(
                        "Skipping hydro budget for {} in {} because monthly profile length {}",
                        generator.name,
                        year,
                        len(monthly_profile),
                    )
                    continue
                hourly_budget_result = monthly_to_hourly_polars(year, monthly_profile)
                if hourly_budget_result.is_err():
                    logger.warning(
                        "Skipping hydro budget for {} in {}: {}",
                        generator.name,
                        year,
                        hourly_budget_result.err(),
                    )
                    continue
                ts = SingleTimeSeries.from_array(
                    data=hourly_budget_result.ok(),
                    name="hydro_budget",
                    initial_timestamp=self.initial_timestamp,
                    resolution=timedelta(hours=1),
                )

                self.system.add_time_series(ts, generator, solve_year=year)
                logger.debug("Adding hydro budget to {}", generator.label)
                attached_budgets += 1
        logger.info("Attached {} hydro budget profiles", attached_budgets)
        return Ok()

    def _ensure_config_assets(self) -> Result[None, ParserError]:
        """Load and cache plugin config assets."""
        if self._config_assets is not None:
            logger.debug("Config assets already loaded.")
            return Ok()

        try:
            assets = self.config.load_config(overrides=self._config_overrides)
        except FileNotFoundError as exc:
            return Err(ParserError(f"Plugin config files missing: {exc}"))

        self._config_assets = assets
        self._defaults = assets.get("defaults", {})
        logger.trace("Config assets loading successful")
        return Ok()

    def _initialize_caches(self) -> None:
        """Reset parser caches for a fresh build."""
        self._variable_generator_df = None
        self._non_variable_generator_df = None
        self._region_cache = {}
        self._generator_cache = {}
        self._interface_cache = {}
        self._reserve_region_cache = {}
        self._hydro_cf_prepared = None
        self._reserve_percentages: dict[str, dict[str, float]] = {}
        self._reserve_costs: dict[str, dict[str, float]] = {}

    def _initialize_parser_globals(self) -> Result[None, ParserError]:
        """Initialize parser configuration, rules, and metadata from loaded assets."""
        res = self._ensure_config_assets()
        if res.is_err():
            return res

        self.solve_years = (
            [self.config.solve_year]
            if isinstance(self.config.solve_year, int)
            else list(self.config.solve_year)
        )

        self.weather_years = (
            [self.config.weather_year]
            if isinstance(self.config.weather_year, int)
            else list(self.config.weather_year)
        )
        res = self._prepare_rules_by_target()
        if res.is_err():
            return res

        res = self._prepare_default_metadata()
        if res.is_err():
            return res
        logger.trace("Parser global variables set")
        return Ok()

    def _prepare_default_metadata(self) -> Result[None, ParserError]:
        """Initialize important configuration from the parser."""
        assert self._defaults
        self._tech_categories = self._defaults.get("tech_categories", {})
        self._excluded_techs = self._defaults.get("excluded_techs", [])
        self._category_to_class_map = self._defaults.get("category_class_mapping", {})
        return Ok()

    def _prepare_generator_datasets(self) -> Result[None, ParserError]:
        """Load and preprocess generator-related datasets."""
        logger.trace("Preparing generator datasets with excluded techs: {}", self._excluded_techs)
        capacity_data = self.read_data_file("online_capacity")
        fuel_price = self.read_data_file("fuel_price")
        biofuel = self.read_data_file("biofuel_price")
        fuel_map = self.read_data_file("fuel_tech_map")

        biofuel_prepped = biofuel.with_columns(pl.lit("biomass").alias("fuel_type"))
        merge_result = merge_lazy_frames(biofuel_prepped, fuel_map, on=["fuel_type"], how="inner")
        if merge_result.is_err():
            return merge_result
        biofuel_mapped = merge_result.ok().select(pl.exclude("fuel_type"))
        if not biofuel_mapped.collect().is_empty():
            fuel_price = pl.concat([fuel_price, biofuel_mapped], how="diagonal")

        generator_data_result = prepare_generator_inputs(
            capacity_data=capacity_data,
            optional_data={
                "fuel_price": fuel_price,
                "fuel_tech_map": fuel_map,
                "heat_rate": self.read_data_file("heat_rate"),
                "cost_vom": self.read_data_file("cost_vom"),
                "forced_outages": self.read_data_file("forced_outages"),
                "planned_outages": self.read_data_file("planned_outages"),
                "maxage": self.read_data_file("maxage"),
                "storage_duration": self.read_data_file("storage_duration"),
                "storage_efficiency": self.read_data_file("storage_efficiency"),
                "storage_duration_out": self.read_data_file("storage_duration_out"),
                "consume_characteristics": self.read_data_file("consume_characteristics"),
            },
            excluded_technologies=self._excluded_techs,
            technology_categories=self._tech_categories,
        )
        if generator_data_result.is_err():
            return Err(generator_data_result.err())
        self._variable_generator_df, self._non_variable_generator_df = generator_data_result.ok()
        logger.trace(
            "Prepared generator datasets - variable rows: {}, non-variable rows: {}",
            self._variable_generator_df.height,
            self._non_variable_generator_df.height,
        )
        return Ok()

    def _prepare_hydro_datasets(self) -> Result[None, ParserError]:
        """Prepare hydro capacity factor data for later budget attachment."""
        hydro_cf = self.read_data_file("hydro_cf")
        if hydro_cf is None:
            self._hydro_cf_prepared = None
            logger.trace("No hydro CF dataset available")
            return Ok()

        hydro_cf = (
            hydro_cf.with_columns(
                pl.col("month")
                .map_elements(lambda x: self.month_map.get(x, x), return_dtype=pl.Int16)
                .alias("month_num"),
            )
            .sort(["year", "technology", "region", "month_num"])
            .collect()
        )
        self._hydro_cf_prepared = hydro_cf.join(
            self.year_month_day_hours, on=["year", "month_num"], how="left"
        )
        logger.trace("Hydro CF prepared rows: {}", self._hydro_cf_prepared.height)
        return Ok()

    def _prepare_reserve_datasets(self) -> Result[None, ParserError]:
        """Prepare reserve-related inputs (percentages, costs)."""
        logger.trace("Preparing reserve dataset defaults")
        pct_map: dict[str, dict[str, float]] = {}
        reserve_pct_df = self.read_data_file("reserve_percentages")
        if reserve_pct_df is not None:
            df = reserve_pct_df.collect()
            for row in df.iter_rows(named=True):
                rtype = str(row.get("reserve_type") or "").upper()
                if not rtype:
                    continue
                pct_map[rtype] = {
                    "or_load_percentage": row.get("or_load_percentage"),
                    "or_wind_percentage": row.get("or_wind_percentage"),
                    "or_pv_percentage": row.get("or_pv_percentage"),
                }
        else:
            load_res = self._defaults.get("load_reserves", {})
            wind_res = self._defaults.get("wind_reserves", {})
            solar_res = self._defaults.get("solar_reserves", {})
            for rtype in set(load_res) | set(wind_res) | set(solar_res):
                key = str(rtype).upper()
                pct_map[key] = {
                    "or_load_percentage": load_res.get(rtype),
                    "or_wind_percentage": wind_res.get(rtype),
                    "or_pv_percentage": solar_res.get(rtype),
                }
        self._reserve_percentages = pct_map
        logger.trace("Prepared reserve percentage map entries: {}", len(self._reserve_percentages))

        cost_map: dict[str, dict[str, float]] = {}
        cost_df = self.read_data_file("reserve_costs_default")
        if cost_df is None:
            cost_df = self.read_data_file("reserve_costs_market")
        if cost_df is not None:
            df = cost_df.collect()
            for col, rtype in (
                ("spin_cost", ReserveType.SPINNING.value),
                ("reg_cost", ReserveType.REGULATION.value),
                ("flex_cost", ReserveType.FLEXIBILITY.value),
            ):
                if col in df.columns:
                    val = df[col].mean()
                    if val is not None:
                        cost_map[rtype] = {col: float(val)}
        self._reserve_costs = cost_map
        logger.trace("Prepared reserve cost map entries: {}", len(self._reserve_costs))
        return Ok()

    def _prepare_rules_by_target(self) -> Result[list[Rule], ParserError]:
        """Load config assets and parse rules once."""

        parser_rules_raw = self._config_assets.get("parser_rules")
        if parser_rules_raw is None:
            return Err(ParserError("Parser rules are missing from plugin config"))

        try:
            rules = Rule.from_records(parser_rules_raw)
            self._parser_rules = rules
        except Exception as exc:
            return Err(ParserError(f"Failed to parse parser rules: {exc}"))

        rules_result = get_rules_by_target(rules)
        if rules_result.is_err():
            return rules_result

        self._rules_by_target = rules_result.ok()
        logger.trace("Rule(s) by target type set.")
        return Ok()

    def _prepare_time_arrays(self) -> Result[None, ParserError]:
        """Set up solve/weather year lists and derived time indices."""

        self.hourly_time_index = np.arange(
            f"{self.config.primary_weather_year}",
            f"{self.config.primary_weather_year + 1}",
            dtype="datetime64[h]",
        )
        self.daily_time_index = np.arange(
            f"{self.config.primary_weather_year}",
            f"{self.config.primary_weather_year + 1}",
            dtype="datetime64[D]",
        )
        self.initial_timestamp = self.hourly_time_index[0].astype("datetime64[s]").astype(datetime)
        self.month_map = {calendar.month_abbr[i].lower(): i for i in range(1, 13)}
        self.year_month_day_hours = pl.DataFrame(
            {
                "year": [y for y in self.solve_years for _ in range(1, 13)],
                "month_num": [m for _ in self.solve_years for m in range(1, 13)],
                "days_in_month": [
                    calendar.monthrange(y, m)[1] for y in self.solve_years for m in range(1, 13)
                ],
                "hours_in_month": [
                    calendar.monthrange(y, m)[1] * 24 for y in self.solve_years for m in range(1, 13)
                ],
            }
        )
        logger.debug(
            "Created time indixes for weather year {}: {} hours, {} days starting at {}",
            self.config.primary_weather_year,
            len(self.hourly_time_index),
            len(self.daily_time_index),
            self.initial_timestamp,
        )
        return Ok()