microdao-daarion/services/parser-service/app/runtime/model_loader.py

"""
Model loader for dots.ocr
Handles lazy loading and GPU/CPU fallback
"""

import logging
from typing import Optional, Literal
from pathlib import Path

from app.core.config import settings

logger = logging.getLogger(__name__)

# Global model instance
_model: Optional[object] = None


def load_model() -> Optional[object]:
    """
    Load dots.ocr model

    Returns:
        Loaded model instance or None if loading fails
    """
    global _model

    if _model is not None:
        return _model

    # Check if dummy mode is enabled
    if settings.USE_DUMMY_PARSER:
        logger.info("Dummy parser mode enabled, skipping model loading")
        return None

    logger.info(f"Loading model: {settings.PARSER_MODEL_NAME}")
    logger.info(f"Device: {settings.PARSER_DEVICE}")

    try:
        # TODO: Implement actual model loading
        # Example for dots.ocr (adjust based on actual model structure):
        # from transformers import AutoModelForVision2Seq, AutoProcessor
        #
        # processor = AutoProcessor.from_pretrained(settings.PARSER_MODEL_NAME)
        # model = AutoModelForVision2Seq.from_pretrained(
        #     settings.PARSER_MODEL_NAME,
        #     device_map=settings.PARSER_DEVICE if settings.PARSER_DEVICE != "cpu" else None,
        #     torch_dtype=torch.float16 if settings.PARSER_DEVICE != "cpu" else torch.float32
        # )
        #
        # if settings.PARSER_DEVICE == "cpu":
        #     model = model.to("cpu")
        #
        # _model = {
        #     "model": model,
        #     "processor": processor,
        #     "device": settings.PARSER_DEVICE
        # }
        #
        # logger.info("Model loaded successfully")

        # For now, return None (will use dummy parser)
        logger.warning("Model loading not yet implemented, will use dummy parser")
        _model = None

    except ImportError as e:
        logger.error(f"Required packages not installed: {e}")
        if not settings.ALLOW_DUMMY_FALLBACK:
            raise
        _model = None
    except Exception as e:
        logger.error(f"Failed to load model: {e}", exc_info=True)
        if not settings.ALLOW_DUMMY_FALLBACK:
            raise
        _model = None

    return _model


def get_model() -> Optional[object]:
    """Get loaded model instance"""
    if _model is None:
        return load_model()
    return _model


def unload_model():
    """Unload model from memory"""
    global _model
    if _model is not None:
        # TODO: Proper cleanup
        _model = None
        logger.info("Model unloaded")