g4lwebsockets.py

import gevent.monkey
gevent.monkey.patch_all()

from flask import Flask, jsonify, request, copy_current_request_context
from flask_socketio import SocketIO, emit, join_room, leave_room
from socketio import Client  # Add this import at the top with other imports
import gevent
from pymongo import MongoClient
from gridfs import GridFS
import base64
import redis
from g4laudio import process_audio, continue_music, generate_session_id
from bson.objectid import ObjectId
from pydantic import BaseModel, ValidationError
import torch
from flask_cors import CORS  # Import CORS
import json

from typing import Optional
from datetime import datetime, timezone, timedelta
import requests
# MongoDB setup
# THIS IS THE LOCAL VERSION
# client = MongoClient('mongodb://localhost:27017/')
client = MongoClient('mongodb://mongo:27017/')
db = client['audio_generation_db']
sessions = db.sessions
fs = GridFS(db)

# Redis setup

# THIS IS THE LOCAL VERSION
redis_client = redis.StrictRedis(host='redis', port=6379, db=0)
# redis_client = redis.StrictRedis(host='redis', port=6379, db=0)

app = Flask(__name__)
CORS(app)  # Enable CORS for all routes
# THIS IS THE LOCAL VERSION
socketio = SocketIO(
    app,
    message_queue='redis://redis:6379',
    async_mode='gevent',
    cors_allowed_origins="*",
    logger=True,
    engineio_logger=True,
    ping_timeout=240,  # Use snake_case
    ping_interval=120,  # Use snake_case
    max_http_buffer_size=64*1024*1024
)

@app.route('/')
def index():
    return "The WebSocket server is running."

# Pydantic models for validation
class AudioRequest(BaseModel):
    audio_data: str
    model_name: str
    prompt_duration: int
    top_k: Optional[int] = None
    temperature: Optional[float] = None
    cfg_coef: Optional[float] = None
    description: Optional[str] = None  # New optional field

class SessionRequest(BaseModel):
    session_id: str
    model_name: Optional[str] = None
    prompt_duration: Optional[int] = None
    top_k: Optional[int] = None
    temperature: Optional[float] = None
    cfg_coef: Optional[float] = None
    description: Optional[str] = None  # New optional field

class ContinueMusicRequest(BaseModel):
    session_id: str
    model_name: Optional[str] = None
    prompt_duration: Optional[int] = None
    audio_data: Optional[str] = None
    top_k: Optional[int] = None
    temperature: Optional[float] = None
    cfg_coef: Optional[float] = None
    description: Optional[str] = None  # New optional field

class TransformRequest(BaseModel):
    """Pydantic model for transform requests."""
    audio_data: Optional[str] = None  # Optional because we might get it from session
    variation: str
    session_id: Optional[str] = None


def store_audio_in_gridfs(data, filename):
    """Store audio data in GridFS."""
    audio_data = base64.b64decode(data)
    file_id = fs.put(audio_data, filename=filename)
    return str(file_id)

def retrieve_audio_from_gridfs(file_id):
    """Retrieve audio data from GridFS."""
    try:
        file = fs.get(ObjectId(file_id))
        return base64.b64encode(file.read()).decode('utf-8')
    except Exception as e:
        print(f"Error retrieving audio from GridFS: {e}")
        return None

def store_audio_data(session_id, audio_data, key):
    """Store session data in MongoDB with GridFS."""
    file_id = store_audio_in_gridfs(audio_data, f"{session_id}_{key}.wav")
    current_time = datetime.now(timezone.utc)
    sessions.update_one(
        {'_id': session_id},
        {
            '$set': {
                key: file_id,
                'updated_at': current_time
            },
            '$setOnInsert': {
                'created_at': current_time
            }
        },
        upsert=True
    )

def retrieve_audio_data(session_id, key):
    """Retrieve specific audio data from MongoDB."""
    session_data = sessions.find_one({'_id': session_id})
    file_id = session_data.get(key) if session_data else None
    return retrieve_audio_from_gridfs(file_id) if file_id else None

def set_generation_in_progress(session_id, in_progress):
    """Set or unset the generation_in_progress flag in Redis."""
    redis_client.set(f"{session_id}_generation_in_progress", str(in_progress))

def is_generation_in_progress(session_id):
    """Check if generation is in progress using Redis."""
    return redis_client.get(f"{session_id}_generation_in_progress") == b'True'

@socketio.on('cleanup_session_request')
def handle_cleanup_request(data):
    try:
        request_data = SessionRequest(**data)
        session_id = request_data.session_id
        if session_id:
            sessions.delete_one({'_id': session_id})
            leave_room(session_id)
            redis_client.delete(f"{session_id}_generation_in_progress")
            emit('cleanup_complete', {'message': 'Session cleaned up', 'session_id': session_id}, room=session_id)
    except ValidationError as e:
        emit('error', {'message': str(e), 'session_id': data.get('session_id')})

@socketio.on('process_audio_request')
def handle_audio_processing(data):
    try:
        # Check if the received data is a string (raw JSON string from Swift)
        if isinstance(data, str):
            # Remove both single and double backslashes
            clean_data = data.replace("\\\\", "\\").replace("\\", "")
            # Parse the cleaned raw JSON string into a dictionary
            try:
                data = json.loads(clean_data)
            except json.JSONDecodeError as e:
                emit('error', {'message': 'Invalid JSON format: ' + str(e)})
                return

        # Clean model_name and strip leading/trailing spaces
        if "model_name" in data:
            data["model_name"] = data["model_name"].replace("\\", "").strip()

        # Clean optional parameters and strip leading/trailing spaces
        for param in ['top_k', 'temperature', 'cfg_coef', 'description']:
            if param in data and data[param] is not None:
                data[param] = str(data[param]).replace("\\", "").strip()

        # Proceed with the usual flow
        request_data = AudioRequest(**data)
        session_id = generate_session_id()

        if is_generation_in_progress(session_id):
            emit('error', {'message': 'Generation already in progress', 'session_id': session_id}, room=session_id)
            return

        join_room(session_id)

        # Emit the session ID immediately after generation and joining the room
        emit('process_audio_received', {'session_id': session_id})
        print(f"Emitted process_audio_received for session {session_id}")

        input_data_base64 = request_data.audio_data
        model_name = request_data.model_name
        prompt_duration = request_data.prompt_duration

        # Extract optional parameters with default values if not provided
        top_k = int(request_data.top_k) if request_data.top_k is not None else 250
        temperature = float(request_data.temperature) if request_data.temperature is not None else 1.0
        cfg_coef = float(request_data.cfg_coef) if request_data.cfg_coef is not None else 3.0
        description = request_data.description if request_data.description else None

        # Log relevant information without base64 data
        print(f"Received process_audio_request for session {session_id} with model_name: {model_name}, prompt_duration: {prompt_duration}")

        store_audio_data(session_id, input_data_base64, 'initial_audio')
        set_generation_in_progress(session_id, True)

        @copy_current_request_context
        def audio_processing_thread():
            try:
                def progress_callback(current, total):
                    progress_percent = (current / total) * 100
                    emit('progress_update', {'progress': int(progress_percent), 'session_id': session_id}, room=session_id)

                # Call process_audio with new parameters
                result_base64 = process_audio(
                    input_data_base64,
                    model_name,
                    progress_callback,
                    prompt_duration=prompt_duration,
                    top_k=top_k,
                    temperature=temperature,
                    cfg_coef=cfg_coef,
                    description=description
                )
                print(f"Audio processed successfully for session {session_id}")

                store_audio_data(session_id, result_base64, 'last_processed_audio')
                emit('audio_processed', {'audio_data': result_base64, 'session_id': session_id}, room=session_id)
            except Exception as e:
                print(f"Error during audio processing thread for session {session_id}: {e}")
                emit('error', {'message': str(e), 'session_id': session_id})
            finally:
                set_generation_in_progress(session_id, False)

        gevent.spawn(audio_processing_thread)

    except ValidationError as e:
        emit('error', {'message': str(e), 'session_id': generate_session_id()})

@socketio.on('continue_music_request')
def handle_continue_music(data):
    try:
        # Check if the received data is a string (raw JSON string from Swift)
        if isinstance(data, str):
            # Remove both single and double backslashes
            clean_data = data.replace("\\\\", "\\").replace("\\", "")
            # Parse the cleaned raw JSON string into a dictionary
            try:
                data = json.loads(clean_data)
            except json.JSONDecodeError as e:
                emit('error', {'message': 'Invalid JSON format: ' + str(e)})
                return

        # Clean model_name and strip leading/trailing spaces
        if "model_name" in data:
            data["model_name"] = data["model_name"].replace("\\", "").strip()

        # Clean session_id
        if "session_id" in data:
            data["session_id"] = data["session_id"].replace("\\", "").strip()

        # Clean optional parameters and strip leading/trailing spaces
        for param in ['top_k', 'temperature', 'cfg_coef', 'description']:
            if param in data and data[param] is not None:
                data[param] = str(data[param]).replace("\\", "").strip()

        # Proceed with the usual flow using the updated Pydantic model
        request_data = ContinueMusicRequest(**data)
        session_id = request_data.session_id

        if is_generation_in_progress(session_id):
            emit('error', {'message': 'Generation already in progress', 'session_id': session_id}, room=session_id)
            return

        emit('continue_music_received', {'session_id': session_id, 'message': 'Starting continuation'})
        print(f"Emitted continue_music_received for session {session_id}")

        # Use 'audio_data' from data if available, else retrieve from session
        if request_data.audio_data:
            input_data_base64 = request_data.audio_data
            print(f"Using 'audio_data' from request for session {session_id}")
        else:
            input_data_base64 = retrieve_audio_data(session_id, 'last_processed_audio')
            print(f"Retrieved 'last_processed_audio' from session {session_id}")

        if input_data_base64 is None:
            emit('error', {'message': 'No audio data available for continuation', 'session_id': session_id}, room=session_id)
            return

        # Extract optional parameters with default values if not provided
        top_k = int(request_data.top_k) if request_data.top_k is not None else 250
        temperature = float(request_data.temperature) if request_data.temperature is not None else 1.0
        cfg_coef = float(request_data.cfg_coef) if request_data.cfg_coef is not None else 3.0
        description = request_data.description if request_data.description else None

        model_name = request_data.model_name or sessions.find_one({'_id': session_id}).get('model_name')
        prompt_duration = request_data.prompt_duration or sessions.find_one({'_id': session_id}).get('prompt_duration')

        print(f"Continuing music for session {session_id} with model_name: {model_name}, prompt_duration: {prompt_duration}")

        set_generation_in_progress(session_id, True)

        @copy_current_request_context
        def continue_music_thread():
            try:
                def progress_callback(current, total):
                    progress_percent = (current / total) * 100
                    emit('progress_update', {'progress': int(progress_percent), 'session_id': session_id}, room=session_id)

                result_base64 = continue_music(
                    input_data_base64,
                    model_name,
                    progress_callback,
                    prompt_duration=prompt_duration,
                    top_k=top_k,
                    temperature=temperature,
                    cfg_coef=cfg_coef,
                    description=description
                )

                store_audio_data(session_id, input_data_base64, 'last_input_audio')
                store_audio_data(session_id, result_base64, 'last_processed_audio')

                # Calculate the size of the base64 string in bytes
                result_size_bytes = len(result_base64.encode('utf-8'))

                # Get the max_http_buffer_size (ensure it's consistent with your SocketIO configuration)
                max_size_bytes = 64 * 1024 * 1024  # 64 MB

                if result_size_bytes > max_size_bytes:
                    emit('error', {
                        'message': 'Generated audio data is too large to send.',
                        'session_id': session_id,
                        'code': 'DATA_TOO_LARGE'
                    }, room=session_id)
                    print(f"Generated audio data is too large for session {session_id}: {result_size_bytes} bytes.")
                else:
                    try:
                        emit('music_continued', {'audio_data': result_base64, 'session_id': session_id}, room=session_id)
                    except Exception as e:
                        print(f"Error emitting music_continued for session {session_id}: {e}")
                        emit('error', {
                            'message': 'Error sending generated audio data.',
                            'session_id': session_id,
                            'code': 'EMIT_ERROR'
                        }, room=session_id)
            except Exception as e:
                print(f"Error during continue_music_thread for session {session_id}: {e}")
                emit('error', {'message': str(e), 'session_id': session_id}, room=session_id)
            finally:
                set_generation_in_progress(session_id, False)

        gevent.spawn(continue_music_thread)
    except ValidationError as e:
        emit('error', {'message': str(e), 'session_id': data.get('session_id') if isinstance(data, dict) else None})

@socketio.on('retry_music_request')
def handle_retry_music(data):
    try:
        # Check if the received data is a string (raw JSON string from Swift)
        if isinstance(data, str):
            # Remove both single and double backslashes
            clean_data = data.replace("\\\\", "\\").replace("\\", "")
            # Parse the cleaned raw JSON string into a dictionary
            try:
                data = json.loads(clean_data)
            except json.JSONDecodeError as e:
                emit('error', {'message': 'Invalid JSON format: ' + str(e)})
                return

        # Clean model_name and strip leading/trailing spaces
        if "model_name" in data:
            data["model_name"] = data["model_name"].replace("\\", "").strip()

        # Clean session_id
        if "session_id" in data:
            data["session_id"] = data["session_id"].replace("\\", "").strip()

        # Clean optional parameters and strip leading/trailing spaces
        for param in ['top_k', 'temperature', 'cfg_coef', 'description']:
            if param in data and data[param] is not None:
                data[param] = str(data[param]).replace("\\", "").strip()

        # Proceed with the usual flow using the updated data
        request_data = SessionRequest(**data)
        session_id = request_data.session_id

        if is_generation_in_progress(session_id):
            emit('error', {'message': 'Generation already in progress', 'session_id': session_id}, room=session_id)
            return

        last_input_base64 = retrieve_audio_data(session_id, 'last_input_audio')
        if last_input_base64 is None:
            emit('error', {'message': 'No last input audio available for retry', 'session_id': session_id}, room=session_id)
            return

        # Extract optional parameters with default values if not provided
        top_k = int(request_data.top_k) if request_data.top_k is not None else 250
        temperature = float(request_data.temperature) if request_data.temperature is not None else 1.0
        cfg_coef = float(request_data.cfg_coef) if request_data.cfg_coef is not None else 3.0
        description = request_data.description if request_data.description else None

        model_name = request_data.model_name or sessions.find_one({'_id': session_id}).get('model_name')
        prompt_duration = request_data.prompt_duration or sessions.find_one({'_id': session_id}).get('prompt_duration')

        print(f"Retrying music for session {session_id} with model_name: {model_name}, prompt_duration: {prompt_duration}")
        emit('retry_music_received', {'session_id': session_id}, room=session_id)
        print(f"Emitted retry_music_received for session {session_id}")


        set_generation_in_progress(session_id, True)

        @copy_current_request_context
        def retry_music_thread():
            try:
                def progress_callback(current, total):
                    progress_percent = (current / total) * 100
                    emit('progress_update', {'progress': int(progress_percent), 'session_id': session_id}, room=session_id)

                result_base64 = continue_music(
                    last_input_base64,
                    model_name,
                    progress_callback,
                    prompt_duration=prompt_duration,
                    top_k=top_k,
                    temperature=temperature,
                    cfg_coef=cfg_coef,
                    description=description
                )
                store_audio_data(session_id, last_input_base64, 'last_input_audio')
                store_audio_data(session_id, result_base64, 'last_processed_audio')
                emit('music_retried', {'audio_data': result_base64, 'session_id': session_id}, room=session_id)
            except Exception as e:
                print(f"Error during retry_music_thread for session {session_id}: {e}")
                emit('error', {'message': str(e), 'session_id': session_id}, room=session_id)
            finally:
                set_generation_in_progress(session_id, False)

        gevent.spawn(retry_music_thread)
    except ValidationError as e:
        session_id = data.get('session_id') if isinstance(data, dict) else None
        emit('error', {'message': str(e), 'session_id': session_id})

@socketio.on('update_cropped_audio')
def handle_update_cropped_audio(data):
    try:
        if isinstance(data, str):
            clean_data = data.replace("\\\\", "\\").replace("\\", "")
            try:
                data = json.loads(clean_data)
            except json.JSONDecodeError as e:
                emit('error', {'message': 'Invalid JSON format: ' + str(e)})
                return

        request_data = SessionRequest(**data)
        session_id = request_data.session_id
        audio_data_base64 = data.get('audio_data')

        if not session_id or not audio_data_base64:
            raise ValueError("Missing session_id or audio_data")

        # Validate session exists
        session = sessions.find_one({'_id': session_id})
        if not session:
            raise ValueError("Invalid session ID")

        # Check file size
        data_size_bytes = len(audio_data_base64.encode('utf-8'))
        max_size_bytes = 64 * 1024 * 1024  # 64 MB

        if data_size_bytes > max_size_bytes:
            emit('error', {
                'message': 'Cropped audio data is too large',
                'code': 'DATA_TOO_LARGE',
                'session_id': session_id
            }, room=session_id)
            return

        store_audio_data(session_id, audio_data_base64, 'last_processed_audio')
        emit('update_cropped_audio_complete', {
            'message': 'Cropped audio updated',
            'session_id': session_id,
            'data_size': data_size_bytes
        }, room=session_id)

        print(f"Cropped audio updated for session {session_id}")

    except Exception as e:
        session_id = data.get('session_id') if isinstance(data, dict) else 'unknown'
        print(f"Error in update_cropped_audio for session {session_id}: {e}")
        emit('error', {'message': str(e), 'session_id': session_id})

@socketio.on('restore_processed_audio')
def handle_restore_processed_audio(data):
    try:
        if isinstance(data, str):
            clean_data = data.replace("\\\\", "\\").replace("\\", "")
            try:
                data = json.loads(clean_data)
            except json.JSONDecodeError as e:
                emit('error', {'message': 'Invalid JSON format: ' + str(e)})
                return

        # Get the audio data size
        audio_data_base64 = data.get('audio_data')
        if not audio_data_base64:
            raise ValueError("Missing audio data")

        # Check file size before processing
        data_size_bytes = len(audio_data_base64.encode('utf-8'))
        max_size_bytes = 64 * 1024 * 1024  # 64 MB

        if data_size_bytes > max_size_bytes:
            emit('error', {
                'message': 'Audio data is too large to restore',
                'code': 'DATA_TOO_LARGE'
            })
            return

        # Create a new session for the restored audio
        session_id = generate_session_id()
        join_room(session_id)

        model_name = data.get('model_name', '').replace("\\", "").strip()
        prompt_duration = data.get('prompt_duration')

        if not all([model_name, prompt_duration]):
            raise ValueError("Missing required parameters")

        # Store the audio data in the new session
        store_audio_data(session_id, audio_data_base64, 'last_processed_audio')

        # Store session settings
        sessions.update_one(
            {'_id': session_id},
            {
                '$set': {
                    'model_name': model_name,
                    'prompt_duration': prompt_duration,
                    'restored': True  # Flag to indicate this is a restored session
                }
            },
            upsert=True
        )

        emit('restore_complete', {
            'message': 'Audio restored successfully',
            'session_id': session_id,
            'data_size': data_size_bytes
        }, room=session_id)

    except Exception as e:
        print(f"Error in restore_processed_audio: {e}")
        emit('error', {'message': str(e)})

@socketio.on('begin_restore_audio')
def handle_begin_restore(data):
    try:
        session_id = generate_session_id()
        join_room(session_id)

        redis_client.set(f"{session_id}_restore_chunks", "")

        emit('ready_for_chunks', {
            'session_id': session_id,
            'chunk_size': 8 * 1024 * 1024  # 8MB chunks
        })

    except Exception as e:
        emit('error', {'message': str(e)})

@socketio.on('audio_chunk')
def handle_audio_chunk(data):
    try:
        # Handle string input just like restore_processed_audio
        if isinstance(data, str):
            clean_data = data.replace("\\\\", "\\").replace("\\", "")
            try:
                data = json.loads(clean_data)
            except json.JSONDecodeError as e:
                emit('error', {'message': 'Invalid JSON format: ' + str(e)})
                return

        session_id = data.get('session_id')
        chunk = data.get('chunk')
        chunk_index = data.get('chunk_index')
        total_chunks = data.get('total_chunks')
        is_last = data.get('is_last', False)

        if not all([session_id, chunk, isinstance(chunk_index, int), isinstance(total_chunks, int)]):
            raise ValueError("Missing required chunk data")

        # Store chunk with a longer expiration time
        chunk_key = f"{session_id}_chunk_{chunk_index}"
        redis_client.setex(chunk_key, 3600, chunk)  # 1 hour expiration

        # Track received chunks in a Redis set
        received_chunks_key = f"{session_id}_received_chunks_set"
        redis_client.sadd(received_chunks_key, chunk_index)
        redis_client.expire(received_chunks_key, 3600)  # 1 hour expiration

        # Get count of received chunks
        received_count = redis_client.scard(received_chunks_key)

        # Acknowledge receipt
        emit('chunk_received', {
            'session_id': session_id,
            'chunk_index': chunk_index,
            'total_chunks': total_chunks,
            'received_chunks': received_count
        })

        print(f"Stored chunk {chunk_index} of {total_chunks} for session {session_id}")
        print(f"Received chunks count: {received_count}")

        # If this is the last chunk or we have all chunks, process them
        if is_last or received_count == total_chunks:
            # Verify we have all chunks
            all_chunks_present = True
            missing_chunks = []

            for i in range(total_chunks):
                chunk_exists = redis_client.exists(f"{session_id}_chunk_{i}")
                if not chunk_exists:
                    all_chunks_present = False
                    missing_chunks.append(i)
                    print(f"Missing chunk {i} for session {session_id}")

            if all_chunks_present:
                # Combine all chunks in order
                complete_audio = []
                for i in range(total_chunks):
                    chunk_key = f"{session_id}_chunk_{i}"
                    chunk_data = redis_client.get(chunk_key)
                    if chunk_data:
                        complete_audio.append(chunk_data.decode('utf-8'))
                        redis_client.delete(chunk_key)

                # Clean up
                redis_client.delete(received_chunks_key)

                # Store the complete audio
                complete_audio_data = ''.join(complete_audio)
                store_audio_data(session_id, complete_audio_data, 'last_processed_audio')

                # Store session settings
                if data.get('model_name') and data.get('prompt_duration'):
                    sessions.update_one(
                        {'_id': session_id},
                        {
                            '$set': {
                                'model_name': data.get('model_name'),
                                'prompt_duration': data.get('prompt_duration'),
                                'restored': True
                            }
                        },
                        upsert=True
                    )

                emit('restore_complete', {
                    'message': 'Audio restored successfully',
                    'session_id': session_id
                }, room=session_id)
            else:
                # Request missing chunks
                emit('chunks_missing', {
                    'session_id': session_id,
                    'missing_chunks': missing_chunks
                })

    except Exception as e:
        print(f"Error in handle_audio_chunk: {e}")
        emit('error', {'message': str(e)})

@socketio.on('transform_audio_request')
def handle_transform_audio(data):
    try:
        # Handle string input (from Swift)
        if isinstance(data, str):
            clean_data = data.replace("\\\\", "\\").replace("\\", "")
            try:
                data = json.loads(clean_data)
            except json.JSONDecodeError as e:
                emit('error', {'message': 'Invalid JSON format: ' + str(e)})
                return

        request_data = TransformRequest(**data)
        session_id = request_data.session_id or generate_session_id()

        if is_generation_in_progress(session_id):
            emit('error', {'message': 'Generation already in progress', 'session_id': session_id}, room=session_id)
            return

        join_room(session_id)

        if not request_data.session_id:
            emit('transform_audio_received', {'session_id': session_id})
            print(f"Emitted transform_audio_received for new session {session_id}")

        # Get audio data
        if request_data.audio_data:
            input_data_base64 = request_data.audio_data
        else:
            input_data_base64 = retrieve_audio_data(session_id, 'last_processed_audio')
            if input_data_base64 is None:
                emit('error', {'message': 'No audio data available for transformation', 'session_id': session_id}, room=session_id)
                return

        set_generation_in_progress(session_id, True)

        # Create a wrapped emit function that preserves the request context
        @copy_current_request_context
        def context_emit(event, data):
            socketio.emit(event, data, room=session_id)

        def transform_audio_thread():
            flask_socket = None
            try:
                # Create socket.io client instance
                flask_socket = Client()

                # Define progress handler with the wrapped emit
                @flask_socket.on('progress')
                def handle_progress(data):
                    if data['session_id'] == session_id:
                        context_emit('progress_update', {
                            'progress': data['progress'],
                            'session_id': session_id
                        })

                # Connect to Flask server's WebSocket
                flask_socket.connect('http://melodyflow:8002', wait_timeout=10)
                # flask_socket.connect('http://10.0.0.5:8002', wait_timeout=10)

                # Make the HTTP request for processing
                response = requests.post(
                    'http://melodyflow:8002/transform',
                   # 'http://10.0.0.5:8002/transform',
                    json={
                        'audio': input_data_base64,
                        'variation': request_data.variation,
                        'session_id': session_id
                    }
                )

                if response.status_code == 200:
                    result = response.json()
                    result_base64 = result['audio']

                    # Store audio data
                    store_audio_data(session_id, input_data_base64, 'last_input_audio')
                    store_audio_data(session_id, result_base64, 'last_processed_audio')

                    # Check size before sending
                    result_size_bytes = len(result_base64.encode('utf-8'))
                    max_size_bytes = 64 * 1024 * 1024

                    if result_size_bytes > max_size_bytes:
                        context_emit('error', {
                            'message': 'Transformed audio data is too large to send.',
                            'session_id': session_id,
                            'code': 'DATA_TOO_LARGE'
                        })
                    else:
                        context_emit('audio_transformed', {
                            'audio_data': result_base64,
                            'session_id': session_id,
                            'variation': request_data.variation
                        })
                else:
                    error_message = response.json().get('error', 'Unknown error during transformation')
                    context_emit('error', {'message': error_message, 'session_id': session_id})

            except Exception as e:
                print(f"Error during transform_audio_thread for session {session_id}: {e}")
                context_emit('error', {'message': str(e), 'session_id': session_id})
            finally:
                if flask_socket:
                    flask_socket.disconnect()
                set_generation_in_progress(session_id, False)

        gevent.spawn(transform_audio_thread)

    except ValidationError as e:
        emit('error', {'message': str(e), 'session_id': data.get('session_id') if isinstance(data, dict) else None})

@socketio.on('undo_transform_request')
def handle_undo_transform(data):
    try:
        request_data = SessionRequest(**data)
        session_id = request_data.session_id

        if not session_id:
            emit('error', {'message': 'No session ID provided for undo'})
            return

        # Retrieve the last input audio that was transformed
        last_input_base64 = retrieve_audio_data(session_id, 'last_input_audio')
        if last_input_base64 is None:
            emit('error', {
                'message': 'No previous audio found to undo to',
                'session_id': session_id
            }, room=session_id)
            return

        # Update the last_processed_audio to be the previous input
        store_audio_data(session_id, last_input_base64, 'last_processed_audio')

        # Send the previous audio back to the client
        emit('transform_undone', {
            'audio_data': last_input_base64,
            'session_id': session_id
        }, room=session_id)

    except Exception as e:
        print(f"Error during undo_transform for session {session_id}: {e}")
        emit('error', {'message': str(e), 'session_id': session_id})

# Robust Health Check Route
@app.route('/health', methods=['GET'])
def health_check():
    health_status = {"status": "live"}

    # Check MongoDB
    try:
        client.admin.command('ping')
        health_status['mongodb'] = 'live'
    except Exception as e:
        health_status['mongodb'] = f'down: {str(e)}'
        health_status['status'] = 'degraded'

    # Check Redis
    try:
        redis_client.ping()
        health_status['redis'] = 'live'
    except Exception as e:
        health_status['redis'] = f'down: {str(e)}'
        health_status['status'] = 'degraded'

    # Check PyTorch (Optional, if it's critical)
    try:
        if torch.cuda.is_available():
            health_status['pytorch'] = 'live'
        else:
            health_status['pytorch'] = 'no GPU detected'
    except Exception as e:
        health_status['pytorch'] = f'down: {str(e)}'
        health_status['status'] = 'degraded'

    return jsonify(health_status), 200 if health_status['status'] == 'live' else 500

@app.route('/api/latest_generated_audio/<session_id>', methods=['GET'])
def get_latest_generated_audio(session_id):
    """
    Retrieve the most recently generated audio for a session if generation completed.
    This endpoint is specifically for recovering audio that was generated while the app was minimized.
    """
    try:
        # Check if generation is still in progress
        if is_generation_in_progress(session_id):
            return jsonify({
                'status': 'in_progress',
                'message': 'Audio generation still in progress'
            }), 202

        # Retrieve the session data
        session_data = sessions.find_one({'_id': session_id})
        if not session_data:
            return jsonify({
                'status': 'not_found',
                'message': 'Session not found'
            }), 404

        # Get the most recently processed audio
        audio_data = retrieve_audio_data(session_id, 'last_processed_audio')
        if not audio_data:
            return jsonify({
                'status': 'no_audio',
                'message': 'No processed audio found for this session'
            }), 404

        # Return the audio data along with session parameters needed for restoration
        return jsonify({
            'status': 'success',
            'audio_data': audio_data,
            'model_name': session_data.get('model_name'),
            'prompt_duration': session_data.get('prompt_duration'),
            'session_id': session_id
        }), 200

    except Exception as e:
        print(f"Error retrieving latest generated audio for session {session_id}: {e}")
        return jsonify({
            'status': 'error',
            'message': str(e)
        }), 500

# Add a cleanup mechanism to remove old sessions
@app.route('/api/cleanup_old_sessions', methods=['POST'])
def cleanup_old_sessions():
    threshold_time = datetime.now(timezone.utc) - timedelta(hours=24)
    result = sessions.delete_many({
        'created_at': {'$lt': threshold_time}
    })
    return jsonify({
        'status': 'success',
        'deleted_count': result.deleted_count
    }), 200

if __name__ == '__main__':
    socketio.run(app, debug=False)