Asesor Inteligente de IA Local

Fullstack / IA Integrada

Filtrado inteligente y recomendaciones de modelos LLM Open Source para entornos locales.

El Reto

El ecosistema de Inteligencia Artificial Open Source es inmenso y crece cada día. Para un usuario o desarrollador, resulta abrumador saber qué modelo puede ejecutar en su ordenador local según la memoria RAM que tiene, el idioma que necesita o la tarea específica que quiere realizar (código, texto, visión).

La Solución

Una aplicación web Fullstack que combina un motor de filtrado autónomo con un asistente conversacional inteligente. La herramienta analiza los requisitos del usuario, cruza los datos con un catálogo actualizado y devuelve el comando exacto para instalar el modelo ideal a través de Ollama.

Arquitectura y Funcionamiento

El sistema fue diseñado priorizando la automatización y la tolerancia a fallos:

Motor de Scraping Autónomo: Un script asíncrono en segundo plano consulta la API de Hugging Face cada 24 horas, clasificando y actualizando el catálogo de modelos automáticamente.
Alta Disponibilidad (Failover): La lógica del chat integra dos LLMs distintos. Si la API principal (Google Gemini) se satura o cae, el backend redirige la petición silenciosamente a Cohere, garantizando un servicio ininterrumpido.
Memoria de Barrido Cronológico: El sistema lee el historial completo del chat. Si el usuario cambia de opinión sobre sus requisitos (ej: rectifica su memoria RAM), el algoritmo actualiza los filtros en tiempo real antes de consultar a la IA.

Puntos Fuertes del Proyecto

Resiliencia Backend

Manejo avanzado de excepciones en FastAPI, peticiones asíncronas seguras y sistema de respaldo de APIs sin afectar la experiencia del usuario.

UX Optimizada

Interfaz moderna y minimalista con Dark Mode, notificaciones nativas y parseo automático de código para facilitar su copiado.

Stack Tecnológico

Python / FastAPI Vanilla JS Gemini & Cohere APIs Docker Hugging Face Spaces