Modelo | AURION

Arquitectura YOLOv11x

Modelo de detección de objetos orientado a inferencia visual rápida.

Dataset 2.600

Imágenes anotadas manualmente y preparadas para entrenamiento supervisado.

Clases 6

Categorías para palets, embalajes y dimensiones correctas o incorrectas.

Entrenamiento 300

Iteraciones de entrenamiento con apoyo de GPU NVIDIA A100.

Funcionamiento interno

Arquitectura del modelo

El sistema de AURION divide la detección en tres bloques principales: extracción de características, fusión de información visual y predicción final.

Backbone

Extrae características relevantes de la imagen, como bordes, formas, texturas y patrones visuales útiles para detectar anomalías.

Neck

Une información de distintas resoluciones para mejorar la detección de objetos grandes y pequeños dentro de la escena logística.

Head

Realiza las predicciones finales: clase detectada, posición de la caja y nivel de confianza asociado a cada resultado.

Clasificación logística

Clases que detecta

Las seis clases permiten distinguir entre estado del palet, calidad del embalaje y corrección dimensional de la mercancía.

Palet en buen estado Unidad logística apta para manipulación y almacenamiento.

Palet dañado o fisurado Palet con defectos visibles que pueden comprometer seguridad o eficiencia.

Paquete correcto en embalaje y dimensiones Carga bien envuelta y ajustada al estándar esperado.

Paquete con embalaje incorrecto Dimensiones válidas, pero envoltorio deficiente, roto o mal colocado.

Paquete con dimensiones incorrectas Embalaje correcto, pero volumen o posición fuera del estándar.

Paquete incorrecto en embalaje y dimensiones Escenario de mayor riesgo dentro de la inspección automatizada.

Entrenamiento y validación

Cómo se entrenó el sistema

El entrenamiento se diseñó para exponer al modelo a distintas vistas, condiciones de iluminación y combinaciones de carga.

Datos anotados manualmente

Se utilizaron aproximadamente 2.600 imágenes anotadas para cubrir las seis clases de AURION.

Aumento de datos

Se aplicó data augmentation para mejorar la capacidad de generalización ante cambios de ángulo, iluminación y disposición de la carga.

Equilibrio entre clases

Se buscó mantener un número similar de ejemplos por clase para evitar sesgos fuertes en la predicción.

Preparación del dataset

Recopilación de imágenes, labels y organización de las seis categorías principales.

Entrenamiento en Google Colab

Uso de GPU NVIDIA A100 para acelerar el proceso de entrenamiento del modelo.

300 iteraciones

Entrenamiento prolongado para ajustar detección, localización y clasificación.

Pruebas comparativas

Comparación entre YOLOv8n, YOLOv8x y YOLOv11x antes de elegir la arquitectura final.

Selección técnica

Comparación de versiones YOLO

La elección final se basó en pruebas entre distintas versiones, priorizando potencia, arquitectura y rendimiento para detección logística.

Base ligera

YOLOv8n

Versión compacta y rápida, útil para pruebas iniciales, pero con menor capacidad para patrones visuales complejos.

Mayor capacidad

YOLOv8x

Modelo más potente que la versión nano, adecuado para comparar mejoras de precisión y robustez.

Modelo seleccionado

YOLOv11x

Arquitectura final escogida por su capacidad para trabajar con detección multicategoría y escenarios visuales exigentes.

Imagen 01 del dataset de palets y mercancías — Dataset 01Imagen de entrenamiento

Imagen 02 del dataset de palets y mercancías — Dataset 02Imagen de entrenamiento

Imagen 03 del dataset de palets y mercancías — Dataset 03Imagen de entrenamiento

Imagen 04 del dataset de palets y mercancías — Dataset 04Imagen de entrenamiento

Imagen 05 del dataset de palets y mercancías — Dataset 05Imagen de entrenamiento

Imagen 06 del dataset de palets y mercancías — Dataset 06Imagen de entrenamiento

Imagen 07 del dataset de palets y mercancías — Dataset 07Imagen de entrenamiento

Imagen 08 del dataset de palets y mercancías — Dataset 08Imagen de entrenamiento

Imagen 09 del dataset de palets y mercancías — Dataset 09Imagen de entrenamiento

Imagen 10 del dataset de palets y mercancías — Dataset 10Imagen de entrenamiento

Imagen 11 del dataset de palets y mercancías — Dataset 11Imagen de entrenamiento

Imagen 12 del dataset de palets y mercancías — Dataset 12Imagen de entrenamiento

Imagen 13 del dataset de palets y mercancías — Dataset 13Imagen de entrenamiento

Imagen 14 del dataset de palets y mercancías — Dataset 14Imagen de entrenamiento

Imagen 15 del dataset de palets y mercancías — Dataset 15Imagen de entrenamiento

Imagen 16 del dataset de palets y mercancías — Dataset 16Imagen de entrenamiento

Modelo en acción

De la arquitectura técnica a una demo funcional

La página del modelo explica la base técnica de AURION. El siguiente paso es probarlo con imágenes o vídeos para visualizar directamente sus predicciones.

Ver el modelo en acción Ver resultados