Arquitectura YOLOv11x

Modelo de detección de objetos orientado a inferencia visual rápida.

Dataset 2.600

Imágenes anotadas manualmente y preparadas para entrenamiento supervisado.

Clases 6

Categorías para palets, embalajes y dimensiones correctas o incorrectas.

Entrenamiento 300

Iteraciones de entrenamiento con apoyo de GPU NVIDIA A100.

Funcionamiento interno

Arquitectura del modelo

El sistema de AURION divide la detección en tres bloques principales: extracción de características, fusión de información visual y predicción final.

01

Backbone

Extrae características relevantes de la imagen, como bordes, formas, texturas y patrones visuales útiles para detectar anomalías.

02

Neck

Une información de distintas resoluciones para mejorar la detección de objetos grandes y pequeños dentro de la escena logística.

03

Head

Realiza las predicciones finales: clase detectada, posición de la caja y nivel de confianza asociado a cada resultado.

Clasificación logística

Clases que detecta

Las seis clases permiten distinguir entre estado del palet, calidad del embalaje y corrección dimensional de la mercancía.

01
Palet en buen estado Unidad logística apta para manipulación y almacenamiento.
02
Palet dañado o fisurado Palet con defectos visibles que pueden comprometer seguridad o eficiencia.
03
Paquete correcto en embalaje y dimensiones Carga bien envuelta y ajustada al estándar esperado.
04
Paquete con embalaje incorrecto Dimensiones válidas, pero envoltorio deficiente, roto o mal colocado.
05
Paquete con dimensiones incorrectas Embalaje correcto, pero volumen o posición fuera del estándar.
06
Paquete incorrecto en embalaje y dimensiones Escenario de mayor riesgo dentro de la inspección automatizada.
Entrenamiento y validación

Cómo se entrenó el sistema

El entrenamiento se diseñó para exponer al modelo a distintas vistas, condiciones de iluminación y combinaciones de carga.

Datos anotados manualmente

Se utilizaron aproximadamente 2.600 imágenes anotadas para cubrir las seis clases de AURION.

Aumento de datos

Se aplicó data augmentation para mejorar la capacidad de generalización ante cambios de ángulo, iluminación y disposición de la carga.

Equilibrio entre clases

Se buscó mantener un número similar de ejemplos por clase para evitar sesgos fuertes en la predicción.

1
Preparación del dataset

Recopilación de imágenes, labels y organización de las seis categorías principales.

2
Entrenamiento en Google Colab

Uso de GPU NVIDIA A100 para acelerar el proceso de entrenamiento del modelo.

3
300 iteraciones

Entrenamiento prolongado para ajustar detección, localización y clasificación.

4
Pruebas comparativas

Comparación entre YOLOv8n, YOLOv8x y YOLOv11x antes de elegir la arquitectura final.

Selección técnica

Comparación de versiones YOLO

La elección final se basó en pruebas entre distintas versiones, priorizando potencia, arquitectura y rendimiento para detección logística.

Base ligera

YOLOv8n

Versión compacta y rápida, útil para pruebas iniciales, pero con menor capacidad para patrones visuales complejos.

Mayor capacidad

YOLOv8x

Modelo más potente que la versión nano, adecuado para comparar mejoras de precisión y robustez.

Modelo en acción

De la arquitectura técnica a una demo funcional

La página del modelo explica la base técnica de AURION. El siguiente paso es probarlo con imágenes o vídeos para visualizar directamente sus predicciones.