es

Idioma

23 Dec 2025en El enfoque de Regula

Evaluación reciente de NIST: cómo interpretar soluciones de estimación de edad

Andrey Terekhin

Jefe de Producto, Regula

El papel de la estimación y verificación de edad sigue ampliándose, a medida que se promulgan cada vez más leyes en todo el mundo para imponer controles de acceso por edad. Por ejemplo, la Online Safety Act de este año ha establecido nuevas obligaciones para las redes sociales y los servicios de búsqueda, con el fin de proteger a los usuarios del Reino Unido frente a contenidos perjudiciales para los menores.

En consecuencia, también crece la importancia del software de verificación de edad y de la precisión con la que puede operar. Al buscar datos de rendimiento con autoridad, compradores y responsables de políticas públicas suelen remitirse a la Face Analysis Technology Evaluation for Age Estimation & Verification (FATE-AEV) de NIST.

En la edición más reciente de FATE-AEV, Regula Face SDK encabezó la lista de proveedores de verificación de identidad como el estimador más preciso en seis regiones geográficas.

¿Qué significa esto en la práctica? ¿Qué otras métricas son relevantes? ¿Qué mide NIST en términos generales?

Responderemos a estas preguntas y a muchas más al desglosar la metodología y los resultados de NIST.

Suscribirse

Suscríbase para recibir un resumen quincenal del blog de Regula

¿Qué es NIST y qué evalúa?

El Instituto Nacional de Estándares y Tecnología de Estados Unidos (NIST) es un laboratorio científico federal que participa en pruebas de rendimiento y desarrollo metodológico desde 1901. En esencia, NIST diseña pruebas imparciales, las ejecuta bajo condiciones controladas y publica sus conclusiones para que una audiencia más amplia pueda analizar el desempeño de distintos proveedores y sus soluciones.

En el caso de FATE-AEV, NIST lleva a cabo evaluaciones tecnológicas en las que los desarrolladores envían módulos de estimación y verificación de edad. El instituto ejecuta dichos módulos dentro de su propia infraestructura, publica la metodología y las métricas, y actualiza los resultados a medida que se incorporan nuevas participaciones.

Los resultados de FATE-AEV son relevantes para tres grupos: los implementadores que buscan desplegar soluciones, los desarrolladores interesados en el análisis de factores, y los responsables de políticas públicas que necesitan saber si la capacidad medida se ajusta a un caso de uso específico.

¿Qué se evalúa exactamente?

NIST realiza pruebas sobre dos tareas relacionadas:

  • Estimación de edad (AE): El módulo evaluado produce una edad numérica estimada a partir de una única imagen facial. NIST calcula qué tan cercanas están las predicciones a la edad real en distintos conjuntos de datos y cohortes.

  • Verificación de edad (AV): El módulo evaluado produce una decisión de sí/no en relación con un umbral legal. NIST cuantifica cuántos menores pasarían sin ser detectados y cuántos adultos serían cuestionados de forma injustificada.

Los datos que utiliza NIST

La evaluación se ejecuta sobre cuatro archivos operativos de gran tamaño con edades reales verificadas. Algunos conjuntos de datos también incluyen etiquetas de sexo y país de nacimiento. Las fuentes son:

  • Fotografías policiales de EE. UU. tras arrestos.

  • Fotografías de solicitudes capturadas en oficinas de inmigración.

  • Fotografías de visas mexicanas.

  • Capturas de cámaras web en cruces fronterizos de EE. UU.

Esta combinación es relevante porque la calidad de imagen, la pose, la óptica y la distribución de edades varían entre los archivos. Según NIST, la precisión cambia según el conjunto de datos, y las clasificaciones pueden variar cuando se modifica la fuente evaluada.

Las métricas más importantes de NIST

No toda la información que aparece en los informes de NIST tiene el mismo peso. En esta sección, hemos seleccionado las métricas más importantes a las que Usted debería prestar atención:

Métricas de precisión para la estimación

  • Error absoluto medio (MAE): El número promedio de años en que la predicción se desvía de la edad real en todas las muestras. Un valor más bajo significa que las estimaciones están más cerca de la edad verdadera en ese conjunto de datos, pero puede ocultar puntos débiles en determinados grupos o tipos de imagen.
  • Error absoluto mediano (MDAE): El valor central de los “años de error” una vez que todos los errores se ordenan (la mitad de los errores será menor que este valor y la otra mitad, mayor). Es más estable que el MAE cuando existen algunos casos con errores muy grandes, pero puede ocultar cuán significativos son esos errores poco frecuentes.
  • Desviación estándar del error absoluto: Una medida de qué tan concentrados están los errores alrededor del promedio. Dos sistemas con el mismo MAE pueden comportarse de forma muy distinta si uno presenta una dispersión de errores mucho mayor.
  • Error medio (sesgo): Indica si las estimaciones tienden, en promedio, a asignar una edad mayor o menor que la real. Un estimador con sesgo hacia edades mayores podría someter a más adultos a controles adicionales cerca del umbral legal, mientras que uno con sesgo hacia edades menores podría dejar pasar a más menores.
  • Fallo en el procesamiento (FTP): La proporción de imágenes que no generan un resultado utilizable. Incluso con buena precisión, un FTP elevado obliga a más usuarios a pasar por verificaciones alternativas más lentas. Este valor es relevante a nivel operativo, ya que un “sin resultado” suele activar un flujo de respaldo más costoso en tiempo.
Informe de estimación de edad del NIST: métricas básicas

Challenge-T: el parámetro clave de despliegue

Challenge-T es el puente esencial entre los resultados de laboratorio y las decisiones de política. El valor T representa un umbral concreto frente al cual se realizan las comprobaciones. NIST recomienda que T sea superior a la edad legal de restricción (L) por un cierto margen; por ejemplo, para L = 18, es habitual usar T = 25. En el informe más reciente, NIST utiliza varios valores de T: no solo 25, sino también 22, 28 y 31.

Informe de estimación de edad del NIST - Desafío 25

Si AE ≥ T, no se realizan comprobaciones adicionales (el sujeto pasa como adulto o por encima del umbral). Si AE < T, se requiere una segunda verificación (por ejemplo, lectura de documentos o revisión humana).

NIST informa sobre:

  • Tasa de falsos positivos (FPR) bajo Challenge-T: Menores estimados en T o por encima, que pasarían sin ser cuestionados. Un valor más bajo es más seguro.

  • Tasa de falsos negativos (FNR) bajo Challenge-T: Adultos estimados por debajo de T, que serían sometidos a verificación adicional. Un valor más bajo ofrece una experiencia más fluida para los usuarios.

  • Inefectividad e incomodidad: Tasas compuestas que ponderan los valores anteriores según la distribución de edades y la probabilidad de que personas de cada edad intenten realizar la acción evaluada.

Métricas de variabilidad y sensibilidad a la pose

NIST cuantifica el ruido entre fotogramas en videos frontales y deriva una estadística de sensibilidad al giro (yaw) a partir de videos con movimiento de cabeza. El coeficiente de yaw puede interpretarse como el “error adicional para una rotación de 90 grados”, con la salvedad de que los clips de prueba rara vez superan los 60 grados. Si su flujo permite clips cortos, promediar varios fotogramas ayuda a reducir el ruido. Si las vistas laterales son habituales, conviene usar un T ligeramente más alto o guiar al usuario de nuevo a una posición frontal.

Capacidad y contexto de rendimiento

NIST también publica detalles de implementación relevantes para discusiones técnicas: tamaño de los modelos, tamaño de las bibliotecas y tiempos de procesamiento en CPU de un solo núcleo para imágenes de 640×480. El tiempo de procesamiento varía hasta en un orden de magnitud entre las distintas entradas de la tabla, lo que puede ayudarle a decidir dónde ejecutar el estimador y cómo agrupar las tareas.

Cómo utilizar las directrices de NIST sobre estimación de edad para la verificación de identidad

La precisión de la estimación de edad es cada vez más importante, ya que surgen más y más casos de uso para este procedimiento. Venta de alcohol y tabaco, control de acceso a contenido para adultos, entregas por mensajería, funciones de seguridad para adolescentes, pagos en juegos: todos estos contextos dependen en gran medida de la estimación y verificación de edad.

La legislación también avanza. Por ejemplo, la Ley de Seguridad en Línea de este año ha impuesto nuevas obligaciones a las redes sociales y a los servicios de búsqueda para proteger a los usuarios del Reino Unido frente a contenidos perjudiciales para menores.

Veamos ahora con más detalle los datos del informe de NIST y en qué debería fijarse:

Control de edad en tienda y en el punto de venta

Escenario: Un quiosco o tableta captura una selfie antes del pago. El sistema calcula la edad estimada (AE) y la compara con T, que está por encima del límite legal. Si AE ≥ T, el proceso continúa. Si AE < T, se solicita el escaneo de un documento o una verificación humana.

Cómo usar las directrices de FATE-AEV: Seleccione T utilizando la tabla Challenge-T del conjunto de datos que coincida con su contexto (para L = 18, analice el rendimiento con T = 25) y compare los valores de desempeño. Cuanto más bajos, mejor.

Informe de estimación de edad del NIST - Challenge-T

Consejo operativo: Un mensaje previo a la captura que coloque el rostro de frente y pida quitarse las gafas puede reducir el error con una fricción mínima.

Entrega de alcohol y verificaciones por mensajería

Escenario: En el momento del pedido, la AE se ejecuta como pre-filtro. Si la AE está por debajo de T, se informa al usuario de que deberá presentar una prueba en la entrega y el flujo pasa a la captura de documentos o NFC. Los repartidores también reciben una señal clara de si deben esperar una verificación.

Cómo usar las directrices de FATE-AEV: Con L = 18 y T = 25, utilice la tabla de Ineffectiveness; este valor representa la tasa ponderada de menores que podrían acceder a productos restringidos sin ser cuestionados.Cuanto más bajo, mejor.

Informe de estimación de edad del NIST: ineficacia

Plataformas online con modos de seguridad para menores de 18

Escenario: Durante el registro, la AE dirige a los menores claros a modos supervisados o restringidos. Los casos ambiguos pasan a una verificación secundaria. Algunos servicios repiten la comprobación en momentos clave, como al activar monetización o al unirse a comunidades para adultos.

Cómo usar las directrices de FATE-AEV: Aquí la calidad de la imagen es crucial: una webcam económica puede generar imágenes que distorsionen los resultados. Preste especial atención al rendimiento de las soluciones con distintos tipos de calidad de imagen (fotos de frontera = menor calidad; fotos de aplicaciones y fichas = mayor calidad).Los valores más bajos son preferibles.

NIST age estimation report - various image qualities

Consejo operativo: Supervise los resultados por sexo y región, ya que el informe muestra cambios en rankings y errores según estos cortes. Aplique el mismo enfoque que en la verificación facial, donde las directrices de identidad establecen límites demográficos explícitos.

Principales retos técnicos de la estimación de edad

Podemos destacar cuatro grandes desafíos para el software de estimación de edad y los proveedores de verificación de identidad:

El envejecimiento varía según etnia y etapa vital

Los indicadores de edad difieren según el sexo y las cohortes regionales. Textura de la piel, vello facial, hábitos de peinado y estructura ósea influyen en lo que el modelo puede “leer”. Por eso es fundamental contar con una solución adecuada para todas las demografías, especialmente si su base de clientes es global.

Informe de estimación de edad del NIST: diversas razas y edades

La mezcla de edades también importa: las estimaciones para niños pequeños suelen ser muy precisas, mientras que el error aumenta en la adultez y la vejez. Un promedio global puede resultar engañoso si los usuarios no están distribuidos de forma uniforme.

Capturar las diferencias entre los modelos de pantanos si los ignoras

Las fotos de fichaje o de solicitud pueden parecer de estudio; en cambio, las imágenes de frontera suelen ser tipo webcam, con iluminación irregular y rostros en ángulo. NIST destaca que el error aumenta en imágenes de frontera para muchos algoritmos, incluso con los mismos sujetos. La óptica y la pose influyen significativamente.

Variabilidad instante a instante y giro de cabeza

NIST mide el ruido entre fotogramas en videos frontales y la sensibilidad al giro de cabeza, publicando estadísticas que reflejan cuán “inestables” son las estimaciones y cómo crece el error con el yaw. Esto afecta directamente a la experiencia del usuario. Si su flujo captura clips cortos, promediar fotogramas reduce la variabilidad; si son comunes las poses anguladas, debe esperar un mayor error.

Gafas y pequeños detalles de presentación

Las gafas alteran las estimaciones en muchos sistemas. El análisis comparativo de NIST muestra diferencias medibles entre la misma persona con y sin gafas en imágenes de frontera. Un breve aviso en cámara pidiendo quitárselas puede justificar el segundo adicional que toma y reducir falsos desafíos.

Regula, entre los mejores evaluados por NIST

El programa FATE-AEV de NIST ofrece a los responsables de decisión mediciones fiables y repetibles sobre datos comunes de AE/AV, y Regula se sitúa en lo más alto de varios gráficos de rendimiento. En concreto, Regula se posicionó entre los tres primeros en dos de los escenarios más críticos de aseguramiento de edad: Challenge 25 y Seguridad Infantil en Línea (edades 13–16).

Esto significa que la tecnología de Regula destaca tanto en la estimación precisa de la edad real como en la protección de menores frente a accesos y contenidos restringidos.

Regula Face SDK es una solución biométrica multiplataforma que puede respaldar sus procesos de verificación con:

  • Reconocimiento facial avanzado con prueba de vida: algoritmos precisos con liveness activo y pasivo para verificar usuarios en tiempo real y evitar ataques con fotos o videos.

  • Estimación de edad: alta precisión en todas las demografías raciales, protegiendo tanto a menores como a las empresas.

  • Evaluación de atributos faciales: análisis de expresión y accesorios para mejorar la precisión y la seguridad.

  • Comparación facial 1:1: cotejo de la imagen en vivo con el retrato del documento de identidad (visual o del chip RFID).

  • Reconocimiento facial 1:N: búsqueda del rostro en bases de datos completas, como listas negras.

  • Adaptabilidad a distintas condiciones de iluminación: funcionamiento eficaz en casi cualquier entorno.

¿Tiene alguna pregunta? No dude en contactarnos y con gusto le contaremos más sobre lo que Regula Face SDK puede ofrecerle.

Estamos aquí para ayudar

Verificación avanzada de documentos en línea, adaptada a las exigencias de sus proyectos, garantizando precisión, confiabilidad y seguridad.

En nuestro sitio web utilizamos cookies para recopilar información técnica. En particular, procesamos la dirección IP de su ubicación para personalizar el contenido del sitio.

Política de Cookies