Directora de Investigación de IA Naomi marca la agenda de investigación del benchmark de Macro Tracker Lab y es la autora principal del ciclo 2026. Diseñó el protocolo de platos de referencia pesados al gramo que ancla todo el benchmark.
Ingeniero de Benchmark Senior Marcus dirige la ejecución diaria del benchmark, el arnés de evaluación, los estudios de uso real de 21 días y los subtests por cocina. Instrumentó el pipeline de tiempos que produce nuestra métrica de captura mediana.
Líder de Visión por Computadora Priya lidera el lado de visión: ejecutar las 22.400 comidas de referencia a través de cada flujo de captura, instrumentar el tiempo por fotograma y analizar el error de porción por cocina.
Jordan es responsable del arnés de evaluación de modelos: cómo se puntúan las predicciones de cada app contra la verdad de campo pesada al gramo sin penalizar respuestas top-3 correctas.
Investigador de Evaluación de IA Rohit diseña la rúbrica de puntuación que convierte salidas crudas de modelo en un número compuesto. Es propietario de la calibración entre identificación, porción, velocidad y cobertura.
Sofia traduce la salida de ingeniería en las comparativas que los lectores realmente quieren: head-to-heads, categorías "mejor para" y el tono editorial del sitio.
Ellie mantiene el benchmark reproducible: versionado de datasets, el parque de dispositivos (iPhone 16 Pro, Pixel 9 Pro, Galaxy S25 Ultra, OnePlus 13, iPhone 14) y el pipeline que ingiere todas las apps al store de evaluación compartido.