Naomi setzt die Forschungsagenda des Macro Tracker Lab-Benchmarks und ist die Hauptautorin des Zyklus 2026. Sie hat das gramm-gewogene Referenzteller-Protokoll entwickelt, das den gesamten Benchmark verankert.
Senior Benchmark Engineer Marcus verantwortet die tägliche Durchführung des Benchmarks, das Evaluierungs-Harness, die 21-tägigen Real-World-Studien und die Sub-Tests pro Küche. Er hat das Timing-Pipeline für die mediane Capture-Speed-Metrik instrumentiert.
Priya leitet die Vision-Seite: 22.400 Referenzmahlzeiten durch jeden Capture-Flow zu schicken, Frame-Timing zu instrumentieren und Portionsfehler küchenweise zu analysieren.
Jordan besitzt das Modell-Evaluations-Harness: wie die Vorhersagen jeder App gegen gramm-gewogene Ground-Truth bewertet werden, ohne korrekte Top-3-Antworten unfair zu bestrafen.
Rohit entwirft die Scoring-Rubric, die rohe Modellausgaben in eine einzige Composite-Zahl verwandelt. Er verantwortet die Gewichtskalibrierung zwischen Identifikation, Portion, Geschwindigkeit und Abdeckung.
Sofia übersetzt den Engineering-Output in die Vergleiche, die Leser wirklich wollen: Head-to-Heads, „Bestes für"-Kategorien und die redaktionelle Stimme der Site.
Ellie hält den Benchmark reproduzierbar: Dataset-Versionierung, Geräte-Farm (iPhone 16 Pro, Pixel 9 Pro, Galaxy S25 Ultra, OnePlus 13, iPhone 14) und die Pipeline, die jede App in den gemeinsamen Evaluation-Store einspeist.