团队

Wie staat er achter de Macro Tracker Lab benchmark?

设计并运行 Macro Tracker Lab 基准测试的 AI 研究员、工程师与分析师。

Dr. Naomi Vargas

Dr. Naomi Vargas

AI 研究总监

Naomi 制定 Macro Tracker Lab 基准测试的研究议程,并担任 2026 年度首席作者。她设计了以克为单位称重的参考餐盘协议,这是整个基准测试的锚点。

Marcus Holm

Marcus Holm

高级基准工程师

Marcus 负责基准测试的日常执行:评估框架、21 天真实使用研究以及按菜系的子测试。他搭建了用于产出捕获中位耗时指标的计时管线。

Priya Banerjee

Priya Banerjee

计算机视觉负责人

Priya 负责视觉部分:将 22,400 份参考餐放入每个 App 的捕获流程、对每帧计时进行仪器化,并按菜系分析分量误差。

Dr. Jordan Oliver

Dr. Jordan Oliver

高级机器学习工程师

Jordan 负责模型评估框架:如何在以克称重的真实值面前为每个 App 的预测打分,同时不冤枉合理拒答或正确的 Top-3 答案。

Dr. Rohit Kapoor

Dr. Rohit Kapoor

AI 评估研究员

Rohit 设计将原始模型输出转换为单一综合分数的评分量规。他负责识别、分量、速度与覆盖率之间的权重校准。

Sofia Mendes

Sofia Mendes

AI 产品经理

Sofia 把工程产出翻译成读者真正想看的对比:对决、最佳分类和站点的编辑口径。

Ellie Cho

Ellie Cho

MLOps 工程师

Ellie 让基准测试保持可复现:数据集版本管理、设备机房(iPhone 16 Pro、Pixel 9 Pro、Galaxy S25 Ultra、OnePlus 13、iPhone 14)以及把每个 App 接入共享评估存储的数据管线。