团队

Wie staat er achter de Macro Tracker Lab benchmark?

设计并运行 Macro Tracker Lab 基准测试的 AI 研究员、工程师与分析师。

AI 研究总监

Naomi 制定 Macro Tracker Lab 基准测试的研究议程,并担任 2026 年度首席作者。她设计了以克为单位称重的参考餐盘协议,这是整个基准测试的锚点。

高级基准工程师

Marcus 负责基准测试的日常执行:评估框架、21 天真实使用研究以及按菜系的子测试。他搭建了用于产出捕获中位耗时指标的计时管线。

计算机视觉负责人

Priya 负责视觉部分:将 22,400 份参考餐放入每个 App 的捕获流程、对每帧计时进行仪器化,并按菜系分析分量误差。

高级机器学习工程师

Jordan 负责模型评估框架:如何在以克称重的真实值面前为每个 App 的预测打分,同时不冤枉合理拒答或正确的 Top-3 答案。

AI 评估研究员

Rohit 设计将原始模型输出转换为单一综合分数的评分量规。他负责识别、分量、速度与覆盖率之间的权重校准。

AI 产品经理

Sofia 把工程产出翻译成读者真正想看的对比:对决、最佳分类和站点的编辑口径。

MLOps 工程师

Ellie 让基准测试保持可复现:数据集版本管理、设备机房(iPhone 16 Pro、Pixel 9 Pro、Galaxy S25 Ultra、OnePlus 13、iPhone 14)以及把每个 App 接入共享评估存储的数据管线。