Dr. Naomi Vargas
AI 研究总监Naomi 制定 Macro Tracker Lab 基准测试的研究议程,并担任 2026 年度首席作者。她设计了以克为单位称重的参考餐盘协议,这是整个基准测试的锚点。
设计并运行 Macro Tracker Lab 基准测试的 AI 研究员、工程师与分析师。
Naomi 制定 Macro Tracker Lab 基准测试的研究议程,并担任 2026 年度首席作者。她设计了以克为单位称重的参考餐盘协议,这是整个基准测试的锚点。
Marcus 负责基准测试的日常执行:评估框架、21 天真实使用研究以及按菜系的子测试。他搭建了用于产出捕获中位耗时指标的计时管线。
Priya 负责视觉部分:将 22,400 份参考餐放入每个 App 的捕获流程、对每帧计时进行仪器化,并按菜系分析分量误差。
Jordan 负责模型评估框架:如何在以克称重的真实值面前为每个 App 的预测打分,同时不冤枉合理拒答或正确的 Top-3 答案。
Rohit 设计将原始模型输出转换为单一综合分数的评分量规。他负责识别、分量、速度与覆盖率之间的权重校准。
Sofia 把工程产出翻译成读者真正想看的对比:对决、最佳分类和站点的编辑口径。
Ellie 让基准测试保持可复现:数据集版本管理、设备机房(iPhone 16 Pro、Pixel 9 Pro、Galaxy S25 Ultra、OnePlus 13、iPhone 14)以及把每个 App 接入共享评估存储的数据管线。