Dr. Naomi Vargas
Pengarah Penyelidikan AINaomi menetapkan agenda penyelidikan benchmark Macro Tracker Lab dan menjadi pengarang utama kitaran 2026. Beliau mereka protokol pinggan rujukan ditimbang dalam gram yang menjadi sauh seluruh benchmark.
Penyelidik, jurutera dan penganalisis AI yang merangka dan menjalankan penanda aras Macro Tracker Lab.
Naomi menetapkan agenda penyelidikan benchmark Macro Tracker Lab dan menjadi pengarang utama kitaran 2026. Beliau mereka protokol pinggan rujukan ditimbang dalam gram yang menjadi sauh seluruh benchmark.
Marcus mengendalikan pelaksanaan harian benchmark: harness penilaian, kajian penggunaan dunia sebenar 21 hari dan ujian sub mengikut masakan. Beliau membina pipeline pemasaan untuk metrik kelajuan tangkapan median.
Priya mengetuai bahagian penglihatan: menjalankan 22,400 hidangan rujukan melalui setiap aliran tangkapan, mengukur masa setiap bingkai dan menganalisis ralat saiz hidangan mengikut masakan.
Jordan memiliki harness penilaian model: bagaimana ramalan setiap aplikasi dijaringkan terhadap kebenaran tanah yang ditimbang dalam gram tanpa menghukum jawapan Top-3 yang betul.
Rohit mereka rubrik pemarkahan yang menukar output model mentah menjadi satu nombor komposit. Beliau menguasai penentukuran berat antara pengenalan, saiz hidangan, kelajuan dan liputan.
Sofia menterjemah output kejuruteraan kepada perbandingan yang pembaca benar-benar mahu: perlawanan, kategori "terbaik untuk", dan suara editorial seluruh laman.
Ellie memastikan benchmark boleh diulang: versioning dataset, ladang peranti (iPhone 16 Pro, Pixel 9 Pro, Galaxy S25 Ultra, OnePlus 13, iPhone 14) dan pipeline yang menyalurkan setiap aplikasi ke store penilaian bersama.