← Qui pilote le benchmark Macro Tracker Lab ?
Senior ML Engineer
Dr. Jordan Oliver
Toronto, CA
Jordan besitzt das Modell-Evaluations-Harness: wie die Vorhersagen jeder App gegen gramm-gewogene Ground-Truth bewertet werden, ohne korrekte Top-3-Antworten unfair zu bestrafen.