OpenAI добавила новую функцию, с помощью которой можно тестировать модели ещё проще, чем прежде

Работает это таким образом:
1) Заходим в логи.
2) Нажимаем кнопочку «Quick Eval», запускается встроенный «грейдер».
3) «Грейдер» начинает автоматически прогонять запросы через выбранные модели (например: GPT-5 или GPT o4-mini) с разным «reasoning effort».
4) Интерфейс показывает ответы бок о бок, помогает быстро выбрать, какая модель и какой режим лучше подходят для текущей задачи.
Может быть полезно для подбора модели, легко экспериментируя с качеством рассуждения.
Ну а совсем скоро мы разберем более детально, что из себя представляет «reasoning effort» на самом деле и как его правильно использовать с другими техниками, недавно опубликованными openAI.
Не забудь подписаться, чтобы прочитать среди первых.