Codex пише е2е тести під нову агентну селестію, перевіряє що працює і виявляє що не працює
просто магія якась
При чому що мене вражає, це те що це реальні (на тестовому телеграм сервері) тести, з реальних акаунтів, шляхом python та js бібліотек
кодекс фактично керує акаунтом, приводить базу даних в потрібний стан — наприклад сам виявив, що недостатньо балансу — і додав в тест поповнення балансу до того як виконувати дію