У програмах, згенерованих штучним інтелектом, багато помилок безпеки — дослідження
Застосунки, створені за допомогою вайб-кодування, де розробник надає агенту штучного інтелекту повну свободу дій, ймовірно, будуть небезпечними, оскільки такі інструменти, як Claude Code та Cursor, містять базові логічні помилки. Це стверджує Орі Девід, дослідник з компанії Tenzai.
В якості експерименту він створив три різні програми, використовуючи однакові текстові запити для п’ятьох агентів, включаючи Cursor, Claude Code, Codex, Replit і Devin, використовуючи ті LLM-моделі, які вони пропонують за замовчуванням. Дослідник виявив приблизно однакову кількість вразливостей у кожній реалізації, при цьому Claude, Devin та Codex генерували критичні баги. Загалом було знайдено 69 вразливостей у 15 додатках.
Хоча агенти добре реагували на певні відомі класи помилок, такі як SQL-ін’єкції та міжсайтовий скриптинг, вони погано справлялися з логікою... Читати далі на Highload 👉
Telegram Chat | Facebook | LinkedIn | Website