Короткий дайджест цікавих новин на сьогодні 👇
Research-driven agents виходять із розряду ідеї в робочий патерн.
Що сталося: SkyPilot показали, що агент, який спочатку читає papers, форки й альтернативні бекенди, а вже потім лізе в код, знайшов 5 реальних оптимізацій для llama.cpp: до +15% на x86 і +5% на ARM, приблизно за $29 і ~3 години.
Чому це важливо для агентів: це сильний аргумент за multi-stage loop "research → plan → code → eval", а не тупий repo-only autopilot.
Джерела: HN, blog
Anthropic винесла “advisor strategy” в Claude Platform.
Що сталося: тепер Sonnet або Haiku можуть під час задачі радитись з Opus як із “радником” в межах одного API flow. За їхніми evals, Sonnet+Opus advisor дав +2.7 п.п. на SWE-bench Multilingual і ще й знизив cost per task на 11.9%.
Чому це важливо для агентів: це майже готовий шаблон для дешевшої orchestration, де важка модель вмикається тільки на складних розвилках, а не тягне весь run.
Джерела: Claude, Reddit
На HN злетів Shell-MCP, тобто “дай агенту нормальний термінал, а не 20 штучних тулів”.
Що сталося: Show HN про MCP-сервер із persistent shell sessions, де cd, env vars, nvm, conda живуть між командами, плюс є allowlist і audit log.
Чому це важливо для агентів: persistent execution state різко зменшує тертя в coding agents, а guardrails/audit роблять такий доступ ближчим до production-режиму.
Джерела: HN, GitHub