📰 RAG в enterprise: 70-80% проблем не в модели, а в данных
🔗 https://habr.com/ru/companies/alpinadigital/articles/1036196/
Из 12 000 «актуальных» документов после аудита осталось 3 800 — выбросили три четверти, и retrieval вырос кратно без единой строчки кода.
💡 Вывод: бюджет первого месяца RAG-проекта закладывать на аудит и чистку данных, а не на модель и железо; ранний индикатор гнилой базы — доля документов, не обновлявшихся больше года.
📰 «Особое мнение» по каждому SKU: три AI-модели вместо BI-правил
🔗 https://habr.com/ru/articles/1036774/
Rule-based вердикт («возвраты >15% → флаг») врёт тем сильнее, чем разнороднее рынок, и его заменили консилиумом из трёх LLM с арбитратором — но аномалии всё равно ловят правилами на голом SQL.
💡 Вывод: разводить детектирование (дёшево, правила, real-time) и интерпретацию (дорого, модели, батч) — не гонять дорогой консилиум там, где аномалию увидит SQL-детектор.
📰 Что такое DWH (КХД) и как работает корпоративное хранилище данных
🔗 https://habr.com/ru/articles/1037496/
Базовый, но системный разбор: трёхуровневая модель и LSA, Кимбалл vs Инмон vs Data Vault, ETL/ELT, отличия от БД и Data Lake, типовые провалы внедрения.
💡 Вывод: выбор методологии моделирования — это бизнес-решение про сроки и стоимость эволюции, а не техническое; без Data Governance хранилище превращается в «свалку данных» и нагрузку для ИТ, а не в актив.
📰 RAG для тех, кто разочаровался: почему retrieval ломается и как это починить
🔗 https://habr.com/ru/companies/otus/articles/1034386/
Слабое звено — не модель, а retrieval; четыре рычага (нарезка по структуре, гибрид вектор+BM25, reranking, eval dataset), каждый внедряется за день.
💡 Вывод: сначала собрать eval dataset (50–100 пар «вопрос → нужный чанк») — без него любая правка чанкинга или эмбеддингов это гадание, а не инженерия.
📰 Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы
🔗 https://habr.com/ru/companies/sminex_developer/articles/1037438/
Пошли в платформу, а не в «одного бота»: единый gateway (LiteLLM), наблюдаемость (Langfuse), RBAC/SSO. Тезис, к которому возвращаются: главный риск корпоративного AI — управляемость внедрения, а не качество модели.
💡 Вывод: gateway + observability + доступы строить ДО кейсов; экономика платформы = экономика кейса — первый ассистент дорогой, пятый дешёвый, а «зоопарк ботов» с отдельными ключами это техдолг с первого дня.
📰 From Data Movement to Local Intelligence: The Shift
🔗 https://dzone.com/articles/from-data-movement-to-local-intelligence-the-shift
Сдвиг от централизованного AI (данные едут к модели) к федеративному (модель едет к данным, наружу уходят только апдейты). Меняется и природа контроля: вопрос «кто имеет доступ к данным» становится вопросом «что AI разрешено с ними делать».
💡 Вывод: там, где данные распределены, чувствительны и зажаты регуляторикой (банки, healthcare, telecom), федерация снимает компромисс «данные vs комплаенс»; governance смещается с доступа к данным на права действий модели.
Наконец, после полугодового перерыва, состоялся долгожданный полёт IFT-12 «Старшипа» в конфигурации B19/S39.
Это полностью переработанная машина со множеством улучшений. Новые двигатели, новая система разделения, новая тепллозащита, новый стартовый стол, почти всё новое и переработанное. Весь полёт транслировался в качестве 4K через «Старлинк».
Большинство этапов полёта были выполнены штатно:
• Прежде всего было заметно, насколько энергичнее носитель стартовал по сравнению с предыдущими миссиями. Тяговооружённость намного выросла. Новые двигатели Raptor V3 просто невероятны!
• Корабль вышел на незамкнутую орбиту, открыл грузовой отсек и успешно отработал выгрузку 22 тяжёлых «Старлинков» нового поколения. Впервые процесс выгрузки транслировался со стороны выгружаемых спутников.
• Теплозащита корабля полностью выдержала режим входа в плотные слои атмосферы без признаков проплавления, как это бывало в некоторых предыдущих полётах.
Основной целью полёта был стресс-тест новой версии, система специально подвергалась чрезмерным нагрузкам, которых в нормальном, стандартом запуске не было бы.
Из проблем: в данном полёте были убраны междвигательная защита и система пожаротушения. Именно из-за этого не получился возвратный манёвр ускорителя. У одного из двигателей после резкого разделения ступеней произошёл «хлопок с задымлением», что привело к вырубанию соседних двигателей, после чего ускоритель дальше уже улетел в океан по баллистической траектории.
Несмотря на отказы отдельных систем, имитация мягкой посадки точно в расчётную точку в Индийском океане прошла успешно. Это доказывает, что система довольно живучая и устойчивая к отказам.
Касания вместо рассылок: как выстроить коммуникацию, которая продает? Узнаем 28 мая в 11:00 на вебинаре
Куки уходят в прошлое, почтовые ящики забиты под завязку, а обращение по имени в начале письма давно никого не впечатляет. Компании, которые продолжают работать по старым схемам, замечают: открываемость падает📉, отписки растут📈, домены горят🔥.
Разберем, что приходит на смену — с данными и примерами.
Спикеры: Овчинникова А. (бизнес-консультант CleverData) и Сибгатуллин Р. (эксперт по внедрению CDP в Выберу.ру)
45 минут. Бесплатно, но требуется регистрация ⬇️⬇️⬇️
Читаю сейчас Apollo 11: The Inside Story Дэвида Уайтхауса. Книга про лунную программу, но зацепила меня глава не про американцев, а про один советский инженерный выбор 1957 года - лучшую иллюстрацию принципа better done than perfect, которую я встречал.
Был проект «Объект Д». Первый настоящий советский спутник: тяжёлый, ~1300 кг, набитый приборами для измерения космических лучей, магнитных полей, микрометеоритов. Правильный, продуманный, feature-complete аппарат к Международному геофизическому году. Всё как надо.
И он не успевал. Приборы сырые, конструкция переусложнена, сроки плыли. Классика жанра: чем правильнее ты хочешь сделать первую версию, тем дольше она не выходит в свет.
Королёв понял простую вещь. Американцы со своим Vanguard вот-вот запустятся первыми, и тогда весь твой научный шедевр уже никому не интересен. Первым можно быть только один раз. И он принял решение, которое стоит держать в голове любому, кто строит продукт. Отложить сложный «Объект Д». Собрать вместо него ПС-1 - «Простейший Спутник». Полированный шар 58 см, четыре антенны, радиопередатчик. Вся функция - пищать.
4 октября 1957 этот шар вышел на орбиту и переписал XX век. А «Объект Д», тот самый правильный аппарат, полетел только в мае 1958 - под именем Sputnik 3. Полноценный научный успех. Который не помнит никто.
Вот и вся суть в двух датах. Минимальная штука, которая делает одну вещь и доказывает главное, бьёт максимальную, которая делает всё и опаздывает. Не потому что простота милее. А потому что окно «быть первым» закрывается по календарю, а не по твоей готовности.
Ловлю себя на этом постоянно - желание дособрать, дошлифовать, докинуть ещё один модуль перед запуском. «Объект Д» всегда выглядит солиднее пищащего шара. Хотя, конечно, Клод тут очень помогает 🙂
Проблема в том, что историю пишет тот, кто уже на орбите.
Ссылка на книгу: https://www.goodreads.com/book/show/43170788-apollo-11