Дайджест статей
📰 Как я проектирую OLTP-БД с нуля: принципы, trade-off'ы и архитектурные решения
🔗 https://habr.com/ru/articles/1014098/
💡 Вывод: Инженер пишет собственный OLTP-движок на Rust — с UNDO-log MVCC (как у InnoDB, Oracle, MSSQL), unified storage на БД и fail-closed поведением вместо тихой деградации. Главный тезис: если система под нагрузкой молчит и тянет — она врёт. Предсказуемый отказ с внятным SQLSTATE лучше, чем иллюзия, что «ещё дотянет». Для CDO: пример архитектурных решений на уровне storage engine, которые стоит знать при оценке собственных data-платформ.
📰 Как ML изменит бизнес в 2026 году: прогноз Selectel, GlowByte и Data Sapience
🔗 https://habr.com/ru/companies/selectel/articles/1013862/
💡 Вывод: Маркетинговый по форме, но полезный по структуре обзор корпоративного AI. Зерно: компании переходят от хаотичного использования LLM к централизованным корпоративным порталам с RBAC, квотами и биллингом. Shadow AI становится реальным драйвером создания внутренних GenAI-сред — не из любви к технологиям, а из страха потери контроля над корпоративными данными. AI-агенты в продакшн — это микросервис, которому нужен жизненный цикл, версионирование и CI/CD, а не просто промпт в блокноте.
📰 Как мы подружили DataLens и OpenMetadata: архитектура, код и подводные камни
🔗 https://habr.com/ru/companies/magnit/articles/1015708/
💡 Вывод: Команда DWH Magnit написала ingestion-коннектор DataLens → OpenMetadata с нуля и выложила в открытый доступ. Практический кейс: BI-объекты (дашборды, чарты, датасеты) вытащены в общий граф метаданных с lineage-цепочками. Главный урок — ingestion на реальном объёме немедленно упирается в rate limits и scope management, поэтому operational-параметры (задержки, ретраи, фильтрация коллекций) нужно закладывать в коннектор сразу, не после первого запуска на продовом контуре.
📰 Case for Self-Healing Data Observability in Converged Architectures
🔗 https://moderndata101.substack.com/p/self-healing-data-observability-in
💡 Вывод: Аргумент в пользу ARI-цикла (Anticipate → Remediate → Immunize) как архитектурного слоя качества данных, а не инструментального. Основная мысль: конвергированные платформы убрали швы между системами, но оставили observability в парадигме «оповестить человека» — это незаконченная архитектура. Самовосстанавливающаяся платформа не исключает инженера, а меняет его роль: от дежурного пожарного к проектировщику иммунной системы. Граница «что платформа решает сама, а что эскалирует» — это архитектурное решение, а не настройка порогов.
📰 Reference Data Management по-русски: что мы называем НСИ и почему это не всегда RDM
🔗 https://habr.com/ru/companies/datasapience/articles/1012404/
💡 Вывод: Честная разборка терминологии: российское «НСИ» на практике = RDM + часть MDM + немного DQ — исторически потому, что отдельных систем не было, и всё сваливали в одну. Для CDO: смешение задач — это не культурная особенность, а архитектурный риск. Один инструмент «на всё» хорошо звучит на слайде и плохо работает в эксплуатации. Продукт, который претендует закрыть RDM, MDM и DQ одновременно, — кандидат на идиотский индекс.
📰 How Long Until We Call AI Agents Data Products
🔗 https://moderndata101.substack.com/p/data-products-as-ai-agents
💡 Вывод: AI-агент в продакшне соответствует всем критериям data product — пользователи, контракты качества, жизненный цикл, обратная связь. Большинство команд запускают агентов как эксперименты и удивляются, почему они деградируют. Обсервабилити ≠ логирование: каждый retry — это измеримое трение, каждый брошенный диалог — невидимый отток. Единственная работающая обратная связь — ручная аннотация разговоров с последующим маппингом паттернов на тикеты. Не дашборды — решения.