Каталог каналов Мои подборки Мои каналы Поиск постов Рекламные посты
Инструменты
Каталог TGAds Мониторинг Детальная статистика Анализ аудитории Бот аналитики
Полезная информация
Инструкция Telemetr Документация к API Чат Telemetr
Полезные сервисы

Не попадитесь на накрученные каналы! Узнайте, не накручивает ли канал просмотры или подписчиков Проверить канал на накрутку
Прикрепить Телеграм-аккаунт Прикрепить Телеграм-аккаунт

Телеграм канал «Клуб CDO»

Клуб CDO
2.7K
1.6K
88
58
8.1K
Сообщество профессионалов в области работы с данными и искуственным интеллектом
Подписчики
Всего
3 966
Сегодня
0
Просмотров на пост
Всего
890
ER
Общий
20.43%
Суточный
12%
Динамика публикаций
Telemetr - сервис глубокой аналитики
телеграм-каналов
Получите подробную информацию о каждом канале
Отберите самые эффективные каналы для
рекламных размещений, по приросту подписчиков,
ER, количеству просмотров на пост и другим метрикам
Анализируйте рекламные посты
и креативы
Узнайте какие посты лучше сработали,
а какие хуже, даже если их давно удалили
Оценивайте эффективность тематики и контента
Узнайте, какую тематику лучше не рекламировать
на канале, а какая зайдет на ура
Попробовать бесплатно
Показано 7 из 2 679 постов
Смотреть все посты
Пост от 23.06.2026 10:43
139
0
4
Буквально на прошлой неделе вышел интересный материал от CNews: рейтинг российских BI-инструментов.

Интересно, что набралось целых 16 решений. И не скажу, что тройка лидеров была очевидна, тут тоже есть неожиданности, так что очень рекомендую посмотреть и сделать свой вывод, благо в таблице есть все детали по аналитике сравнения.

Но главное в рейтинге не тройка лидеров, а ключевой тренд и фокус, который держат все производители: доступность (он же модный self-service BI). Аналитика без очереди к ИТ, дашборды без кода, спроси данные на естественном языке.

Рейтинг это хорошо показывает. Платформы сравнили по 130+ параметрам, и добрая половина критериев не про движок обработки данных, а про то, как обойтись без ИТ: готовые дашборды, обучение пользователей, преднастроенные интеграции. В тройке Yandex DataLens, PIX BI, Luxms BI. Всё крутится вокруг одного: смотри сам, считай сам, не жди айтишника.

У флагмана, DataLens, появился ИИ-агент Нейроаналитик на больших языковых моделях. К ноябрю его уже попробовали больше 1500 компаний, обещают минус 30% к нагрузке на аналитиков. Спросил голосом, получил график с выводами.

Но надо отметить, что агент работает с учётом прав доступа, настроенных под каждого пользователя. Поверх заданных наборов данных. Поверх архитектуры, где логика расчётов отделена от визуализации. LLM здесь ничего не отменяет. Она сидит на управляемой модели данных, которую кто-то сначала построил и которой кто-то управляет. Убери этот слой, и агенту нечего запрашивать правильно.

Поэтому получается, что self-service смещает фокус с разработки отчётов (тут теперь действительно все в разы легче и проще) на слой интеграции и очистки данных. Раньше очередь стояла за написанием запроса, теперь будет стоять за единым источником истины, согласованными определениями метрик и контролем доступа.

И ИИ-слой эту зависимость не ослабляет, а усиливает. Запрос на естественном языке поверх кривой модели данных это не пустой ответ. Это уверенно неправильный ответ, выданный быстрее, и без аналитика, который раньше его ловил. Чем сильнее опираешься на агента, тем строже обязана быть модель под ним.

Self-service и ИИ-агент не отменяют дата-инженерию, они поднимают на неё ставку. Кто навёл порядок в данных, тот и получит обещанную магию. Остальные получат быстрые красивые ошибки.

https://www.cnews.ru/reviews/preview_articles/2979896a1c832588550
🔥 2
Пост от 21.06.2026 19:25
82
0
6
Дайджест статей

📰 DCD: доменно-ориентированная архитектура для построения RAG-систем
🔗 https://habr.com/ru/companies/redmadrobot/articles/1049030/
💡 Вывод: Команда red_mad_robot опубликовала собственный архитектурный подход Domain–Collection–Document для RAG-систем — трёхуровневая иерархия знаний с LLM-маршрутизатором, последовательно сужающим пространство поиска от домена до документа. Ключевой тезис: качество ответов растёт не от усложнения модели, а от семантической организации базы знаний — при условии, что границы между доменами поддаются определению заранее. Открытый код на GitHub, датасет на HuggingFace.

📰 Внешняя память для LLM: как RAG дает моделям доступ к новым знаниям
🔗 https://habr.com/ru/companies/magnus-tech/articles/1046702/
💡 Вывод: Подробный разбор RAG от первых принципов: почему LLM галлюцинируют (параметрическая память конечна, RLHF усиливает склонность соглашаться), как устроен пайплайн индексирование → поиск → генерация, где RAG даёт слабину (многошаговые рассуждения, конфликт параметрической памяти с внешними данными, задержки реранжирования). Для CDO-аудитории ценнее не учебник, а вывод в конце: RAG — не панацея, выбор между промптингом, файнтюнингом и RAG определяется тем, что именно нужно изменить — знания модели или её поведение.

📰 Data Mesh: что это и почему концепция не подходит большинству компаний в России
🔗 https://habr.com/ru/articles/1049724/
💡 Вывод: Честный разбор от Qlever Solutions — Data Mesh это не архитектура хранения данных, а организационная трансформация, требующая децентрализованной культуры, продуктового мышления в бизнес-доменах и зрелых DevOps-практик. Большинство российских компаний пока строят DWH и выстраивают Data Governance — и это правильно: путь DWH → Lakehouse → Data Mesh эволюционный, а не выборочный. Data Mesh оправдан только после того, как централизованное DWH стало реальным узким местом.

📰 From ETL to Lakeflow: Shifting to Declarative Data Paradigm
🔗 https://dzone.com/articles/shifting-to-declarative-data-paradigm
💡 Вывод: Databricks Lakeflow переводит пайплайны с императивной логики (вы описываете шаги) на декларативную (вы описываете таблицу, движок сам строит граф зависимостей, масштабирование и линейку). Реальный выигрыш — не синтаксис, а устранение племенного знания: порядок выполнения, реранжирование, проверки качества и линейка перестают жить в головах конкретных инженеров. Стратегия миграции разумная: новые пайплайны → болезненные старые → ликвидация оркестратора.

📰 The Data Canary: How Netflix Validates Catalog Metadata
🔗 https://medium.com/netflix-techblog/the-data-canary-how-netflix-validates-catalog-metadata-18b699d58e36
💡 Вывод: Netflix построил аналог канарейки для деплоя данных — не кода. Выделенный оркестратор, постоянные baseline/canary кластеры, хаос-эксперимент с реальным продакшн-трафиком (0,2%), детектирование за 2,5–4 минуты. Ключевое методологическое решение: метрика Starts Per Second (фактические попытки воспроизведения) оказалась надёжнее latency и error rate — именно потому что отражает поведение пользователя, а не состояние сервиса. Данные заслуживают того же уровня валидации при деплое, что и код.
Пост от 18.06.2026 11:37
441
0
6
📣 Баллы больше не мотивируют. А что работает?

Стоимость привлечения клиента выросла в 2–3 раза. Open rate падает. Программа лояльности живет отдельно от маркетинга, маркетинг - отдельно от продаж.

25 июня разбираем, как это исправить вместе с экспертами из CleverData и Мастердата.

На вебинаре:
➡️ Почему CDP и система лояльности должны быть разными платформами;
➡️Как собрать единый профиль клиента из онлайн, офлайн и партнёрских данных;
🔗Механики, которые работают только при наличии CDP;
👏 Примеры Starbucks, Tesco, Sephora: что работает у лидеров рынка и какие практики можно применять уже сегодня у нас;
⏰ 11:00, онлайн, бесплатно

Ждем вас ➡️ Регистрация
Пост от 16.06.2026 19:36
262
0
3
👍 1
Пост от 15.06.2026 23:12
251
0
6
Дайджест статей

📰 База знаний для распределённых производств: как синхронизировать филиалы
🔗 https://habr.com/ru/companies/teamly/articles/1043664/
💡 Вывод: Локальная вики на каждой площадке не лечит рассинхронизацию знаний, а множит её: версии расходятся, обновления не доходят, администрирование съедает ресурс. Работает не ещё один портал, а единая точка входа плюс управленческое правило «новые регламенты публикуются только здесь». И формализовать стоит не всё подряд, а сценарии с высокой частотой и высокой ценой ошибки, где экономический эффект прямой.

📰 Как Data Fabric и HTAP превращают сырые данные в бизнес-события для мгновенной аналитики
🔗 https://habr.com/ru/companies/vk/articles/1044946/
💡 Вывод: Ускорение ночного ETL до почасового разрыв не закрывает: растёт стоимость инфраструктуры, а сырые события всё равно нужно обогащать смыслом в момент возникновения. Если бизнесу нужен ответ в день запуска продукта, а не на следующее утро, проблема архитектурная. Связка не заменяет DWH, а делит роли: HTAP держит оперативные 7–30 дней, DWH остаётся для истории и ML, Data Fabric обогащает и доставляет.

📰 Tarantool DataBase и Kafka: событийная архитектура без лишних слоёв
🔗 https://habr.com/ru/companies/vktech/articles/1045344/
💡 Вывод: Самописный сервис синхронизации, это скрытый постоянный налог: мониторинг, redelivery, риск потери и дублей, переделка при каждом изменении схемы. Аргумент за готовый CDC сводится к стоимости владения и time-to-market. Но читать его стоит честно: это не «удаление слоя интеграции», а замена своего слоя на вендорский, и выгода реальна там, где нет специфичных требований к ландшафту.

📰 «К нам едет ревизор», или Как не построить космические замки на бюджете сарая при внедрении DWH
🔗 https://habr.com/ru/companies/glowbyte/articles/1046548/
💡 Вывод: Состав артефактов предпроектного обследования определяется его целью, а не «лучшими практиками»: для решения о запуске нужна аргументированная презентация на 25–30 слайдов, для тендера — требования, архитектура, сайзинг и TCO на 3–5 лет. Позиция заказчика «вы эксперты, вам виднее» чаще означает не доверие, а попытку снять с себя ответственность за решения. И отдельно сильное: Agile, прекрасный для проектов развития, на greenfield-запуске DWH растягивает срок втрое.

📰 Как я собрал эталонный Data Engineering проект: ClickHouse, Kafka, Spark, dbt, Airflow и Superset за одну команду
🔗 https://habr.com/ru/articles/1047304/
💡 Вывод: Ценность проекта не в списке инструментов, он у всех одинаковый, а в операционной дисциплине, которая делает «одну команду деплоя» работающей: идемпотентность на каждом шаге, graceful degradation для необязательных стадий, честный список version-конфликтов. Разделение ответственности тоже по делу: dbt для SQL-трансформаций, Spark для того, что горизонтально масштабируется. Бонус для CROSSx-контекста: данные крипто, паттерны детекции аномалий рабочие.
1
Пост от 15.06.2026 12:23
362
0
6
чего и всем желаем :)
🔥 3
Пост от 14.06.2026 20:05
594
2
12
👍 5
Смотреть все посты