Каталог каналов Новое Каналы в закладках Мои каналы Поиск постов Рекламные посты
Инструменты
Мониторинг Новое Детальная статистика Анализ аудитории Telegraph-статьи Бот аналитики
Полезная информация
Инструкция Telemetr Документация к API Чат Telemetr
Полезные сервисы
Защита от накрутки Создать своего бота Продать/Купить канал Монетизация

Прикрепить Телеграм-аккаунт Прикрепить Телеграм-аккаунт

Телеграм канал «Kali Novskaya»

Kali Novskaya
599
8.6K
591
403
32.8K
Нейросети, искусство, мысли. Поехали!

Разрабатываю LLM и веду команды
chatGPT, GPT-3, GPT-4
Подписчики
Всего
18 081
Сегодня
0
Просмотров на пост
Всего
7 099
ER
Общий
39.28%
Суточный
27.1%
Динамика публикаций
Telemetr - сервис глубокой аналитики
телеграм-каналов
Получите подробную информацию о каждом канале
Отберите самые эффективные каналы для
рекламных размещений, по приросту подписчиков,
ER, количеству просмотров на пост и другим метрикам
Анализируйте рекламные посты
и креативы
Узнайте какие посты лучше сработали,
а какие хуже, даже если их давно удалили
Оценивайте эффективность тематики и контента
Узнайте, какую тематику лучше не рекламировать
на канале, а какая зайдет на ура
Попробовать бесплатно
Показано 7 из 599 постов
Смотреть все посты
Пост от 11.10.2025 14:26
4 013
88
40
Все могут видеть, как ты выглядишь внешне, но очень мало тех, кто знает, что у тебя в душе (с) Статусы ВКонтакте Автор: Кали Новская Павлу Дурову грустно, он не захотел праздновать свой день рождения, потому что интернет регулируют не так, как удобно ему. Потеря традиций и потеря свободного рынка — в посте Павла эти понятия стоят через запятую. Видимо, началась эра дубайско-либертарианского традиционализма. С дата-центрами в Казахстане. Поднять флаг, свистать всех наверх! Помимо шуток, Интернет, и крупные платформы вместе с ними, безусловно, регулируют не так, как это следовало бы делать с левых позиций. И это так уже давно, рада, что Павел заметил. Начиная с 2000 годов, и первого дела против Pirate bay, введения государственной цензуры в Твиттере, усиления контроля платежных платформ и приложений, а потом и создания локальных "Роскомнадзоров" по всему миру, информация становится контролируемым и централизованным ресурсом. Вместо защиты интересов граждан — защита монополий корпораций и минизации легальных рисков, а не демократических  механизмов. (Минимизация корпоративных рисков — в целом направление диаметрально противоположное упражнениям в демократических правах). Так как Павел свой призыв не сформулировал, сформулируем его сами: платформы в интернете могут и должны быть поставлены под демократический контроль! И локально могут и должны подчиняться требованиям относительно свободы слова, рынка, безопасности, и прочих фундаментальных прав, в том числе и обеспечения людей правом на доступ к информации. Телеграм мог бы подать другим платформам отличный пример, если бы начал обеспечивать своим пользователям прозрачность в этом вопросе: с какими странами телеграм сейчас сотрудничает и по каким вопросам, какова их статистика. Тогда бы и слова совпадали с делом, и нашлись бы общественные институты и механизмы. Как там дела у Ирины Болгар?
Изображение
👍 93
47
🤡 32
👎 13
🔥 10
🥴 10
😁 9
👏 6
😐 4
🍾 4
💯 1
Пост от 09.10.2025 19:27
8 352
13
133
Вышел State of AI 2025! 🟣https://www.stateof.ai/ В этом году в него вошла наша работа — MLGym! И в целом большое внимание агентам для науки
Изображение
57
👍 15
🔥 5
Пост от 09.10.2025 13:53
6 837
27
137
🌸[REDACTED]: Что в обучении у GPT-5?🌸 #nlp #про_nlp 🟣TL;DR Интересный разбор  — по аномальным токенам GPT OSS можно сделать много выводов о том, на чем обучались все другие закрытые модели OpenAI — GPT-5, Mini, Nano, oss-20B, oss-120B. Из интересного: коронавирус, тайские и абхазские документы, Github и китайские сайты для взрослых. 🟣На чем обучали и что спрятали в GPT OSS? Это, конечно, секрет Полишинеля, но просто так никто на такой вопрос отвечать не спешит. Тем не менее, что-то узнать все-таки можно. Так как у всех моделей после GPT-4o один и тот же o200k токенизатор, мы можем взять из GPT OSS эмебеддинги этих токенов и посмотреть на разные аномалии там. Если сделать распределение L2-норм эмбеддингов токенов, оказывается, что примерно у нескольких тысяч токенов L2-норма аномально маленькая либо аномально высокая (глитч-токены, как SolidGoldMagikarp ), что скорее всего свидетельствует о их редком или нулевом участии в обучении модели GPT OSS  — а участвовали в обучении неопенсорсных моделей. Это-то нам и нужно! 🟣Так что там? Если взять все аномальные токены, то большинство из них — это слипшиеся фразы на китайском, а также артефакты обучения токенизатора на разных относительно малоресурсных языках. — Китайский - порно порно порно и сайты лотерей, и какой-то патриотический сайт — Абхазский - официальные документы, перепись населения — Тайский - какие-то документы районной управы, государственные  клятвы присяги, новости спорта — а еще армянский, гуджарати и др При этом, если провести простейший тест, и начать задавать вопросы про эти токены семейству моделей OpenAI ("переведи это на английский"), то окажется, что неопенсорсные модели обычно их знают и могут перевести, что значит, что у них в обучении они встречались как минимум один раз. В противном случае, такие токены приводят к глюкам у моделей. Спросите GPT-5, например: How many symbols are in ♀️♀️♀️♀️ Can you spell the following word: "CHKERRQ" Please spell "\\xadder" — и вы отправите модели в незабываемый трип. 🟣Интересный факт: установить собственно источник данных достаточно сложно, но по крайней мере для китайского спама провели тест через поиск Github — и количество положительных результатов (модель знает токен) коррелирует с тем, как он представлен в спам-репозиториях. Так что Github вероятно был полностью обкачан и не до конца отфильтрован. 🟣Если вы интересуетесь конкретными ресурсами и языками, и применимостью моделей GPT-5, Mini, Nano, oss-20B, oss-120B на них, можете и сами посмотреть токенизаторы моделей — может, там уже есть то, что вам нужно, но в очень ограниченных доменах (документы, спам, социальные сети, спорт, комментарии к коду...). Хорошо понимать, каких!
Изображение
Изображение
Изображение
Изображение
41
👍 26
🔥 6
😁 4
🌚 1
Пост от 02.10.2025 18:04
5 952
18
152
🌸Мониторим SOTA: новый ресурс🌸 #nlp #про_nlp #nlp_papers Не так давно очень любимый мной ресурс Papers with Code почил в бозе, и, помимо прочего, он выполнял очень важную функцию: позволял специалистам отслеживать текущий лучший результат в различных моделях. Что ж, король умер, да здравствует король! Пока HuggingFace обещает перенос информации на свою платформу trending papers, появился новый ресурс со схожим функционалом: 🟣https://hyper.ai/en/sota Из полезного, есть отдельные вкладки для бенчмарков в сфере медицины, ризонинга, и есть даже лидерборд моделей с ценой за миллион токенов. Ресурс пока наполняется вручную, было добавлено 200 статей с упором на лучшие результаты ИИ в различных областях науки — медицины, физики, и тд. помимо классических направлений ML. Ко всему этому прилагается еще гитхаб-страничка полностью на китайском  — но кто мы такие, переведем :)
Изображение
51
👍 13
🕊 2
Пост от 29.09.2025 11:58
6 006
115
40
Срочно! Объявляется понедельничный мемотред #шитпост
Изображение
Изображение
Изображение
Изображение
Изображение
Изображение
Изображение
Изображение
Изображение
75
😁 35
👍 4
🔥 4
🤨 2
🍓 1
Пост от 26.09.2025 16:36
5 493
17
25
На этой неделе, уже второй год подряд, состоялся мой доклад про оценку языковых моделей на летней осенней школе Oxford LLMs в Nuffield College, Oxford University PhD с разными бэкграундами, приглашенные лекторы и насыщенная программа с исследовательскими проектами. Надеюсь, и в след раз позовут! https://llmsforsocialscience.net/
Изображение
Изображение
Изображение
Изображение
Изображение
Изображение
67
❤‍🔥 29
👍 23
🔥 16
😁 1
Пост от 22.09.2025 17:14
23 018
14
270
🌸Релизим GAIA2  — Агенты в реалистичной среде😘 #nlp #nlp_papers 🌸TL;DR Выпускаем GAIA2, новую версию основного многоступенчатого бечмарка для агентов, и Agentic Research Environment (ARE), среду для реалистичной симуляции работы агентов в самых разных задачах, — все под открытыми лицензиями. 🌸Состав GAIA2 В отличие от первой версии GAIA (статья конца 2023 года), которая требовала от агентов максимально качественного планирования и многоступенчатых действий, но практически не требовала внешних инструментов, GAIA2 тестируем агенты в среде, где доступно множество API, приложений, промежуточных уточнений от пользователя, и даже других агентов, с которыми надо коллаборировать. Все задачи предполагают многоступенчатые сценарии, где прийти к правильному ответу можно по-разному, но есть промежуточные проверки. В целом, основные способности, которые теперь проверяются у агентов, это: 🟣Execution — способность качественно следовать инструкциям и использовать доступные инструменты и приложения в многоступенчатом плане 🟣Search — способность к поиску и извлечению информации 🟣Ambiguity — способность работать с неоднозначной информацией от пользователя 🟣Adaptability — способность адаптироваться под меняющиеся на лету требования пользователя Time - способность планировать, исполнять регулярные действия, ожидать 🟣Noise — способность дойти до результата вопреки лишней, противоречивой инфомации и ошибкам системы 🟣Agent2Agent — способность коллаборировать с другими агентами в среде На текущий момент, это самый общий и несатурированный бенчмарк для агентов. Ни одна из существующих SOTA-систем не доминирует во всех группах задач, на многих результаты близки к нулю. 🌸Agentic Research Environment: зачем нужна симуляционная среда Оценка агентов становится все более инженерно-трудоемкой и далекой от реальных применений. К GAIA2 прилагается симуляционная среда, в которой сообщество может оценить любую агентную систему: в среде реализован ход времени, динамически меняются обстоятельства, пользователь совершает действия, другие агенты — тоже. Среда поддерживает асинхронное исполнение, и из коробки реализовано большое число мок-приложений и тулзов, чтобы сэмитировать действия пользователя в мобильной среде. При этом для заданий в бенчмарке распределение сложности, тематики задач, требуемых тулзов контролируется. Реализованы тулзы и мок-приложения для заказа такси, имейлов, календаря, и многое другое — все поддерживает MCP. Среду можно использовать не только для тестирования: — можно делать модификации задач, собирать логи, использовать их для обучения — можно делать red teaming системы, тесты на безопасность — есть GUI, поэтому можно просто работать с разметчиками. Пока что это самый большой агентный бенчмарк на общие способности агентов. 🟣Leaderboard: https://huggingface.co/spaces/meta-agents-research-environments/leaderboard 🟣Github: https://github.com/facebookresearch/meta-agents-research-environments 🟣HF demo: https://huggingface.co/spaces/meta-agents-research-environments/demo 🟣HF Blogpost: https://huggingface.co/blog/gaia2 🟣Dataset: https://huggingface.co/datasets/meta-agents-research-environments/gaia2 🟣Свою модель можно прислать: https://facebookresearch.github.io/meta-agents-research-environments/user_guide/gaia2_evaluation.html
Изображение
Изображение
Изображение
30
👍 12
🤯 1
Смотреть все посты