avatar
Natural Language Processing & Text Mining
@nlp_ru
25.11.2025 11:02
Ноябрь — месяц One Day Offer в GigaChat и Kandinsky ??

В ноябре команды двух топовых IT-продуктов Сбера планируют обрести новых классных коллег — DL Engineers и Researchers, чтобы вместе работать над GigaChat и Kandinsky: развивать, обучать и дообучать модели.

Смотрите расписание One Day Offer и не упустите шанс присоединиться к крупнейшему AI-комьюнити. Целых восемь мероприятий, чтобы изменить свою карьеру и жизнь — выбирайте то, что подходит под навыки и цели, и регистрируйтесь!
avatar
Natural Language Processing & Text Mining
@nlp_ru
24.11.2025 23:02
Natural Language Processing & Text Mining Привет, друзья! �� Изучение Natural Language Processing (NLP) может показаться блужданием в лесу: от простых регулярных выражений до гигантских LLM вроде GPT-4. Чтобы вы не потерялись, мы собрали самые авторитетные источники, которые помогут построить прочный фундамент. Сохраняйте себе в «Избранное»! ⭐️ �� Книги (Theory & Practice) На английском (The Gold Standard): 1. Speech and Language Processing (Dan Jurafsky & James H. Martin) Эта книга — Библия NLP. Покрывает всё — от n-грамм до трансформеров. 3-е издание доступно бесплатно на сайте стэнфордского профессора (ищите draft). Читать обязательно для глубокого понимания! 2. Natural Language Processing with Transformers (Lewis Tunstall et al.) Лучшая практическая книга по современному NLP. Как использовать библиотеку Hugging Face для решения реальных задач. Написана самими разработчиками HF. На русском: 1. «Глубокое обучение» (С. Николенко, А. Кадурин, Е. Архангельская) Отличная база по нейросетям в целом, с очень качественными главами, посвященными обработке текста (word2vec, RNN, LSTM). 2. «Обработка естественного языка с Python» (Пти, Бэрд, Лопер) Перевод классической книги по библиотеке NLTK. Немного устарела в плане нейросетей, но идеальна для понимания классической лингвистической обработки (токенизация, стемминг, лемматизация). �� Курсы (Video & Interactive) 1. Stanford CS224n: Natural Language Processing with Deep Learning ���� Уровень: Hardcore. Это легендарный курс Кристофера Мэннинга. Если вы хотите понимать математику, стоящую за векторами и трансформерами, вам сюда. Лекции есть на YouTube. 2. NLP Course for You (Lena Voita) ����/���� Уровень: Средний/Продвинутый. Потрясающий интерактивный учебник-блог от исследователя из Yandex Research/Facebook AI. Пожалуй, лучшее объяснение механизма Attention и Трансформеров в интернете. 3. Deep Learning School (DLS) от МФТИ ���� Уровень: С нуля. У них есть трек по NLP. Отлично объясняют базу на русском языке с домашками и практикой. Ищите записи на YouTube или курсы на Stepik. 4. Hugging Face Course ���� Уровень: Практический. Бесплатный курс от создателей главной NLP-библиотеки мира. Максимум кода, минимум скучной теории. Идеально для быстрого старта. Совет от нашего сообщества: Начните с курса DLS или Hugging Face, параллельно подглядывая в книгу Jurafsky за теоретическими деталями. Ну а вакансии на тему всегда есть на канале нашего сообщества: @datasciencejobs #NLP #Books #Education #Книги #Образование #Практика #LanguageProcessing #DL
avatar
Natural Language Processing & Text Mining
@nlp_ru
25.11.2025 01:02
Привет, друзья! ��

Изучение Natural Language Processing (NLP) может показаться блужданием в лесу: от простых регулярных выражений до гигантских LLM вроде GPT-4. Чтобы вы не потерялись, мы собрали самые авторитетные источники, которые помогут построить прочный фундамент.
Сохраняйте себе в «Избранное»! ⭐️

�� Книги (Theory & Practice)

На английском (The Gold Standard):
1. Speech and Language Processing (Dan Jurafsky & James H. Martin)
Эта книга — Библия NLP. Покрывает всё — от n-грамм до трансформеров.
3-е издание доступно бесплатно на сайте стэнфордского профессора (ищите draft). Читать обязательно для глубокого понимания!

2. Natural Language Processing with Transformers (Lewis Tunstall et al.)

Лучшая практическая книга по современному NLP. Как использовать библиотеку Hugging Face для решения реальных задач. Написана самими разработчиками HF.

На русском:
1. «Глубокое обучение» (С. Николенко, А. Кадурин, Е. Архангельская)
Отличная база по нейросетям в целом, с очень качественными главами, посвященными обработке текста (word2vec, RNN, LSTM).

2. «Обработка естественного языка с Python» (Пти, Бэрд, Лопер)
Перевод классической книги по библиотеке NLTK. Немного устарела в плане нейросетей, но идеальна для понимания классической лингвистической обработки (токенизация, стемминг, лемматизация).

�� Курсы (Video & Interactive)

1. Stanford CS224n: Natural Language Processing with Deep Learning ����
Уровень: Hardcore. Это легендарный курс Кристофера Мэннинга. Если вы хотите понимать математику, стоящую за векторами и трансформерами, вам сюда. Лекции есть на YouTube.

2. NLP Course for You (Lena Voita) ����/����
Уровень: Средний/Продвинутый. Потрясающий интерактивный учебник-блог от исследователя из Yandex Research/Facebook AI. Пожалуй, лучшее объяснение механизма Attention и Трансформеров в интернете.

3. Deep Learning School (DLS) от МФТИ ����
Уровень: С нуля. У них есть трек по NLP. Отлично объясняют базу на русском языке с домашками и практикой. Ищите записи на YouTube или курсы на Stepik.

4. Hugging Face Course ����
Уровень: Практический. Бесплатный курс от создателей главной NLP-библиотеки мира. Максимум кода, минимум скучной теории. Идеально для быстрого старта.

Совет от нашего сообщества: Начните с курса DLS или Hugging Face, параллельно подглядывая в книгу Jurafsky за теоретическими деталями.
Ну а вакансии на тему всегда есть на канале нашего сообщества: @datasciencejobs

#NLP #Books #Education #Книги #Образование #Практика #LanguageProcessing #DL
2
🔥 2
avatar
Natural Language Processing & Text Mining
@nlp_ru
14.10.2025 21:05
Привет, друзья! Очень просим вашей помощи ��

Проводим CustDev, чтобы сделать продукт лучше. Это совсем недолго — < 5 минут.

Нам важен каждый голос: ваши ответы напрямую повлияют на развитие продукта!

Пожалуйста, пройдите форму: https://forms.yandex.ru/u/68ebbf3484227c85f6e51401
avatar
Natural Language Processing & Text Mining
@nlp_ru
12.09.2025 12:02
Твоя карьера после One Day Offer для Senior ML-разработчиков — 10/10 без всяких но!

Стань частью команды GigaCode, займись развитием AI-ассистента и работай с большими языковыми моделями — а плюсом получи крутую команду, выгодные бонусы и стабильную работу.

Встречаемся сначала на онлайн-секцию с кодом с 10 по 19 сентября, а затем на RND день 24 сентября — от тебя нужна только регистрация по ссылке и желание изменить свою карьеру!
avatar
Natural Language Processing & Text Mining
@nlp_ru
14.08.2025 11:13
1
avatar
Natural Language Processing & Text Mining
@nlp_ru
13.07.2025 00:16
avatar
Natural Language Processing & Text Mining
@nlp_ru
13.07.2025 00:11
Всем привет!

Кто знает хорошую нецензурированная ллмка? В идеале на русском
6
avatar
Natural Language Processing & Text Mining
@nlp_ru
28.05.2025 02:02
Natural Language Processing & Text Mining Привет! Мы - мастерская анализа текстовых данных, также известная как ТекстАн, и мы рады сообщить, что в 2025 году мы проводимся с 2 по 17 июля в рамках Летней школы. Вне зависимости от того, были ли вы на ЛШ уже или нет, у вас могут быть вопросы по поводу того, что из себя представляет именно наша мастерская, поэтому вот ответы на самые, возможно, частотные вопросы. Кто мы и откуда? Люди, делающие эту мастерскую, в основном либо из НИУ ВШЭ в Москве, либо из Европейского университета в Питере. Мы уже проводили такую мастерскую и ранее, и в этом году программа будет схожей, но, конечно же, с некоторыми изменениями относительно прошлых лет. Сама Летняя школа существует уже намного больше и рассказывать про неё намного сложней, поэтому почитать про неё можно здесь. Как проходит мастерская? Главный вопрос даже не &quot;как&quot;, а &quot;где&quot;. В лесу. Онлайн-версии не планируется. Летняя школа проводится на турбазе в Тверской области: жить планируется в палатках, а учиться - в деревянных домиках. Интернет есть, но с перебоями. Душ по расписанию, еда из общего кана, проверки МЧС за счёт заведения. Когда примерно будет проходить мастерская? Программа будет проходить с 2 по 17 июля, где второго будет въезд, а семнадцатого - выезд. Программа рассчитана на две недели (дальше в лесу уже становится трудновато жить без чистой одежды) Какая примерно программа? В целом тематика будет вращаться вокруг автоматической обработки естественного языка: языковые модели, визуализация, анализ тональности и извлечение именованных сущностей, и, конечно же, старые добрые машобуч с нейросетями (без этого сложно понять, как работают наши инструменты). Более подробную программу мы покажем позже. Сколько это стоит? Должны предупредить - это не совсем бесплатно. Летняя школа живёт на добровольные пожертвования участников, и минимальная рекомендуемая сумма пожертвований - 800 рублей в день. Получается около 12000 за все две недели. Как по мне, стоит того. Как проходит отбор? Отбор у нас проходит в два этапа: текстовое задание и беседа-созвон. Первое - чтобы определить, насколько вы хорошо подкованы с точки зрения знаний, второе - чтобы определить, насколько вам подходят условия жизни в палатке, работы в команде, учёбы в лесу и ежей в шитояме. Надо ли что-нибудь подготовить? На нашу мастерскую мы берём со знанием Питона и интересом к компьютерной лингвистике (возможно, с базовыми знаниями оной). Обычно этого вполне хватает. Гуглить, кстати, во время решения задач мы не запрещаем, но ради бога, не списывайте. Что по дедлайнам? Отбор вот-вот начнётся (по планам должен на этой неделе). Отборочного задания пока нет, но заявки можно подавать и без этого. Как только задание будет выложено, мы обязательно дадим вам знать. Четких дат пока нет, но обычно отбор длится до конца мая, потом около недели мы проверяем задания и устанавливаем количество прошедших первый этап, а затем неделю проводим интервью и определяем финальный состав участников к началу-середине июня. К сожалению, поскольку проект волонтёрский, от форс-мажоров и задержек по срокам мы не застрахованы, но если что случится, будем обязательно предупреждать. А по коммуникации? У нас есть сайт, но основным способом коммуникации является Телеграм и в частности этот канал. Здесь удобнее всего быстро делиться новостями и получать фидбэк, чего не предусматривает тот же сайт. Обязательно подпишитесь, если хотите быть в курсе дел. Что нового по сравнению с прошлым годом? Вы просили, ждали и надеялись - и вот оно! Теперь у нас два трека - базовый и продвинутый. На базовом треке мы ждём тех, кто знает основы Питона, но ещё только готовится окунуться в мир NLP, а на продвинутом - тех, кто уже имеет какие-то знания и там, и там, и хочет продвинуться дальше. Спасибо, что прочли до конца, и увидимся на ЛШ! (Надеюсь.)
Звучит прикольно, но неимоверно архаично во времена Соннет-4 и Грок-3 )) Решение: добавить к летнему лагерю - ритрит по тантре! ��‍♂️ То есть тому, чему ИИ научить не сможет =))
1
avatar
Natural Language Processing & Text Mining
Переслано от канала
27.05.2025 18:57
Привет!

Мы - мастерская анализа текстовых данных, также известная как ТекстАн, и мы рады сообщить, что в 2025 году мы проводимся с 2 по 17 июля в рамках Летней школы. Вне зависимости от того, были ли вы на ЛШ уже или нет, у вас могут быть вопросы по поводу того, что из себя представляет именно наша мастерская, поэтому вот ответы на самые, возможно, частотные вопросы.

Кто мы и откуда?
Люди, делающие эту мастерскую, в основном либо из НИУ ВШЭ в Москве, либо из Европейского университета в Питере. Мы уже проводили такую мастерскую и ранее, и в этом году программа будет схожей, но, конечно же, с некоторыми изменениями относительно прошлых лет. Сама Летняя школа существует уже намного больше и рассказывать про неё намного сложней, поэтому почитать про неё можно здесь.

Как проходит мастерская?
Главный вопрос даже не "как", а "где". В лесу. Онлайн-версии не планируется. Летняя школа проводится на турбазе в Тверской области: жить планируется в палатках, а учиться - в деревянных домиках. Интернет есть, но с перебоями. Душ по расписанию, еда из общего кана, проверки МЧС за счёт заведения.

Когда примерно будет проходить мастерская?
Программа будет проходить с 2 по 17 июля, где второго будет въезд, а семнадцатого - выезд. Программа рассчитана на две недели (дальше в лесу уже становится трудновато жить без чистой одежды)

Какая примерно программа?
В целом тематика будет вращаться вокруг автоматической обработки естественного языка: языковые модели, визуализация, анализ тональности и извлечение именованных сущностей, и, конечно же, старые добрые машобуч с нейросетями (без этого сложно понять, как работают наши инструменты). Более подробную программу мы покажем позже.

Сколько это стоит?
Должны предупредить - это не совсем бесплатно. Летняя школа живёт на добровольные пожертвования участников, и минимальная рекомендуемая сумма пожертвований - 800 рублей в день. Получается около 12000 за все две недели. Как по мне, стоит того.

Как проходит отбор?
Отбор у нас проходит в два этапа: текстовое задание и беседа-созвон. Первое - чтобы определить, насколько вы хорошо подкованы с точки зрения знаний, второе - чтобы определить, насколько вам подходят условия жизни в палатке, работы в команде, учёбы в лесу и ежей в шитояме.

Надо ли что-нибудь подготовить?
На нашу мастерскую мы берём со знанием Питона и интересом к компьютерной лингвистике (возможно, с базовыми знаниями оной). Обычно этого вполне хватает. Гуглить, кстати, во время решения задач мы не запрещаем, но ради бога, не списывайте.

Что по дедлайнам?
Отбор вот-вот начнётся (по планам должен на этой неделе). Отборочного задания пока нет, но заявки можно подавать и без этого. Как только задание будет выложено, мы обязательно дадим вам знать. Четких дат пока нет, но обычно отбор длится до конца мая, потом около недели мы проверяем задания и устанавливаем количество прошедших первый этап, а затем неделю проводим интервью и определяем финальный состав участников к началу-середине июня. К сожалению, поскольку проект волонтёрский, от форс-мажоров и задержек по срокам мы не застрахованы, но если что случится, будем обязательно предупреждать.

А по коммуникации?
У нас есть сайт, но основным способом коммуникации является Телеграм и в частности этот канал. Здесь удобнее всего быстро делиться новостями и получать фидбэк, чего не предусматривает тот же сайт. Обязательно подпишитесь, если хотите быть в курсе дел.

Что нового по сравнению с прошлым годом?
Вы просили, ждали и надеялись - и вот оно! Теперь у нас два трека - базовый и продвинутый. На базовом треке мы ждём тех, кто знает основы Питона, но ещё только готовится окунуться в мир NLP, а на продвинутом - тех, кто уже имеет какие-то знания и там, и там, и хочет продвинуться дальше.

Спасибо, что прочли до конца, и увидимся на ЛШ! (Надеюсь.)
Летняя школа
Летняя школа — проект, собирающий на протяжении 15 лет людей, желающих учить и учиться.
1 93 5.2K
avatar
Natural Language Processing & Text Mining
@nlp_ru
29.03.2025 20:20
Natural Language Processing & Text Mining Всем привет. За рекламный пост здесь в блок улетаещь либо иногда можно будет размещаться мне без негативных последствий?
Могу предположить что "Срочно требуются люди на 1-2 часа в день, от $3,000 в мес, пишите в личку" - таки не прокатит 😂
🤣 1
avatar
Natural Language Processing & Text Mining
@nlp_ru
27.03.2025 18:08
Всем привет. За рекламный пост здесь в блок улетаещь либо иногда можно будет размещаться мне без негативных последствий?
🤷‍♂ 1
1
avatar
Natural Language Processing & Text Mining
@nlp_ru
17.03.2025 10:11
Ребят привет! Кто то юзает уже MCP?
Поделитесь опытом, кто как использует в прикладном смысле?

Насколько по вашему вещь еще сырая по сравнению с RAG или тюнингом?
avatar
Natural Language Processing & Text Mining
@nlp_ru
17.03.2025 10:03