Введение в компьютерную лингвистику и машинный перевод
Объем программы: 32 часа
Программа направлена на формирование фундаментальных компетенций в области компьютерной лингвистики и автоматической обработки естественного языка (NLP) для специалистов гуманитарного и технического профилей. Слушатели изучат теоретические основы и эволюцию систем машинного перевода, освоят методы предобработки и векторизации текстовых данных, а также получат практические навыки работы с корпусами, CAT-системами и проектирования прикладных NLP-приложений.
Целевая аудитория
Научные работники
Научно-педагогические работники специалисты с высшим образованием (лингвисты, филологи, переводчики, преподаватели иностранных языков)
IT-специалисты, желающие получить фундаментальные знания в области обработки естественного языка
Образовательный трек
Что такое компьютерная лингвистика
Уровни языка и их компьютерное представление
Основные подходы к обработке текста
Практический навык
математики и ИИ; основные задачи NLP
правила (rule-based) vs. Статистика (statistical) vs. Нейросети (neural); понятие корпуса текстов; значение размеченных данных
Базовая предобработка текста
Векторизация текста
Векторные представления слов
Практический навык
Токенизация; нормализация; лемматизация
мешок слов (Bag-of-Words) и TF-IDF
от one-hot encoding к дистрибутивной семантике; модели Word2Vec (CBOW, Skip-gram) и GloVe.
Классические подходы к машинному переводу
Статистический машинный перевод
Нейронный машинный перевод
Практический навык
Rule-Based Machine Translation
Example-Based Machine Translation
модель IBM
компоненты SMT
архитектура "Seq2seq"
механизм внимания (Attention)
.
Оценка качества перевода
Трудности и ограничения
Практический навык
ручная оценка
автоматические метрики
редкие языки (low-resource)
.
Проектирование простого переводчика или анализатора
Реализация и защита мини-проекта
Практический навык
создать простое приложение
сборка пайплайна
По окончании учебной программы вы будете:
Знать:
основные понятия и методы компьютерной лингвистики: предмет, задачи, направления; принципы и методы машинного перевода
Уметь:
применять инструменты автоматической обработки текста; работать с корпусами текстов; выбирать и использовать системы машинного перевода; работать в CAT-системах
Владеть:
навыками работы с современными цифровыми инструментами переводчика
А также получите:
удостоверение о повышении квалификации
Оставьте заявку, и мы свяжемся с вами!
Заполните форму обратной связи, и мы свяжемся с вами для предоставления полной информации