Исследование информационных характеристик естественных языков — Ярмарка проектов — Национальный исследовательский университет «Высшая школа экономики»

Проект направлен на исследование информационных и статистических характеристик текстов естественного языка. Изучение свойств языка, с точки зрения формального математического аппарата, представляет прикладной интерес, в таких областях как статистический анализ, автоматизированная обработка текстов, компьютерная лингвистика, цифровая экономика, искусственный интеллект и криптография для решения, таких задач как осмысленный перебор, анализ количества осмысленных текстов, моделирование текстов на естественном языке из случайного распределение букв алфавита на основе вероятностных характеристик и др.

В ходе исследования планируется собрать значительное количество материала для создания языкового корпуса и последующего изучения ряда информационных характеристик, таких как энтропия, распределение n-грамм, избыточность и перплексия, использование которых позволяет строить прогнозные модели указанных характеристик.

К участию в проекте приглашаются заинтересованные студенты бакалавриата/специалитета, магистратуры и аспиранты.

Все вопросы по поводу участия в проекте можно задать по эл. почте amalashina@hse.ru.

Проектное предложение (DOCX, 19 Кб)

Идентификационный номер проекта

321778803

Кампус

Москва

Руководитель

Лось Алексей Борисович

Подразделение-инициатор

Кафедра компьютерной безопасности

Рекомендуется для образовательных программ

Информатика и вычислительная техника, Информационная безопасность, Прикладная математика, Фундаментальная и компьютерная лингвистика

Рекомендуется для магистерских программ

Компьютерная лингвистика, Компьютерные системы и сети, Лингвистическая теория и описание языка, Русский как иностранный во взаимодействии языков и культур, Системы управления и обработки информации в инженерии, Суперкомпьютерное моделирование в науке и инженерии, Цифровые методы в гуманитарных науках

Тип проекта

Исследовательский

Тип занятости студента

Удаленная работа

Территория реализации проекта

Таллинская, 34

Курс

с 2 по 5

Сроки реализации проекта

10 января – 31 декабря 2020

Заявки принимаются до

Приём заявок завершен 10 января 2020 г.

Количество вакантных мест на проекте

Количество кредитов

Интенсивность проектной деятельности

4 ч. в неделю

Способ постановки задач

Индивидуальная

Необходимо

ответственность и исполнительность

Теги

информационная безопасность информационные технологии языки