• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Цель, задачи и исходные данные исследований

Цели проекта: Используя знания и умения, накопленные в ходе первого этапа работы и создания собственных исследовательских корпусов (НИСы по компьютерной лингвистике):

- проводить автоматическую классификацию данных по синтаксической и лексической сложности и ее экспертный анализ;
- проводить экспертизу адекватности и точности информации в упрощенных предложениях; осуществлять лингвистическое постредактирование адаптированных предложений, полученных в автоматическом режиме; 
- создавать и дорабатывать синтаксические анализаторы и другие компьютерные корпусные инструменты в соответствии с поставленными задачами.


Работа включает в себя следующие задачи:

1. Собрать и проанализировать корпуса учебных текстов в соответствии с выбранным уровнем обучения.
2. Скорректировать существующий список лингвистических правил для дальнейшего упрощения материала методами автоматической обработки текста.
3. Доработать синтаксический анализатор в соответствии с поставленными задачами и провести постредактирование полученных примеров.
4. Создать банк адаптированных примеров и инструкции по работе с усовершенствованным синтаксическим анализатором, которые можно в дальнейшем использовать преподавателям и учителям.
5. Протестировать разработанную программу при участии преподавателей РКИ.

Материал исследования: данные Национального корпуса русского языка; текстовые данные традиционных учебников РКИ; архив конференции по компьютерной лингвистике Диалог-21, посвященные вопросам синтаксиса; учебник и глоссарий по русскому языку как иностранному.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.