- •«Иркутский государственный лингвистический университет»
- •Инструментальные средства разработки учебного корпуса ошибок по русскому языку
- •Иркутск
- •Глава I Понятие корпусной лингвистики и учебного корпуса….………....4
- •Глава II Аналитический обзор средств разработки учебного корпуса...…15
- •Введение
- •Глава I. Понятие корпусной лингвистики и учебного корпуса
- •1.1. Краткий обзор разработок по созданию корпусов текстов
- •1.2 Учебные корпуса: определение и назначение
- •Глава II. Аналитический обзор средств разработки учебного корпуса
- •2.1. Аналитический обзор программных средств для аннотирования текста
- •2.2. Классификация ошибок
- •2.3 Примеры строения учебных корпусов
- •2.3.1 Корпус Текстов Петербургских Школьников
- •1. Разметка текста на ошибки
- •2. Синтаксическая разметка текста
- •3. Создание конкорданса
- •4. Наполнение сервиса
- •2.3. 2. Учебный многоязычный корпус MeLlange
- •2.4. Общие рекомендации по выбору инструментальных средств для создания корпуса по русскому языку
- •Заключение
- •Библиография
- •Приложение 1
2.3 Примеры строения учебных корпусов
2.3.1 Корпус Текстов Петербургских Школьников
Для полного представления того, из чего и как должен строиться учебный корпус, в качестве примера нами был рассмотрен Корпус Текстов Петербургских Школьников.
Объём корпуса составляет 38.122 словоупотребления Сбор материала проходил в школах Санкт-Петербурга и осуществлялся в рамках педагогической практики студентами 4 курса филологического факультета РГПУ им. А. И. Герцена. В качестве информантов (авторов текстов) выступили 78 учащихся 7, 9-11 классов. Родной язык информантов – русский. Возраст учащихся - от 13 до 17 лет (средний возраст 15.4 лет; стандартное отклонение - 0,8 года)
Жанры текстов представлены в таблице 3.
Таблица 3. Жанры текстов КТПШ
-
Письменные
Устные
Эссе
Монолог
Письмо другу
Диалог
Дополнительные данные об информантах (КТПШ)
Изучаемые языки: немецкий, французский, испанский, японский, шведский, финский, чешский и казахский.
В таблице 4 представлены основные характеристики корпуса.
Таблица 4. Характеристики КТПШ
Признак |
Тип корпуса |
Тип данных |
Смешанный (устные и письменные) |
Язык текстов |
Английский |
«Параллельность» |
Одноязычный |
Специфичность |
Содержит тексты обучающихся английскому зыку |
Доступность |
Свободный доступ |
Назначение |
Исследовательский |
Динамичность |
Мониторный |
Разметка |
Размеченный |
Характер разметки |
Синтаксическая разметка ошибок (error tagging) |
Объем текстов |
Полнотекстовый |
Хронология |
Диахронический |
«Общность» |
Общий |
Работа по созданию корпуса текстов обучающихся английскому языку проводилась в рамках программы «Методология проектирования гуманитарных технологий извлечения информации в условиях инновационной образовательной среды: коммуникативный аспект»
Руководитель программы: Беляева Лариса Николаевна, доктор филологических наук, профессор, заслуженный деятель науки РФ, почетный работник высшего профессионального образования РФ, заведующая кафедрой прикладной лингвистики
Работа над программой проводилась в рамках инновационного образовательного проекта РГПУ им. А.И. Герцена «Создание инновационной системы подготовки специалистов в области гуманитарных технологий в социальной сфере» (2008 г)
На данном сервисе представлены тексты петербургских учащихся, разделенные по типам и жанрам и синтаксически размеченные. На рисунке 7 представлен фрагмент страницы, где размещены данные тексты.
Рисунок7. Тексты, выполненные петербургскими школьниками.
В корпусе есть возможность свободного наполнения, т.е. любой пользователь может разместить в нем свой текст.