Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тугаринова Настя (7).doc
Скачиваний:
12
Добавлен:
21.11.2018
Размер:
2.71 Mб
Скачать

1. Разметка текста на ошибки

Разметка ошибок в КТПШ была выполнена полуавтоматическим способом с помощью программ Microsoft Word и Advanced Auto Renamer.

Для того, чтобы разместить размеченный вариант текста нужно следовать предложенной в корпусе инструкции:

  1. Загрузите на локальный компьютер предлагаемый ниже список ошибок.

  2. Скопируйте текст, который будете размечать в отдельный файл редактора Microsoft Word 2007. (! в другом файле у Вас должен остаться текст без разметки!) Убедитесь, что в настройках "Правописание" - "Набор правил" выбран пункт "Строго (все правила)".

  3. Кликните на ошибочном варианте слова правой кнопкой мыши, и в открывшемся меню выберите пункт "Грамматика"

  4. Выделите слово с ошибкой цветом, соответствующим типу ошибки. Для этого воспользуйтесь инструментом "маркер".

  5. Впишите номер ошибки (см. список ошибок) после слова через пробел в круглых скобках.

  6. Пройдите по ссылке http://www.whitesmoke.com/online-writing-assistant, разместите в диалоговом окне сайта ваш неразмеченный текст

  7. Осуществите разметку текста, нажав на кнопку "check spelling"

  8. Выделите в вашем документе слово с ошибкой цветом, соответствующим типу ошибки (см. список ошибок).

  9. Впишите номер ошибки (см. список ошибок) после слова через пробел в круглых скобках.

  10. По окончании работы воспользуйтесь программой Advanced Auto Renamer, присвоив ошибкам соотвествующие названия.

  11. Сохраните документ в формате HTML присовив ему имя типа «textcode»_error tagged.htm (веб-страница с фильтром);

  12. Отправьте полученный документ на электронный адрес администрации сайта. Ваш текст будет добавлен в корпус после рассмотрения его администратором сайта.

Практически все уже существующие на данном сервисе тексты размечены на ошибки. На рисунках 8 и 9 показаны примеры размеченных на ошибки текстов.

Рисунок8. Пример размеченного на ошибки текста

Рисунок 9. Пример размеченного на ошибки текста

2. Синтаксическая разметка текста

Кроме разметки на ошибки, сервис предлагает пользователю разметить текст синтаксически. Для синтаксической разметки текстов корпуса предлагается использовать сервис Machinese Syntax © компании Connexor Oy. Для того, чтобы разместить размеченный вариант текста нужно также проследовать предложенной инструкции:

  1. Добавьте текст в массив корпуса с помощью сервиса corpus builder;

  2. Загрузите (пункт "Сохранить как") шаблон для синтаксической разметки текста на свой компьютер;

  3. Перейдите на страницу сервиса Machinese Syntax ©;

  4. Введите в текстовое поле текст. В выпадающем меню ниже выберите пункт "English text" и нажмите кнопку "Apply syntax";

  5. Выделите сформированный текст таблицы, включая элементы шапки таблицы (#, Text, Basefor etc.). Откройте исходный HTML-код выделенного фрагмента и скопируйте код в буфер обмена;

  6. Откройте сохранённый шаблон и вставьте код из буфера обмена в указанное в нем место;

  7. Сохраните документ в формате HTML присовив ему имя типа _parsed.html;

  8. Отправьте полученный документ на электронный адрес администрации сайта. Ваш текст будет добавлен в корпус после рассмотрения его администратором сайта.