Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ билеты.docx
Скачиваний:
3
Добавлен:
14.04.2019
Размер:
59.06 Кб
Скачать

6) Массовые информационные системы

Интернет как фактор информационного обмена включает в себя ряд функций, привлекательных с точки зрения филологического и лингво-филологического взаимодействия. Интернет как источник теоретической информации интересен с точки зрения наличия на серверах сети теоретических данных филологического характера, особенно новейших разработок, статей и монографий отечественных и зарубежных авторов и издательств. Также Интернет может служить полем теоретических дискуссий (через систему электронной почты, телеконференции и форумы). Интернет как источник практических данных представляет интерес в той связи, что может являться поставщиком текстов, а также может служитьполем для диалогического эксперимента (через систему электронной почты). Поисковые пакеты позволяют разыскивать в локальной и глобальной сети необходимые данные как теоретического, так и практического характера. Дисциплинарно ориентированные интернет-источники представляют собой сервера (или объединения серверов, ориентированные на сбор и хранение информации, связанной с филологическими и лингво-филологическими исследованиями).

8)Массивы

Кроме базовых типов, в большинстве алгоритмических языков присутствует конструкция массив. Иногда массив называют также таблицей или вектором. Массив позволяет объединить множество элементов одного типа в единую переменную.

Все элементы массива имеют один и тот же тип. Элементы массива обычно нумеруются индексами от 0 до n-1, где n - число элементов массива. В некоторых языках можно задавать границы изменения индексов, в других нижняя граница значения индекса равна единице, а не нулю. Мы, тем не менее, будем придерживаться языка Си (а также C++, Java, C#), в котором нижней границей индекса всегда является ноль. Это очень удобно, т.к. индекс элемента массива в этом случае равен его смещению относительно начала массива. Длина массива задается при его описании и не может быть изменена в процессе работы программы. Массив - это самая важная конструкция алгоритмического языка. Важность массива определяется тем, что память компьютера логически представляет собой массив (его можно рассматривать как массив байтов или как массив четырехбайтовых машинных слов). Индекс в этом массиве обычно называют адресом. Элементы массива читаются и записываются исключительно быстро, за одно действие, независимо от размера массива и величины индекса. Для программиста конструкция массива как бы дана свыше. Большинство других структур данных, используемых в программировании, моделируются на базе массива.

Суть в том, что достоверные данные о фонетическ, морфологическ, синтактическ и семантической структуре языка и речи могут быть получены путём переработки большого количества текстов. Корпус текста – совокупность текстов для надёжных научных выводов о некотором языке, диалекте или множестве языков. Эти совокупности текстов помогают решить ряд задач:

- в лексиколог. и лексикограф. (для составления различных словарей, определения значений для многозначных слов, выявления ассоциативных связей слов в тексте, выделения терминов)

- в грамматике (для определения частоты употребляемых грамматических морфем в текстах различных типов; выявления наибольшего употребления типов словосочетаний и предложений, определения синонимичных морфологических единиц и.т.д.)

- в лингвистике текста для дифференциации типов текста, выявления связи между предложениями в абзацах и между ними- при автономном переводе текстов для поиска контекстных слов, имеющих несколько переводимых эквивалентов, поиска эквивалентов терминологических и фразеологических и т. д.

- в учебных целях для выбора цитат, фрагментов произвольных примеров, используемых при создании учебников и др.

Существуют различные подходы к классификации корпусов текстов:

- исследовательский – создание с целью изучения различных аспектов функционирования языка. Может содержать несколько десятков миллионов словоупотреблений

- статистический – соц. Тексты какого-то небольшого промежуточного вр;

- иллюстративный – служит для выделения из нескольких лингвистических примеров, подтверждающих те или иные языковые (речевые, текстовые) факты, обнаруженные ранее иными лингвистическими приёмами.

Корпусы параллельных тестов состоят из множества текстов – оригинально написанных на исходном языке и текстовых переводов этих текстов на одном или нескольких языках.

Входящие в корпуса тексты могут быть представлены в виде:

1. В виде текстового архива

2. В виде банка данных

3. В виде базы данных

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]