Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

информатика

.docx
Скачиваний:
4
Добавлен:
20.03.2015
Размер:
72.46 Кб
Скачать

Прикладная лингвистика -наука о функционировании языка и моделировании языковых функций с точки зрения приложения лингвистической теории в разных нелингвистических областях знаний.

Прикладная лингвистика - общий термин, использующийся для обозначения деятельности “по приложению научных знаний об устройстве и функционировании языка в нелингвистических научных дисциплинах и в различных сферах практической деятельности человека, а также теоретическое осмысление такой деятельности” (Баранов: 7). В западной традиции термин прикладная лингвистика “applied linguistics, angewante Linguistik” связывается с разработкой методик преподавания языков и теорию перевода. В российской лингвистической традиции этот термин трактуется гораздо шире. Кроме направлений, связанных с теорией и практикой преподавания языков и переводов, к нему относят, во-первых, все виды деятельности, так или иначе связанные с автоматической обработкой естественного языка (Natural language processing), а во-вторых, деятельности, целью которых является регламентация и нормализация языка: лексикография, лингвистическая экспертиза, терминоведение и др.

Прикладная лингвистика как самостоятельная научная дисциплина возникла сравнительно недавно (приблизительно к 1920-м годам). Однако задачи, связанные с приложением лингвистических знаний в различных сферах человеческой деятельности, включая моделирование процесса познания, обучение языку, создание нормативных языковых описаний и т.п. стояли перед языкознанием уже давно. Под "шапкой" данной области исследования очень часто объединяют множество, на первый взгляд, разнородных направлений и приложений. С одной стороны, отдельные области прикладной лингвистики рассматриваются как части дисциплин в рамках сформировавшегося недавно научного направления, называемого общим термином Computer Science. С другой стороны, лингвистические модели исследуются и применяются в сугубо гуманитарных областях таких, как практика преподавания языка, теории речевого воздействия, политической лингвистике. Согласно А.Н.Баранову все эти направления можно объединить в том смысле, что в них "изучаются и разрабатывают способы оптимизации функционирования языка".

Не существует единой точки зрения на состав основных направлений прикладной лингвистики. Обычно выделяют следующие направления, связанные с изучением языка:

  1. лексикография — теория и практика составления словарей;

  2. лингводидактика — наука о разработках методик обучения иностранному языку;

  3. терминоведение — наука об упорядочении и стандартизации научно-технической терминологии;

  4. переводоведение — теория перевода

  5. квантитативная лингвистика (изучение частотных свойств языковых единиц и их связь с другими свойствами, такими как фонетическая сложность, морфологическая сложность, многозначность, возраст).

Основные направления прикладной лингвистики, связанные с практическими приложениями:

  1. Компьютерная лингвистика (computational linguistics)

  2. Лингвистическая экспертиза (например, в судебной практике)

  3. Политическая лингвистика (анализ политического дискурса)

Одной из важных областей применения лингвистических знаний в других областях является прикладная фонетика. Она занимается практическим применением фонетических знаний, накопленных в лингвистике. Ее разделы отражают многообразие использования языка в человеческой жизни: к прикладной фонетике относятся такие разные дисциплины, какметодика преподавания фонетики конкретного языка, фонетическая риторика – приемы выразительной речи, орфоэпия, устанавливающая различные произносительные нормы. Важное применение фонетика находит также в логопедииречевой дефектологии и лечении болезней, вызванных повреждением речевых функций.

В последнее время прослеживается тенденция к использованию термина “прикладная лингвистика именно в западном значении”. Так, Национальное общество прикладной лингвистики занимается именно проблемами лингводидактики (www.nopril.ru). Технологии анализа естественного языка, моделирования когнитивных процессов понимания и языкового взаимодействия и извлечения информации из текстов объединяются общим термином “Компьютерная лингвистика” (вычислительная лингвистика, computational linguistics).

Несмотря на то, что методы, применяемые в различных направлениях прикладной лингвистике разнообразны, можно выделить общие характерные признаки:

  1. ведущая роль метода моделирования;

  2. экспериментальный характер прикладных методик

  3. комплексное сочетание разных наук.

В России термин «прикладная лингвистика» получил широкое распространение в 1950-х годах. Это обстоятельство связано с появлением первых компьютерных систем автоматической обработки текстовой информации (машинного перевода, автоматического реферирования и др.). В русскоязычной литературе распространен подход, при котором термин «прикладная лингвистика» имеет то же значение, что и «компьютерная лингвистика», «вычислительная лингвистика», «автоматическая лингвистика», «инженерная лингвистика.

МАШИННЫЙ ПЕРЕВОД

МАШИННЫЙ ПЕРЕВОД, выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. Современный машинный, или автоматический перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.

Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков L1 – L2 при заданном направлении перевода (с одного конкретного языка на другой). Система машинного перевода включает в себя двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической) для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик. Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными.

Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:

1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы.

2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типаin case ofin accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, синтаксических функций словоформ в данном тексте и пр.), производимое в рамках входного языка; разрешение омографии (конверсионной омонимии словоформ – скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); лексический анализ и перевод лексем. Обычно на этом этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/отсутствие контекстных определителей значения.

3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типасаниножницы глагол должен стоять в форме множественного числа, при том что в оригинале может быть и единственное число).

4. Синтез выходных словоформ и предложения в целом на выходном языке.

В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны. Анализ и синтез могут производиться как пофразно, так и для всего текста, введенного в память компьютера; в последнем случае алгоритм перевода предусматривает определение так называемых анафорических связей (такова, например, связь местоимения с замещаемым им существительным – скажем, местоимения им со словом местоимения в самом этом пояснении в скобках).

Действующие системы машинного перевода ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Современные аппаратные и программные средства допускают использование словарей большого объема, содержащих подробную грамматическую информацию. Информация может быть представлена как в декларативной (описательной), так и в процедурной (учитывающей потребности алгоритма) форме.

Современный машинный перевод следует отличать от использования компьютеров в помощь человеку-переводчику. В последнем случае имеется в виду автоматический словарь, помогающий человеку быстрее подбирать нужный переводной эквивалент. Хотя и в том, и в другом случае компьютер работает вместе с человеком (переводчиком или редактором), в содержание термина «машинный перевод» входит представление о том, что главную, бóльшую часть работы по переводу и отысканию переводных эквивалентов и переводных соответствий машина берет на себя, оставляя человеку лишь контроль и исправление ошибок, в то время как компьютерный словарь в помощь человеку – это чисто вспомогательное средство для быстрого нахождения переводных соответствий; при этом, однако, в такого рода словарях в ограниченной степени могут быть реализованы и некоторые функции, присущие системам машинного перевода.

В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактирования. Другой подход предполагает использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, ориентированность его на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов извлечения грамматической информации, нахождения переводных соответствий и алгоритмов синтеза. На практике перевод такого типа становится экономически выгодным, если объем переводимых текстов достаточно велик (не менее нескольких десятков тысяч страниц в год), если тексты достаточно однородны, словари системы полны и допускают дальнейшее расширение, а программное обеспечение удобно для пост-редактирования. Такого рода системы машинного перевода используются в организациях, потребности которых в оперативных и качественных переводах достаточно велики.

Теоретической основой начального (конец 1940-х – начало 1950-х годов) периода работ по машинному переводу был взгляд на язык как кодовую систему. Пионерами МП были математики и инженеры. Описания их первых опытов, связанных с использованием только что появившихся ЭВМ для решения криптографических задач, были опубликованы в США в конце 1940-х годов. Датой рождения машинного перевода как исследовательской области обычно считают март 1947; именно тогда специалист по криптографии Уоррен Уивер в своем письме Норберту Винеру впервые поставил задачу машинного перевода, сравнив ее с задачей дешифровки.

Тот же Уивер после ряда дискуссий составил в 1949 меморандум, в котором теоретически обосновал принципиальную возможность создания систем машинного перевода. Вскоре началось финансирование исследований; в 1952 состоялась первая конференция по машинному переводу, организованная логиком и математиком Й.Бар-Хиллелом.

Помимо очевидных практических нужд важную роль в становлении машинного перевода сыграло то обстоятельство, что предложенный в 1950 английским математиком А.Тьюрингом знаменитый тест на разумность («тест Тьюринга») фактически заменил вопрос о том, может ли машина мыслить, на вопрос о том, может ли машина общаться с человеком на естественном языке таким образом, что тот не в состоянии будет отличить ее от собеседника-человека. Тем самым вопросы компьютерной обработки естественноязыковых сообщений на десятилетия оказались в центре исследований по кибернетике (а впоследствии по искусственному интеллекту), а между математиками, программистами и инженерами-компьютерщиками, с одной стороны, и лингвистами – с другой установилось продуктивное сотрудничество.

В ходе развития идей и создания промышленных систем машинного перевода были разработаны способы автоматического морфологического анализа для основных европейских языков, методы автоматического обнаружения синтаксических структур, сформулированы требования к семантическим компонентам систем. В рамках эффективного международного сотрудничества и обмена терминологией созданы большие автоматические словари с разнообразной лексической информацией, банки терминологических данных по разным тематическим областям (например, словарь ЕВРОДИКАТОМ и ряд других словарей, тематика которых определялась тем обстоятельством, что практический машинный перевод чаще всего имеет дело с научными и техническими текстами). Результаты работ по МП способствовали началу и развитию исследований и разработок в области автоматизации информационного поиска, логического анализа естественно-языковых текстов, экспертных систем, способов представления знаний в вычислительных системах и т.д.

В СССР в качестве головной организации по машинному переводу был в 1974 определен Всесоюзный центр переводов научно-технической литературы и документации (ВЦП), взявший на себя координацию работ в масштабе страны. Под его эгидой был проведен ряд крупных международных научных конференций (1975, 1979, 1983, 1985, 1989) по машинному переводу и проблемам научно-технического перевода. В ВЦП были созданы промышленные системы машинного перевода с английского языка на русский АМПАР (на основе исследований и разработок коллектива Ю.А.Моторина), с немецкого языка на русский НЕРПА, с французского языка на русский ФРАП, автоматические терминологические словари в помощь человеку-переводчику. Система АМПАР длительное время находилась в промышленной эксплуатации; впоследствии на ее базе были созданы более эффективные системы МП для персональных компьютеров семейства СПРИНТ. В ВПЦ была также разработана система МП с русского языка на английский АСПЕРА. Большой вклад в разработку промышленных систем МП был сделан ленинградской общесоюзной группой «Статистика речи» под руководством Р.Г.Пиотровского, а также группами специалистов по компьютерной лингвистике в Минске (А.В.Зубов), Кишиневе (В.А.Чижаковский), Махачкале (А.И.Чапля), Чимкенте (К.Б.Бектаев), Самарканде (Х.А.Арзикулов) и др. На базе исследований и научно-практического подхода группы «Статистика речи» были впоследствии разработаны и сейчас находятся в коммерческом использовании такие системы машинного перевода, как Stylus, Socrat и другие.

В настоящее время в Российской Федерации продолжаются в незначительных масштабах некоторые работы по системам МП, основанным на подходе «текст-смысл-текст», не всегда явно проговариваемым лозунгом которого в момент обоснования этого подхода в 1960-х годов был «машинный перевод без перевода, без машин, без алгоритмов» (см. обзор работ этого направления, принадлежащий Л.Н.Беляевой и М.И.Откупщиковой). Идея подхода заключалась в том, что от лингвиста требуется только декларативное описание фактов языка (т.е. лингвистическая теория, претендующая, правда, на особую точность и формализованность), а алгоритмы перевода составят программист и математик. В рамках этих исследований были получены значительные теоретико-лингвистические результаты (в частности, создана теория так называемых лексических функций, нашедшая применение в лексикографии), однако для создания практических систем подобного рода подход оказался недостаточно эффективным. Все практические системы без исключения используют идею переводных соответствий, т.е. в их основе лежит модель «текст-текст» и они реализуют краткую схему перевода (см. статью ПЕРЕВОД). Неизмеримо выросшие за последние десятилетия возможности вычислительной техники и новые программистские подходы никак не могут помочь реализовать идеи анализа и синтеза, основанные на приоритете выявления только синтаксической структуры с последующим переходом к смыслу. Выявление содержания текста в рамках человеко-машинного интерфейса может производиться, как и во всякой прикладной задаче, только с использованием как декларативных, так и процедурных знаний и при значительной опоре на лексику. Эта точка зрения обоснована, в частности, в недавних работах отечественного специалиста по программированию и искусственному интеллекту А.С.Нариньяни.

За рубежом эксплуатируется целый ряд систем машинного перевода. Наиболее известной из их числа является система SYSTRAN, разработанная и поддерживаемая компанией SYSTRAN Software Inc. и используемая службой машинного перевода при комиссии Европейского союза. Данная служба, объем переводов в которой составляет около 2,5 млн. страниц в год, использует систему SYSTRAN для перевода с английского на немецкий, французский, испанский, греческий и итальянский языки, а также с французского на английский, испанский и итальянский. В практической эксплуатации находится ряд практических систем исследовательского центра Гренобля (Франция), систему CULT (Гонконг, ныне КНР) и ряд других. На рынке коммерческого машинного перевода предлагаются системы таких фирм, как Logos Corp., Globalinc Inc., Toshiba Corp., CompuServe и др., в том числе и санкт-петербургская компания ПроМТ, выпустившая под названием PROMT 98 усовершенствованную версию популярной системы Stylus.

Проблематика машинного перевода находит свое отражение в регулярно проводимых международных конференциях по вычислительной лингвистике COLING, а также на международных конференциях по машинному переводу MT SUMMIT.

Технические инновации 1990-х годов (значительное расширение возможностей персональных компьютеров, появление качественных и доступных массовому пользователю сканеров и эффективных программ оптического распознавания текста, а также развитие глобальной компьютерной сети Internet и средств доступа к ней) придали новый стимул работам по МП, привлекли в данную область новые значительные инвестиции и увенчались серьезными практическими результатами – появлением достаточно эффективных систем машинного перевода и компьютерных словарей для работы на персональном компьютере (в том числе продуктов отечественных компаний ПроМТ, «Бит», «Арсеналъ», отчасти уже упомянутых выше); объединением систем МП с системами оптического распознавания текста и проверки орфографии; созданием специальных средств МП для работы в Internet, обеспечивающих либо перевод текстов на серверах соответствующих компаний, либо онлайновый перевод Web-страниц. В сочетании с пониманием ограничений МП и реалистической формулировкой целей его использования (прежде всего, это ознакомительно-реферативные цели, что хорошо соответствует базовой идеологии Internet как средства «навигации в информационном море») все это позволяет говорить об органичном встраивании систем МП в общий процесс формирования глобального информационного общества.

Эффективность работы современной системы МП в решающей степени зависит от ее удачной настройки на конкретный подъязык (или микроподъязык) естественного языка, на определенную лексику и ограниченный набор грамматических средств, характерных для текстов данной предметной области, а также на определенные типы документов. Учение о подъязыках с точки зрения машинного перевода было впервые сформулировано Н.Д.Андреевым (Ленинградский университет) в 1967, хотя представления о языковых регистрах, стилях, жанрах письменного текста и т.п. были хорошо известны и в традиционной лингвистике. Подъязык, с точки зрения МП, определяется в первую очередь некоторым исходным набором текстов, в рамках которого определяется входной и выходной словари, степень распространения и характер лексической неоднозначности лексем, характер и распространенность синтаксических конструкций, способы их перевода в данной языковой паре и пр. Большую роль играют параллельные тексты и словари-конкордансы, с помощью которых можно достаточно эффективно изучить и использовать в составлении алгоритмов лексическую сочетаемость и дистрибуцию (распределение) языковых элементов в речи (дискурсе, тексте). Статистические характеристики подъязыков помогают упорядочить структуру соответствующих алгоритмов анализа и синтеза. Выходной словарь, ориентированный на потребности синтеза и передачи основных видов соответствий в конкретной языковой паре, обеспечивает приемлемый выходной текст. В любом из современных видов машинного перевода необходимо участие человека-редактора, удобство работы которого обеспечивается качеством и надежностью соответствующего программного обеспечения.

Перспективы развития машинного перевода связаны с дальнейшей разработкой и углублением теории и практики перевода, как машинного, так и «человеческого». Для развития теории важны результаты сопоставительного языкознания, общей теории перевода, теории закономерных соответствий, способов представления знаний, оптимизации и совершенствования лингвистических алгоритмов. Новые и более эффективные словари с необходимой словарной информацией, строгие теории терминологизации лексики, теория и практика работы с подъязыками помогут повысить качество перевода лексических единиц. Формальные грамматики, ориентированные на перевод, дадут возможность оптимизировать алгоритмы нахождения переводных соответствий в данной коммуникативной ситуации, которая может быть описана в рамках соответствующих прикладных теорий представления знаний. Наконец, новые возможности программирования и вычислительной техники также будут вносить свой вклад в совершенствование и дальнейшее развитие теории и практики машинного перевода.

Компьютерная лексикография

Лексикография - наука, занимающаяся составлением словарей. - традиционная (теория в сочетании с практикой составления словарей) - машинная, компьютерная (создание автоматических словарей, лингвистических баз данных и разработка программ поддержки лексикографических работ).

 Основные направления компьютерной лексикографии:

  1. автоматическое получение из текста с помощью компьютерных средств различных словарей (частотных, терминологических, конкордансов и т.д.) 2. теоретические и практические аспекты составления компьютерных словарей для NLP-систем. (Natural Language Processing) 3. создание словарей, являющихся машинными версиями традиционных словарей. Первое и второе направления занимаются разработкой «программ поддержки лексикографических работ»

Гипертекст - текст со вставленными в него словами (командами) разметки, ссылающимися на другие места этого текста, другие документы, картинки и т.д. Основные компоненты технологии World Wide Web. К 1989 году гипертекст представлял новую, многообещающую технологию, которая имела относительно большое число реализаций с одной стороны, а с другой стороны делались попытки построить формальные модели гипертекстовых систем, которые носили скорее описательный характер и были навеяны успехом реляционного подхода описания данных. Идея Т.Бернерс-Ли заключалась в том, чтобы применить гипертекстовую модель к информационным ресурсам, распределенным в сети, и сделать это максимально простым способом. Он заложил три краеугольных камня системы из четырех существующих ныне, разработав: язык гипертекстовой разметки документов H ML (Hyper ex Markup La -guage); универсальный способ адресации ресурсов в сети URL (U iversal Resource Loca or); протокол обмена гипертекстовой информацией H P (Hyper ex ra sfer Pro ocol). Позже команда CSA добавила к этим трем компонентам четвертый: универсальный интерфейс шлюзов CGI (Commo Ga eway I erface). Идея H ML - пример чрезвычайно удачного решения проблемы построения гипертекстовой системы при помощи специального средства управления отображением. На разработку языка гипертекстовой разметки существенное влияние оказали два фактора: исследования в области интерфейсов гипертекстовых систем и желание обеспечить простой и быстрый способ создания гипертекстовой базы данных, распределенной на сети. В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем, т.е. способов отображения гипертекстовой информации и навигации в гипертекстовой сети. Значение гипертекстовой технологии сравнивали со значением книгопечатания. Утверждалось, что лист бумаги и компьютерные средства отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма представления информации тоже должна отличаться. Наиболее эффективной формой организации гипертекста были признаны контекстные гипертекстовые ссылки, а кроме того было признано деление на ссылки, ассоциированные со всем документом в целом и отдельными его частями. Самым простым способом создания любого документа является его набивка в текстовом редакторе. Опыт создания хорошо размеченных для последующего отображения документов в CER -е был - трудно найти физика, который не пользовался бы системой eX или La eX. Кроме того к тому времени существовал стандарт языка разметки - S a dard Ge eralised Markup La guage (SGML). Следует также принять во внимание, что согласно своим предложениям Т.Бернерс-Ли предполагал объединить в единую систему имеющиеся информационные ресурсы CER , и первыми демонстрационными системами должны были стать системы для eX и VAX/VMS. Обычно гипертекстовые системы имеют специальные программные средства построения гипертекстовых связей. Сами гипертекстовые ссылки хранятся в специальных форматах или даже составляют специальные файлы. Такой подход хорош для локальной системы, но не для распределенной на множестве различных компьютерных платформ.

В H ML гипертекстовые ссылки встроены в тело документа и хранятся как его часть. Часто в системах применяют специальные форматы хранения данных для повышения эффективности доступа. В WWW документы - это обычные ASCII- файлы, которые можно подготовить в любом текстовом редакторе. Таким образом, проблема создания гипертекстовой базы данных была решена чрезвычайно просто. В качестве базы для разработки языка гипертекстовой разметки был выбран SGML (S a dard Ge eralised Markup La guage). Следуя академическим традициям, Бернерс-Ли описал H ML в терминах SGML (как описывают язык программирования в терминах формы Бекуса-Наура). Естественно, что в H ML были реализованы все разметки, связанные с выделением параграфов, шрифтов, стилей и т. п., т.к. реализация для eX подразумевала графический интерфейс. Важным компонентом языка стало описание встроенных и ассоциированных гипертекстовых ссылок, встроенной графики и обеспечение возможности поиска по ключевым словам. С момента разработки первой версии языка (H ML 1.0) прошло уже пять лет. За это время произошло довольно серьезное развитие языка. Почти вдвое увеличилось число элементов разметки, оформление документов все больше приближается к оформлению качественных печатных изданий, развиваются средства описания не текстовых информационных ресурсов и способы взаимодействия с прикладным программным обеспечением. Совершенствуется механизм разработки типовых стилей. Фактически, в настоящее время H ML развивается в сторону создания стандартного языка разработки интерфейсов как локальных, так и распределенных систем. Вторым краеугольным камнем WWW стала универсальная форма адресации информационных ресурсов. U iversal Resource Ide ifica io (URI) представляет собой довольно стройную систему, учитывающую опыт адресации и идентификации e-mail, Gopher, WAIS, el e , f p и т. п. E-mail (Elec ro ic mail) - электронная почта (простонародн. - электронный аналог обычной почты). Gopher - это интегратор возможностей I er e . Он в удобной форме позволяет пользоваться всеми услугами, предоставляемыми I er e . WAIS - диалоговая система с оконным интерфейсом для поиска данных по ключевым словам в контексте. el e имеет и свой собственный набор команд, которые управляют собственно этой программой, т.е. сеансом связи, его параметрами, открытием новых, закрытием и т.д.; эти команды подаются из командного режима el e , в который можно перейти, нажав так называемую escape-последовательность клавиш, которая вам сообщается при достижении удаленной машины. f p (File ra sfer Pro ocol) - протокол передачи файлов - протокол, определяющий правила передачи файлов с одного компьютера на другой. f p - также название программы из прикладного обеспечения. Использует протокол f p для того, чтобы пересылать файлы. Но реально из всего, что описано в URI, для организации баз данных в WWW требуется только U iversal Resource Loca or (URL). Без наличия этой спецификации вся мощь H ML оказалась бы бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к распределенным ресурсам сети. В URL можно адресовать как другие гипертекстовые документы формата H ML, так и ресурсы e-mail, el e , f p, Gopher, WAIS, например.

Различные интерфейсные программы по разному осуществляют доступ к этим ресурсам. Одни, как например e scape, сами способны поддерживать взаимодействие по протоколам, отличным от протокола H P, базового для WWW, другие, как например Chimera, вызывают для этой цели внешние программы. Однако, даже в первом случае, базовой формой представления отображаемой информации является H ML, а ссылки на другие ресурсы имеют форму URL. Следует отметить, что программы обработки электронной почты в формате MIME также имеют возможность отображать документы, представленные в формате H ML. Для этой цели в MIME зарезервирован тип " ex /h ml". Третьим в списке стоит протокол обмена данными в World Wide Web - Hyper ex ra sfer Pro ocol. Данный протокол предназначен для обмена гипертекстовыми документами и учитывает специфику такого обмена. Так в процессе взаимодействия, клиент может получить новый адрес ресурса на сети (reloca io ), запросить встроенную графику, принять и передать параметры и т. п. Управление в H P реализовано в виде ASCII-команд. Реально разработчик гипертекстовой базы данных сталкивается с элементами протокола только при использовании внешних расчетных программ или при доступе к внешним относительно WWW информационным ресурсам, например базам данных. Последняя составляющая технологии WWW - это уже плод работы группы CSA - спецификация Commo Ga eway I erface. CGI была специально разработана для расширения возможностей WWW за счет подключения всевозможного внешнего программного обеспечения. Такой подход логично продолжал принцип публичности и простоты разработки и наращивания возможностей WWW. Если команда CER предложила простой и быстрый способ разработки баз данных, то CSA развила этот принцип на разработку программных средств. Надо заметить, что в общедоступной библиотеке CER были модули, позволяющие программистам подключать свои программы к серверу H P, но это требовало использования этой библиотеки. Предложенный и описанный в CGI способ подключения не требовал дополнительных библиотек и буквально ошеломлял своей простотой. Сервер взаимодействовал с программами через стандартные потоки ввода/вывода, что упрощает программирование до предела. При реализации CGI чрезвычайно важное место заняли методы доступа, описанные в H P. И хотя реально используются только два из них (GE и POS ), опыт развития H ML показывает, что сообщество WWW ждет развития и CGI по мере усложнения задач, в которых будет использоваться WWW-технология. Архитектура WWW-технологии WWW построена по хорошо известной схеме "клиент-сервер". Программа-клиент выполняет функции интерфейса пользователя и обеспечивает доступ практически ко всем информационным ресурсам I er e . В этом смысле она выходит за обычные рамки работы клиента только с сервером определенного протокола, как это происходит в el e , например. Отчасти, довольно широко распространенное мнение, что Mosaic или e scape, которые безусловно являются WWW-клиентами, это просто графический интерфейс в I er e , является отчасти верным. Однако, как уже было отмечено, базовые компоненты WWW-технологии (H ML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и поэтому мультипротокольные клиенты должны быть отнесены именно к World Wide Web, а не к другим информационным технологиям I er e .

В условиях рыночной экономики, о которой мы в основном болтаем, выгода - не позор, а важнейший стимул общественного и экономического развития. Из всего сказанного следует, что сегодня вопрос о составе и реализации критических технологий и научно-технологического потенциала России не имеет простого и однозначного ответа. Да, в некоторых видах высоких технологий - авиакосмической, кораблестроении и т.д. - у нас есть неплохие перспективы. Однако в целом положение сложное. Необходимо еще раз рассмотреть перечень критических технологий, правильно оценить их состояние, но самое главное - обеспечить быстрое и эффективное внедрение в гражданское производство, способное дать максимальный коммерческий эффект. Именно здесь зарыта собака. "Внедрение" и "реализация" должны стать ключевыми понятиями при анализе критических технологий. Здесь есть над чем подумать, и вместо того, чтобы стонать, как птица Уер, следует сосредоточиться на двух вопросах: что делать и как делать, чтобы наука и критические технологии сами начали развиваться и стали мощным фактором, стимулирующим рост экономики и совершенствование социальной сферы? Ответить на эти вопросы я постараюсь в заключительной статье

Информационные и коммуникативные технологии успели прочно войти в повседневную жизнь: сегодня трудно представить себе рабочее место без компьютера и сопутствующей ему оргтехники, причем они могут быть связаны между собой не только в пределах какой-либо одной организации, но и с компьютерами, находящимися в любой точке земного шара (при наличии там интернета).  Постепенно границы между компьютерными и иными технологиями стираются:  

- с помощью компьютера можно принимать теле- и радиосигналы, смотреть видеозаписи, прослушивать CD-диски, звонить по телефону, отсылать и принимать факсы;    - доступ в интернет возможен не только через телефонный кабель, но и телевизионный, а также через спутник и даже через обычную электророзетку;   - с помощью компьютера и интернета можно покупать необходимые товары, не выходя из дома, причем делать заказ может не только человек, но и техника. Например, некоторые модели холодильников программируются таким образом, что, когда какие-нибудь продукты заканчиваются, они сами заказывают в интернет-магазине недостающее.  

Старые, проверенные технологии и средства коммуникации постепенно вытесняются новыми: кто еще 10 лет назад мог предположить, что мы фактически перестанем пользоваться печатными машинками или что общение будет осуществляться преимущественно по электронной, а не по столь привычной нам, традиционной, бумажной почте?    Эти изменения, неразрывно связанные с всеобщей политической, экономической и технологической глобализацией, не только создают новые проблемы, но и открывают новые возможности. Поэтому так важно понять закономерности их развития и научиться максимально эффективно использовать предоставляемые ими возможности.    Политики и экономисты ожидают очень многого от применения новых технологий в сфере образования: это и повышение качества образования при одновременном снижении его стоимости, и возможность индивидуального подхода к каждому ученику, и уменьшение числа персонала, и обучение работе на компьютере, и развитие навыка самостоятельного обучения и т.п. Появляется спрос – появляется и предложение: на сегодняшний день на рынке мультимедийной продукции можно найти достаточно много обучающих программ, в том числе и иностранным языкам.      Целесообразность использования компьютерных технологий при изучении иностранного языка.  Попробуем разобраться, насколько целесообразно использовать компьютерные технологии при изучении иностранных языков, какую пользу они принесут учащимся и преподавателям.    Конечно, данные вопросы сформулированы слишком общо. Что бы ответили преподаватели на вопрос, почему они используют на занятиях учебник? Возможно, они сказали бы, что учебник позволяет по доступной цене наглядно и доходчиво представить важную информацию. В то же время они, безусловно, стали бы работать далеко не с каждым учебником, отвечающим вышеуказанным требованиям, а только с теми, содержание и оформление которых соответствует преследуемым конкретной группой учащихся целям. И поменяли бы один учебник на другой скорее всего лишь в том случае, если бы он позволял проще и быстрее, чем прежний, достичь те или иные цели.    Так же и в случае с компьютерными обучающими программами: необходимо проверять их пригодность не вообще, а для каждого конкретного ученика или группы учеников. При оценке обучающей программы следует обратить внимание на ряд следующих вопросов.    Во-первых, могут ли преподаватели и ученики достичь с помощью компьютерной программы целей, недостижимых каким-либо другим способом?    Ответ на этот вопрос будет утвердительным в большинстве случаев уже потому, что появление компьютерных технологий породило новые цели в изучении иностранного языка: владение языком подразумевает и общение по электронной почте, и поиск информации в интернете.    Во-вторых, становится ли процесс изучения иностранного языка благодаря компьютерной программе проще и интересней?    Большинство учащихся позитивно расценивает тот факт, что с появлением интернета существенно возросла возможность общения с носителями языка, что, несомненно, дополнительно мотивирует учеников и в конечном итоге благотворно сказывается на их языковой подготовке. Кроме того, учащиеся могут найти в телевизионной программе, медиотеках, интернете материалы на интересующие их темы, что также способствует мотивации.    Преимуществом мультимедийных обучающих программ перед печатной продукцией является и то, что в них объединены сразу несколько каналов передачи информации (шрифт, иллюстрации, аудио- и видеоматериалы), что делает изучение иностранного языка интересней и эффективней (за счет одновременной активации нескольких каналов передачи информации). Многие обучающие программы содержат ссылки на разнообразные страницы в интернете, благодаря чему ученики получают актуальную информацию по тому или иному вопросу.    Для некоторых учащихся возможность использовать свое привычное средство работы – компьютер – и для изучения иностранного языка тоже становится веским аргументом в пользу мультимедийных обучающих программ.    К тому же такие программы, которые на протяжении всего учебного процесса предоставляют ученику дополнительную, вспомогательную информацию и комментарии к выполненным заданиям, открывают новые возможности для самостоятельного изучения иностранных языков.    Немаловажным вопросом является и то, облегчает ли преподавателям использование компьютерных программ подготовку к занятиям и их проведение?    Компьютерные технологии упрощают и ускоряют доступ как к аутентичным, так и к дидактизированным материалам, что позитивно сказывается на качестве самих занятий.    Все больше преподавателей убеждаются в том, что с помощью компьютера и соответствующих программ они могут существенно сократить время, затрачиваемое ими на подготовку дополнительных материалов и наглядных пособий.    Как мы смогли убедиться, применение мультимедиа и интернета для изучения иностранного языка имеет широкие перспективы.    Однако каждую мультимедийную прог  рамму, каждый коммуникационный проект в интернете необходимо проверить на соответствие современным требованиям дидактики, на целесообразное использование возможностей мультимедиа и, наконец, насколько конкретный продукт подходит для конкретного ученика/группы с позиции преследуемых учебных целей, методики обучения и технических требований.  Ответы на вышеперечисленные вопросы будут скорее всего разными, неоднозначными, так как целевая аудитория под названием «взрослые учащиеся» гораздо более разнородна, чем, например подростковая или детская. Практически по всем параметрам можно наблюдать расхождения: мотивации, цели, языковой подготовке, возрасту, количеству свободного времени для выполнения домашних заданий и т.д. Поэтому важно проверить, не приведет ли использование мультимедийного продукта к еще большей дифференциации в группе.  

Терминоведение и терминография

Терминология в широком понимании соотносится с областью всех терминов естественного языка, а в узком — связывается с терминами конкретной научной дисциплины или специальной области практической деятельности. В рамках одной теории термины образуюттерминосистемуТермины можно определить как слова (словосочетания) метаязыка на­уки и приложений научных дисциплин, а также слова, обозначающие специфические реалии областей конкретной практической деятельности человека. В последнем случае часто используют термин «номенклатура». Отсюда следует, что терминами не являются, например, формулы, мате­матические и символьные выражения различного рода, которые, конечно, входят в метаязык соответствующих наук, но которые нельзя рассматри­вать как часть всей лексики естественного языка. Впрочем, символы могут входить в термины, ср. μ-излучение. Иными словами, метаязык и терминосистема не являются синонимами. Большая часть терминов входит в лексику языка через соответствующие терминосистемы. Обычно понятие термина задается через его свойства, реализуемые в терминосистеме. В отличие от обычной лексики, использование тер­минов основывается не на интуиции, а на имеющихся определениях. В несколько меньшей степени это распространяется на номенклатурную составляющую терминосистем. Термину, как правило, сопоставляется одно значение; желательно, чтобы в терминосистеме отсутствовала омо­нимия терминов. Разумеется, это имеет характер тенденции, а не безо­говорочного правила; например, такие термины как функция, переменная в математике, физике, психологии, лингвистике могут иметь совершенно различные значения. Такая многозначность может характеризовать тер­мин и в рамках одной терминосистемы. Это особенно характерно для терминов гуманитарных наук, например, философии, филологии, исто­рии. Важной особенностью терминологии можно считать и отсутствие У этого слоя лексики экспрессивного компонента значения и стилисти­ческих характеристик, отличных от нейтрального или научного стилей. Термины часто детерминологизируются, теряют свой терминологичес­кий статус, становясь частью лексической системы литературного языка. Детерминологизация терминов может приводить к возникновению язы­ковых выражений с сильной экспрессией, ср. физический термин черная дыра и идиому черная дыра, возникшую на его основе: Термины не только могут терять свой терминологический статус, но и переходить из одной науки в другую. Этот процесс называетсяретерминологизацией. Например, математический термин переменная в контент-анализе (см. подробнее §4 главы 5) обозначает концепт, по­нятие, с точки зрения которого исследуется выбранная совокупность текстов. Например, переменной может оказаться оппозиция «СВОЙ— ЧУЖОЙ», если она становится в центр исследования при анализе корпуса текстов программ политических партий. В лингвистике терминология ж особая часть языковой системы изучается в терминоведении. Принципы построения специальных терми­нологических словарей разрабатываются в терминографии. К настоящему времени в мире насчитывается более 20 тыс. терми­нологических стандартов. Особые стандарты по организации терминоси-стем разрабатываются не только на государственном и международном уровнях, но и в отдельных компаниях и фирмах. В этих условиях уни­фикация терминов и терминосистем оказывается не только научной, но и практической, промышленной задачей. Многозначность терминов одной терминосистемы, омонимия, отсутствие согласования между близ­кими терминосистемами являются ощутимым препятствием для научно-технического прогресса и развития производства. Государство, проводя языковую политику, финансирует разработ­ку терминологических стандартов, обязательных для применения в тех или иных документах. Выпускаются сборники рекомендуемых для ис­пользования терминов. Разработка стандартов и формирование списков рекомендуемых терминов дает возмошость систематизировать термины определенной проблемной области, избежать многозначности и омони­мии, уточнить определения и т.д. Дли правильного проведения политики в области терминологии необходимо использование знаний о функциони­ровании языка. Характерным примером ошибочной языковой политики может служить переименование ^дарственной автоинспекции (ГАИ) в Государственную инспекцию безопасности дорожного движения. Сокра­щение нового названия — ГИБДД— не только труднопроизносимо, но и вызывает нежелательные ассоциации. Не случайно, что сейчас вме­сто аббревиатуры ГИБДД на машнж этой службы чаще используется сокращение ДПС — Дорожно- Патрульная Служба. Отсутствие квалифи­цированной лингвистической экспертизы приводит не только к трудно­произносимым сокращениям, но и к большим проблемам в разработке промышленных технологий. Важной частью терминоведчесюй деятельности является перевод научно-технической терминологии. Для облегчения перевода терминов разработаны некоторые рекомендации, формирующие основу работы переводчика-специалиста в сфере терминологии [Лейчик, Шелов 1989— 1990]. В идеальном случае перевод предполагает поиск эквивалента в язы­ке-цели — языке, на который осуществляется перевод. Например, не­мецкий термин Leitung передается русским термином управление. При отсутствии эквивалента в языке-цели новый термин может быть создан на основе уже имеющихся в нем других слов, близких по значению (ср. русское слово дерево получило развитие как термин теории упра­вления, теории классификации и информатики в словосочетаниях типа дерево целей). Возможно также семантическое калькирование (ср. tree structure идревовидная структура), структурное калькирование (ср. пе­ревод греческого термина philosophia как любомудрие) и простое заим­ствование(know-how и варваризм ноу-хау). Если и эти способы перевода оказываются по тем или иным причинам невозможными, то используется описательная конструкция, распространенный оборот-определение. Современные компьютерные технологии позволяют разрабатывать терминологические банки данных (ТБД) по различным областям знания и сферам практической деятельности. Необходимость автоматической обработки больших массивов терминологической информации сделало это направление работ в области терминологии чрезвычайно актуальным. По типу ТБД разделяются на переводческие (то есть, ориентированные на задачи перевода научно-технической терминологии) и информацион­но-нормативные, определяющие стандарты использования научно-тех­нической терминологии. В России существует несколько крупных ТБД, а частности, во ВНИИКИ — Научно-исследовательском институте ком­плексной информации по стандартизации и качеству. Крупнейшим в ми­ре является ТБД фирмы «Сименс», включающий около двух с половиной миллионов терминологических записей на восьми языках мира. Создание словарей специальных терминов — еще один существен­ный практический выход работ в области изучения и описания термино­логии. В научно-технической терминографии разрабатываются принципы формирования специальных словарей. По назначению и форме предста­вления словарной информации специальные словари могут быть разде­лены на словари, предназначенные для человека, и машинные словари, ориентированные на использование в компьютерных программах, напри­мер, для поддержки информационного поиска. Типы машинных словарей чрезвычайно разнообразны — это информационно-поисковые тезауру­сы, частотные словари, рубрикаторы, классификаторы и пр. Обычные, не машинные, специальные словари чаще всего бывают переводными словарями или толковыми словарями (о типах словарей см. подробнее предшествующий параграф данной главы). Большинство терминологиче­ских словарей являются дескриптивными. Их цель заключается в опи­сании состояния терминологии в терминосистеме на данный момент времени. ормативные терминологические (специальные) словари задают не­которую норму, стандарт использования терминов в данной проблемной области. Словарь-стандарт имеет официальный статус, он предписывает использование соответствующей терминологии в определенной термино-системе. В словаре-стандарте не только приводится сам корпус терми­нов, но и подробно описывается область, на которую распространяется стандарт. Словарная статья ел о варя-стандарта обязательно включает зо­ны «Термин» и «Определение». Приведем для иллюстрации фрагмент из ГОСТа «Коррозия металлов» по [Герд 1996]: