Тема 4. Терминологические банки данных
Отечественная терминоведческая школа развивает следующие направления практической деятельности: лексикографическая терминологическая деятельность; унификация терминов и термино- систем, включающая в себя три вида - упорядочение, стандартизацию и гармонизацию терминов; работа редактора над терминами (терминологическое редактирование); перевод терминов в рамках перевода научных, технических и иных специальных текстов; создание терминологических банков данных (ТБД); организационно- методическая (научно-организационная) деятельность терминологических органов и центров на разных уровнях - от отраслевого до международного.
Механизация и автоматизация терминологической работы в сочетании с традиционными методами обработки текстов научной и технической литературы и документации обеспечили создание ТБД - систем, в которых сбор, хранение, обработка и выдача терминологических данных выполняется с помощью компьютера. Все это должно осуществляться в наиболее короткие сроки с наименьшим поисковым шумом и при наиболее низкой стоимости.
Необходимость автоматической обработки и структурной организации больших массивов терминологической информации сделало это направление работ в области терминологии чрезвычайно актуальным. Оно выросло из работ по формированию терминологических картотек и связано с быстрым ростом количества
научных, технических, экономических и других терминов и невозможностью вручную обрабатывать огромные объемы терминологической информации. В России и за рубежом созданы многочисленные ТБД - автоматизированные хранилища терминов; при этом каждый термин в ТБД снабжен дополнительной информацией: указывается, в частности, каково значение термина, то есть приводится определение, даются эквиваленты термина на других языках, краткие формы термина, его синонимы, допустимые и недопустимые, сообщается, каким документом утвержден термин, и т. д.
В ТБД в принципе могут быть введены самые разные сведения о словах-терминах, в том числе и такие как указания на часть речи, происхождение слова, употребительность в текстах. ТБД, выдавая сведения о термине как о слове, о всех его текстовых употреблениях, в силу самой природы термина представляет сведения и о понятии. ТБД выдает: 1) весь текст работы какого-нибудь автора; 2) все тексты (фрагменты текстов) по какой-нибудь проблеме; 3) от- ^ :дельные конкретные термины; 4) весь словник текста; 5) частот- ч! ный словарь текста (текстов); 6) сведения о наличии или отсутст- ^ вии рисунков, схем; 7) сведения о встречаемости терминов в тек- сте.
ч^ч В зависимости от цели создания ТБД их можно разделить на
две группы:
а) ориентированные на обеспечение работ по переводу научно- технической литературы и документации;
б) предназначенные для обеспечения информацией о стандартизованной и рекомендованной терминологии.
ТБД обладают огромным потенциалом развития, из автоматизированных хранилищ они превращаются в средство проведения серьезных научных исследований, не говоря уже о том, что они имеют большое практическое значение. Это системы с удобным доступом, содержащие все сведения о термине и ликвидирующие неравномерность описания терминологии. ТБД обладают наибольшими возможностями для автоматизации создания словарей с позиции терминологической лексикографии.
В отечественной практике ТБД решают следующие научные задачи: моделирование терминологической системы русского языка как системы подсистем; построение общенаучно й общетеоретических тезаурусов; исследование русской терминологии. К
областям широкого использования ТБД можно отнести: справочно- информационное обслуживание специалистов различных областей знания; обеспечение традиционного перевода научно-технической литературы; обеспечение систем машинного перевода; лингвистическое обеспечение автоматизированных систем информации; обеспечение работ по упорядочению терминологии; подготовку и издание терминологических словарей; унификацию определенных терминов; подготовку научных отчетов о составе русского языка.
Структуру ТБД можно разделить на организационную и функциональную.
Организационная структура ТБД: терминологические центры, службы переводов (переводческая функция), службы стандартизации (нормативная функция), университеты (исследовательская функция), всероссийские органы научно-технической информации.
Функциональная структура ТБД представлена следующим образом:
Головной ТБД (ГТБД) - справочно-поисковый аппарат по видовым банкам данных: ведение коммуникативного формата данных; организация и руководство работами по передаче данных в ТБД; обработка и ввод данных; обслуживание предприятий.
Специализированные ТБД (СТБД) могут включать существующие ТБД, словарно-терминологические службы научно- технической информации: отбор представительного массива источников; ввод и обновление терминологической информации в банк данных; передача информации другим СТБД и ГТБД; эксплуатация СТБД в соответствии с конкретными задачами организации.
ТБД состоит из ряда массивов, которые называются подфон- дами. К ним относятся: подфонды специальных и межотраслевых терминов, фигурирующих в отдельных отраслях знаний и деятельности, общенаучных и общетехнических терминов, а также терми- ноэлементов (используются в нескольких терминосистемах).
'Герминологи составляют одно- или многоязычные терминологические банки данных, в первую очередь, на крупных предприятиях, в учреждениях и специализированных организациях. Терминологический банк данных содержит все необходимые для работы крупного предприятия или учреждения специфически специализированные расширенные понятия, которым даны определения. В настоящее время создаются терминологические банки данных по различным областям знания и сферам практической деятельности.
Разрабатываемые в настоящее время многоязычные банки терминологических данных должны стать средством фиксации международных решений по упорядочению семантики терминов и установлению межъязыковых терминологических соответствий. Такие банки данных позволяют накапливать и хранить информацию о лингвистических и логических особенностях терминов, их употреблении, многоязычных эквивалентах и степени упорядочения.
В настоящее время в разных странах существует несколько десятков крупных ТБД. В России крупнейшие ТБД находятся во Всероссийском научно-исследовательском институте комплексной информации по стандартизации и качеству (ВНИИКИ), а также во Всероссийском институте научной и технической информации (ВИНИТИ). Одним из самых больших в мире является ТБД германской фирмы "Siemens", который содержит более 2,5 млн. терминологических записей на 8 языках мира, в том числе на русском. В Германии ТБД функционируют в Институте стандартизации и в других органах управления. В Люксембурге в терминологическом бюро Комиссии Европейского союза создан крупнейший международный ТБД на нескольких языках; он носит название«Eurodi- cautom». Терминологический банк данных создан во французской организации по стандартизации, активно функционируют ТБД в Канаде, Швеции, Бельгии и других странах.