- •2. Становлению новых компьютерных технологий способствовали достижения в области технического, программного и информационного обеспечения.
- •10. Порождение (построение) нового текста
- •2. По изменчивости:
- •3. По полноте:
- •4. По предметной области
- •3. Эмпирико-теоретические
- •2. Процесс обработки инфы очень сложен. Человек постоянно участвует во всевозможных процессах. Информационные процессы протекают не только в человеческом обществе, но и в растительном и животном мире.
- •1. Разомкнутые ис – системы, в которых получаемая потребителем инфа используется произвольно, а после получения инфы от потребителя в систему ничего не поступает.
- •3. Моделирование как основной метод решения задач в области ис
- •4. Общие принципы решения лингвистических задач методом моделирования
- •4. В 1 000 000 раз увеличилось быстродействие компьютера, вырос объем памяти
- •2. Устройства вывода – устройства для вывода инфы из памяти компьютера пользователю.
- •1. Матричные – это принтеры, у которых печатающая головка состоит из иголок – матрицы. Через красящую ленту отпечатываются символы. Низкое качество печати (банки, сберкассы)
- •3) Лазерные – позволяют достичь высокого качества печати. Технология - частички порошка (тонера) под воздействием луча лазера, высокой температуры вплавляются в лист бумаги.
- •4) Сублимационные – используются в полиграфии. Позволяют получить фотографическое качество печати.
- •1. Односторонние однослойные 4,7 Гб
- •2. Однослойные двусторонние 9,4 Гб
- •3. Односторонние двухслойные 8,5 Гб
- •4. Двусторонние двухслойные 17 Гб
- •1 Микропроцессор создан в 1971 г. Фирма Intel, 4-х разрядный, 75 кГц, 60 тысяч операций в сек, постоянно совершенствовался.
- •2007 Г. – более 2 млрд. Транзисторов
- •3) По совместимости
- •Ibm pc Intel используют в бизнесе для обработки текстов, для работы с большими базами данных, изначально предназначались для обмена инфой, телекоммуникаций
- •3. Назначение и основные функции прикладных программ
- •4. Прикладные инструментальные средства
- •5. Понятие о виртуальной реальности
- •2. Системное по – все по, которое используется для работы и обслуживания компа.
- •1. Автономные операционные системы - а отдельном компе могут работать
- •2. Сетевые, которые используются при создании сети. По архитектуре: - клиент – клиент, где все компы равноценны и выполняют одинаковые функции
- •3 Условия:
- •1. Компьютерная сеть – совокупность компов, которые могут осуществлять информационное взаимодействие друг с другом через линии связи.
- •1982 Г. – сеть стала международной
- •Ip добавляет к каждой порции служебную инфу с адресами отправителя и получателя и обеспечивает доставку всех пакетов.
- •1. Www (world wide web) совокупность взаимосвязанных гипермедийных документов
- •3. Telnet – система для удаленного управления компом
- •Internet как средство обмена информации:
- •1. Автоматическое чтение текста
- •1. Целостность – объект описывается как целое с помощью значимых элементов и отношений между ними.
- •1. Подготовительный – референт читает текст, пытается понять и осмыслить документ в целом
- •1. Комп по каждому абзацу текста составляет алфавитно-частотный словарь
- •3. Машинный (автоматический) перевод
- •1. Информативный – грубый, пословный перевод, достаточный для поверхностного ознакомления с содержанием текста
- •1. Кратко изложить его содержание (аннотация, реферат)
- •1. Знания о языке, на котором написан текст
- •1. Стратегического (должно быть принято решение, что писать)
- •1. Ввод новой записи
- •1. Письменный лексикон
- •2. Письменные текстовые массивы
- •3. Фонетические лингвистические ресурсы
- •1. Письменный лексикон представлен одноязычными и многоязычными лексиконами (словарями). В многоязычных словарях дается перевод значения исходного языка на один или несколько иностранных языков.
- •3D графика позволила археологам воссоздать древние умершие города. Палеонтологам - увидеть вымерших животных.
- •2. Пк на базе молекул дик
- •3. Квантовые пк еще более компактное устройство, у которого в качестве битов выступают квантовые объекты (кубиты).
1. Подготовительный – референт читает текст, пытается понять и осмыслить документ в целом
2. аналитический – референт делит текст на фрагменты, каждый фрагмент изучает и выделяет в нем основные смысловые единицы. Строится план будущего реферата.
3. этап построения реферата – выделенные ранее смысловые единицы, их комбинации располагаются в единый вторичный текст в соответствии с планом реферата.
Основные смысловые единицы
- ключевые слова – термины, относящиеся к основному содержанию текста и повторяющиеся в нем несколько раз
- ключевые словосочетания – сочетания слов, среди которых есть ключевые слова
- ключевые предложения – предложения, содержащие два и более ключевых слов
В качестве смысловых единиц реферата могут быть:
1. полное (без изменения) ключевое предложение исходного текста
2. перефразированное ключевое предложение
3. предложение, составленное из ключевых слов или словосочетаний с помощью связующих элементов
4. предложение, обобщающее несколько предложений исходного текста, не обязательно ключевых
Смысловыми единицами аннотации могут быть:
1. ключевые слова или словосочетания исходного текста с предшествующими им словами-реляторами (заранее заготовленные слова)
2. специальные предложения исходного текста, содержащие оценочные элементы («рассматривается важная проблема», «ставится задача»)
Комп должен уметь:
1. находить в тексте ключевые слова, словосочетания, предложения
2. находить в тексте менее значимые единицы
3. составлять из текстовых единиц (ключевых слов, словосочетаний) смысловые единицы реферата
4. составлять предложения – текст реферата
Рефераты – в табличном/текстовом виде.
Ключевые слова и словосочетания используются компьютером для построения табличных рефератов.
Методы автоматического реферирования и аннотирования текстов:
- статистический – где ключевое слово – знаменательное слово текста, которое с учетом всех его синонимов встречается в тексте наибольшее число раз. Ключевое предложение – предложение, где два и более ключевых слов.
Принадлежность слова, словосочетания к числу ключевых определяется специальным статистическим коэффициентом.
- позиционный – где ключевое предложение – это предложение, входящее в заголовок, подзаголовок, начало и конец некоторого фрагмента текста
- логико-семантический – где ключевое предложение – это предложение с наибольшим функциональным весом, на величину которого влияют разные факторы (связь с левым и правым предложениями, наличие в предложении семантически значимых слов)
Составление реферата (аннотации) статистическим методом
Используя для выделения ключевых слов текста, один из вариантов статистического метода = F*m / N*n
F – частота употребления слова в тексте
m – число абзацев, в которых встретилось слово
N – число слов в тексте
n – число абзацев в тексте
а) Составить алгоритм, позволяющий получить аннотацию текста в виде релятора со следующими за ним ключевыми словосочетаниями текста. Ключевым словосочетанием – ключ, имя существительное со стоящими перед ним определением, выраженным именем прилагательным или причастием, не относящихся к числу общеупотребительных.
б) словесный реферат текста в виде последовательной цепочки ключевых предложений. Ключевым считается предложение, содержащее три и более ключевых слов.
Словоупотребление – это цепочка символов, заключенных между двумя знаками пробелов. Словоупотребление, находящееся вне текста (предложения) является словоформой.
Несколько словоформ, имеющие одинаково лексическое значение образуют слово (лексему). Цепочка словоупотреблений между двумя знаками конца предложения – предложение.
Алгоритм решения задачи