Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции_C#.doc
Скачиваний:
38
Добавлен:
15.11.2018
Размер:
2.72 Mб
Скачать

10.3 Редактирование текста

Регулярные выражения могут эффективно использоваться для редактирования текста. Например, метод Replace класса Regex позволяет выполнять замену одного фрагмента текста другим или удаление фрагментов текста:

Пример 1. Изменение номеров телефонов:

static void Main(string[] args)

{

string text = @"Контакты в Москве tel:123-45-67, 123-34-56; fax:123-56-45.

Контакты в Саратове tel:12-34-56; fax:11-56-45";

Console.WriteLine("Старые данные\n"+text);

string newText=Regex.Replace(text, "123-", "890-");

Console.WriteLine("Новые данные\n" + newText);

}

Задание. Измените программу так, чтобы шестизначные номера заменялись на семизначные добавлением 0 после первых двух цифр. Например, номер 12-34-56 заменился бы на 120-34-56.

Пример 2. Удаление всех номеров телефонов из текста:

static void Main()

{

string text = @"Контакты в Москве tel:123-45-67, 123-34-56; fax:123-56-45.

Контакты в Саратове tel:12-34-56; fax:12-56-45";

Console.WriteLine("Старые данные\n"+text);

string newText=Regex.Replace(text, @"\d{2,3}(-\d\d){2}", "");

Console.WriteLine("Новые данные\n" + newText);

}

}

Задание. Измените программу так, чтобы из текста удалялись слова tel и fax (если после данных слов стоят двоеточия, то их тоже следует удалить).

Пример 3. Разбиение исходного текста на фрагменты:

static void Main()

{

string text = @"Контакты в Москве tel:123-45-67, 123-34-56; fax:123-56-45.

Контакты в Саратове tel:12-34-56; fax:12-56-45";

string []newText=Regex.Split(text,"[ ,.:;]+");

foreach( string a in newText)

Console.WriteLine(a);

}

Задание. Разместите текст на одной строке и посмотрите, как изменится вывод данных. Объясните результаты.

Самостоятельная работа

Класс Group позволяет группировать соответствия на основе синтаксиса регулярных выражений и представлять результаты действия одного группирующего выражения. Группирующее выражение именует группу и задает регулярное выражение. Любой фрагмент строки, удовлетворяющий этому регулярному выражению, будет добавлен в группу. Например, группу ip можно задать следующим выражением:

@"(?<ip>(\d|\.)+)\s"

В данной записи (? ) говорит о том, что начинает формироваться группа, <ip> определяет имя данной группы, а (\d|\.)+)\s определяет шаблон регулярного выражения, который будет связан с этой группой. Если при поиске фрагмент текста будет соответствовать данному шаблону, то этот фрагмент будет заноситься в группу ip.

Класс Match является производным от класса Group и имеет коллекцию Groups, которая содержит все группы, обнаруженные объектом Match. Создание и использование коллекции Groups и классов Group иллюстрируется следующим примером:

static void Main(string[] args)

{

string text = @"04:55:34 223.34.12.156 www.aaa.ru

04:59:55 213.134.112.56 www.bbb.cc.com

05:05:01 223.34.12.156 www.aaa.ru";

Regex theReg = new Regex(@"(?<time>(\d|\:)+)\s"+

@"(?<ip>(\d|\.)+)\s"+

@"(?<site>\S+)");

MatchCollection theMatches = theReg.Matches(text);

foreach (Match theMatch in theMatches)

{

if (theMatch.Length != 0)

{

Console.WriteLine("\ntheMatch: {0}", theMatch.ToString()); //1

Console.WriteLine("time: {0}", theMatch.Groups["time"]); //2

Console.WriteLine("ip: {0}", theMatch.Groups["ip"]); //3

Console.WriteLine("site: {0}", theMatch.Groups["site"]); //4

}

}

}

В этом примере строка 1 целиком выводит фрагмент текста совпавший с регулярным выражением, а строки 2-4, то только тот текст, который был помещен в конкретную группу

Практическое задание

  1. Шаблоны регулярных выражений для групп time, ip и site записаны в упрощенном виде. Преобразуйте их к такому виду, чтобы они соответствовали ограничениям, накладываемым на формат времени, ip-адреса и адреса web-сайта.

  2. Используя дополнительную литературу и Интернет, более подробно изучите работу с классом Group и коллекцией Groups класса Match

Лекция 11. Организация С#-системы ввода-вывода

С#-программы выполняют операции ввода-вывода посредством потоков, которые построены на иерархии классов. Поток (stream) - это абстракция, которая генерирует и принимает данные. С помощью потока можно читать данные из различных источников (клавиатура, файл) и записывать в различные источники (принтер, экран, файл). Несмотря на то, что потоки связываются с различными физическими устройствами, характер поведения всех потоков одинаков. Поэтому классы и методы ввода-вывода можно применить ко многим типам устройств.

На самом низком уровне иерархии потоков ввода-вывода находятся потоки, оперирующие байтами. Это объясняется тем, что многие устройства при выполнении операций ввода-вывода ориентированы на байты. Однако для человека привычнее оперировать символами, поэтому разработаны символьные потоки, которые фактически представляют собой оболочки, выполняющие преобразование байтовых потоков в символьные и наоборот. Кроме этого, реализованы потоки для работы с int-, double-, short- значениями, которые также представляют оболочку для байтовых потоков, но работают не с самими значениями, а с их внутренним представлением в виде двоичных кодов.

Центральную часть потоковой С#-системы занимает класс Stream пространства имен System.IO. Класс Stream представляет байтовый поток и является базовым для всех остальных потоковых классов. Из класса Stream выведены такие байтовые классы потоков как:

  1. FileStream - байтовый поток, разработанный для файлового ввода-вывода

  2. BufferedStream - заключает в оболочку байтовый поток и добавляет буферизацию, которая во многих случаях увеличивает производительность программы;

  3. MemoryStream - байтовый поток, который использует память для хранения данных.

Программист может вывести собственные потоковые классы. Однако для подавляющего большинства приложений достаточно встроенных потоков.

Подробно мы рассмотрим класс FileStream, классы StreamWriter и StreamReader, представляющие собой оболочки для класса FileStream и позволяющие преобразовывать байтовые потоки в символьные, а также классы BinaryWriter и BinaryReader, представляющие собой оболочки для класса FileStream и позволяющие преобразовывать байтовые потоки в двоичные для работы с int-, double-, short- и т.д. значениями.