Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
C++ для начинающих (Стенли Липпман) 3-е хххх.pdf
Скачиваний:
86
Добавлен:
30.05.2015
Размер:
5.92 Mб
Скачать

С++ для начинающих

249

Упражнение 6.1

Что лучше выбрать в следующих примерах: вектор, список или двустороннюю очередь? Или ни один из контейнеров не является предпочтительным?

1.Неизвестное заранее количество слов считывается из файла для генерации случайных предложений.

2.Считывается известное количество слов, которые вставляются в контейнер в алфавитном порядке.

3.Считывается неизвестное количество слов. Слова добавляются в конец контейнера, а удаляются всегда из начала.

4.Считывается неизвестное количество целых чисел. Числа сортируются и печатаются.

6.3. Как растет вектор?

Вектор может расти динамически. Как это происходит? Он должен выделить область памяти, достаточную для хранения всех элементов, скопировать в эту область все старые элементы и освободить ту память, в которой они содержались раньше. Если при этом элементы вектора являются объектами класса, то для каждого из них при таком копировании вызываются конструктор и деструктор. Поскольку у списка нет необходимости в таких дополнительных действиях при добавлении новых элементов, кажется очевидным, что ему проще поддерживать динамический рост контейнера. Однако на практике это не так. Давайте посмотрим почему.

Вектор может запрашивать память не под каждый новый элемент. Вместо этого она запрашивается с некоторым запасом, так что после очередного выделения вектор может поместить в себя некоторое количество элементов, не обращаясь за ней снова. (Каков размер этого запаса, зависит от реализации.) На практике такое свойство вектора обеспечивает значительное увеличение его эффективности, особенно для небольших объектов. Давайте рассмотрим некоторые примеры из реализации стандартной библиотеки С++ от компании Rogue Wave. Однако сначала определим разницу между размером и емкостью контейнера.

Емкость это максимальное количество элементов, которое может вместить контейнер без дополнительного выделения памяти. (Емкостью обладают только те контейнеры, в которых элементы хранятся в непрерывной области памяти, – vector, deque и string. Для контейнера list это понятие не определено.) Емкость может быть получена с помощью функции capacity(). Размер это реальное количество элементов, хранящихся в данный момент в контейнере. Размер можно получить с помощью функции size(). Например:

С++ для начинающих

250

 

 

#include <vector>

 

 

 

 

 

 

#include <iostream>

 

 

 

int main()

 

 

 

{

 

 

 

vector< int > ivec;

 

 

 

cout << "ivec: размер: " << ivec.size()

 

 

 

<< " емкость: " << ivec.capacity() << endl;

 

 

 

for ( int ix = 0; -ix < 24; ++ix ) {

 

 

 

ivec.push_back( ix );

 

 

 

cout << "ivec: размер: " << ivec.size()

 

 

 

<< " емкость: " << ivec.capacity() << endl;

 

 

 

}

 

 

 

}

 

 

 

 

 

 

 

В реализации Rogue Wave и размер, и емкость ivec сразу после определения равны 0.

 

После вставки первого элемента размер становится равным 1, а емкость – 256. Это

 

значит, что до первого дополнительного выделения памяти в ivec можно вставить 256

 

элементов. При добавлении 256-го элемента вектор должен увеличиться: выделить

 

память объемом в два раза больше текущей емкости, скопировать в нее старые элементы

 

и освободить прежнюю память. Обратите внимание: чем больше и сложнее тип данных

 

элементов, тем менее эффективен вектор в сравнении со списком. В таблице 6.1 показана

 

зависимость начальной емкости вектора от используемого типа данных.

 

Таблица 6.1. Размер и емкость для различных типов данных

Тип данных

Размер

Емкость после

 

в байтах

первой вставки

 

 

 

int

4

256

double

8

128

простой класс #1

12

85

string

12

85

большой простой класс

8000

1

большой сложный класс

8000

1

Итак, в реализации Rogue Wave при первой вставке выделяется точно или примерно 1024 байта. После каждого дополнительного выделения памяти емкость удваивается. Для типа данных, имеющего большой размер, емкость мала, и увеличение памяти с копированием старых элементов происходит часто, вызывая потерю эффективности. (Говоря о сложных классах, мы имеем в виду класс, обладающий копирующим конструктором и операцией присваивания.) В таблице 6.2 показано время в секундах, необходимое для вставки десяти миллионов элементов разного типа в список и в вектор. Таблица 6.3 показывает время, требуемое для вставки 10 000 элементов (вставка элементов большего размера оказалась слишком медленной).

Таблица 6.2. Время в секундах для вставки 10 000 000 элементов

Тип данных

List

Vector

 

 

 

int

10.38

3.76

С++ для начинающих

 

 

 

 

251

 

 

double

 

10.72

 

 

3.95

 

 

 

 

 

 

 

 

 

 

простой класс

 

12.31

 

 

5.89

 

 

 

 

 

string

 

14.42

 

 

11.80

 

 

 

Таблица 6.3. Время в секундах для вставки 10 000 элементов

 

 

 

 

 

 

 

 

 

 

Тип данных

 

 

List

 

 

Vector

 

 

 

 

 

 

 

 

 

 

 

большой простой класс

 

0.36

 

2.23

 

 

 

 

большой сложный класс

 

2.37

 

6.70

 

 

 

Отсюда следует, что вектор лучше подходит для типов данных малого размера, нежели список, и наоборот. Эта разница объясняется необходимостью выделения памяти и копирования в нее старых элементов. Однако размер данных не единственный фактор, влияющий на эффективность. Сложность типа данных также ухудшает результат. Почему?

Вставка элемента как в список, так и в вектор, требует вызова копирующего конструктора, если он определен. (Копирующий конструктор инициализирует один объект значением другого. В разделе 2.2 приводится начальная информация, а в разделе 14.5 о таких конструкторах рассказывается подробно). Это и объясняет различие в поведении простых и сложных объектов при вставке в контейнер. Объекты простого класса вставляются побитовым копированием (биты одного объекта пересылаются в биты другого), а для строк и сложных классов это производится вызовом копирующего конструктора.

Вектор должен вызывать их для каждого элемента при перераспределении памяти. Более того, освобождение памяти требует работы деструкторов для всех элементов (понятие деструктора вводится в разделе 2.2). Чем чаще происходит перераспределение памяти,

тем больше времени тратится на эти дополнительные вызовы конструкторов и деструкторов.

Конечно, одним из решений может быть переход от вектора к списку, когда эффективность вектора становится слишком низкой. Другое, более предпочтительное решение состоит в том, чтобы хранить в векторе не объекты сложного класса, а указатели на них. Такая замена позволяет уменьшить затраты времени на 10 000 вставок с 6.70 секунд до 0.82 секунды. Почему? Емкость возросла с 1 до 256, что существенно снизило частоту перераспределения памяти. Кроме того, копирующий конструктор и деструктор

не вызываются больше для каждого элемента при копировании прежнего содержимого вектора.

Функция reserve() позволяет программисту явно задать емкость контейнера11.

int main() {

vector< string > svec;

svec.reserve( 32 ); // задает емкость равной 32 // ...

Например:

11 Отметим, что deque не поддерживает операцию reserve()

С++ для начинающих

252

}

svec получает емкость 32 при размере 0. Однако эксперименты показали, что любое изменение начальной емкости для вектора, у которого она по умолчанию отлична от 1, ведет к снижению производительности. Так, для векторов типа string и double увеличение емкости с помощью reserve() дало худшие показатели. С другой стороны,

увеличение емкости для больших сложных типов дает значительный рост производительности, как показано в таблице 6.4.

Таблица 6.4. Время в секундах для вставки 10 000 элементов при различной емкости*

Емкость

Время в секундах

 

 

1 по умолчанию

670

4,096

555

8,192

444

10,000

222

*Сложный класс размером 8000 байт с

конструктором копирования и деструктором

В нашей системе текстового поиска для хранения объектов типа string мы будем использовать вектор, не меняя его емкости по умолчанию. Наши измерения показали, что производительность вектора в данном случае лучше, чем у списка. Но прежде чем приступать к реализации, посмотрим, как определяется объект контейнерного типа.

Упражнение 6.2

Объясните разницу между размером и емкостью контейнера. Почему понятие емкости необходимо для контейнера, содержащего элементы в непрерывной области памяти, и не нужно для списка?

Упражнение 6.3

Почему большие сложные объекты удобнее хранить в контейнере в виде указателей на них, а для коллекции целых чисел применение указателей снижает эффективность?

Упражнение 6.4

Объясните, какой из типов контейнера вектор или список больше подходит для приведенных примеров (во всех случаях происходит вставка неизвестного заранее числа элементов):.

(a)Целые числа

(b)Указатели на большие сложные объекты

(c)Большие сложные объекты

6.4. Как определить последовательный контейнер?

Для того чтобы определить объект контейнерного типа, необходимо сначала включить соответствующий заголовочный файл:

С++ для начинающих

253

#include <vector> #inclnde <list> #include <deque> #include <map>

#include <set>

Определение контейнера начинается именем его типа, за которым в угловых скобках

vector< string > svec;

следует тип данных его элементов12. Например:

list< int >

ilist;

Переменная svec определяется как вектор, способный содержать элементы типа string, а ilist как список с элементами типа int. Оба контейнера при таком определении

if ( svec.empty() != true )

пусты. Чтобы убедиться в этом, можно вызвать функцию-член empty():

; // что-то не так

Простейший метод вставки элементов использование функции-члена push_back(),

string text_word;

while ( cin >> text_word )

которая добавляет элементы в конец контейнера. Например: svec.push_back( text_word );

Здесь строки из стандартного ввода считываются в переменную text_word, и затем копия каждой строки добавляется в контейнер svec с помощью push_back().

Список имеет функцию-член push_front(), которая добавляет элемент в его начало. Пусть есть следующий массив:

int ia[ 4 ] = { 0, 1, 2, 3 };

12 Существующие на сегодняшний день реализации не поддерживают шаблоны с параметрами по умолчанию. Второй параметр – allocator – инкапсулирует способы выделения и освобождения памяти. В С++ он имеет значение по умолчанию, и его задавать не обязательно. Стандартная реализация использует операторы new и delete. Применение распределителя памяти преследует две цели: упростить реализацию контейнеров путем отделения всех деталей, касающихся работы с памятью, и позволить программисту при желании реализовать собственную стратегию выделения памяти. Определения объектов для компилятора, не поддерживающего значения по умолчанию параметров шаблонов, выглядят следующим образом:

vector< string, allocator > svec;

list< int, allocator >

ilist;

С++ для начинающих

254

for ( int ix=0; ix<4; ++ix )

Использование push_back() ilist.push_back( ia[ ix ] );

for ( int ix=0; ix<4; ++ix )

создаст последовательность 0, 1, 2, 3, а push_front() ilist.push_front( ia[ ix ] );

создаст последовательность 3, 2, 1, 0. 13

Мы можем при создании явно указать размер массива как константным, так и

#include <list> #include <vector> #include <string>

extern int get_word_count( string file_name ); const int list_size = 64;

list< int > ilist( list_size );

неконстантным выражением:

vector< string > svec(get_word_count(string("Chimera")));

Каждый элемент контейнера инициализируется значением по умолчанию, соответствующим типу данных. Для int это 0. Для строкового типа вызывается конструктор по умолчанию класса string.

list< int > ilist( list_size, -1 );

Мы можем указать начальное значение всех элементов: vector< string > svec( 24, "pooh" );

Разрешается не только задавать начальный размер контейнера, но и впоследствии изменять его с помощью функции-члена resize(). Например:

svec.resize( 2 * svec.size() );

Размер svec в этом примере удваивается. Каждый новый элемент получает значение по умолчанию. Если мы хотим инициализировать его каким-то другим значением, то оно указывается вторым параметром функции-члена resize():

13 Если функция-член push_front() используется часто, следует применять тип deque, а не vector: в deque эта операция реализована наиболее эффективно.

С++ для начинающих

255

// каждый новый элемент получает значение "piglet"

svec.resize( 2 * svec.size(), "piglet" );

Кстати, какова наиболее вероятная емкость svec при определении, если его начальный размер равен 24? Правильно, 24! В общем случае минимальная емкость вектора равна его текущему размеру. При удвоении размера емкость, как правило, тоже удваивается

vector< string > svec2( svec );

Мы можем инициализировать новый контейнер с помощью существующего. Например: list< int > ilist2( ilist ) ;

Каждый контейнер поддерживает полный набор операций сравнения: равенство, неравенство, меньше, больше, меньше или равно, больше или равно. Сопоставляются попарно все элементы контейнера. Если они равны и размеры контейнеров одинаковы, то эти контейнеры равны; в противном случае не равны. Результат операций большеили меньшеопределяется сравнением первых двух неравных элементов. Вот что печатает программа, сравнивающая пять векторов:

ivecl: 1 3 5 7 9 12 ivec2: 0 1 1 2 3 5 8 13 ivec3: 1 3 9

ivec4: 1 3 5 7 ivec5: 2 4

//первый неравный элемент: 1, О

//ivecl больше чем ivec2

ivecl < ivec2 //false ivec2 < ivecl //true

//первый неравный элемент: 5, 9 ivecl < ivec3 //true

//все элементы равны, но ivec4 содержит меньше элементов

//следовательно, ivec4 меньше, чем ivecl

ivecl < ivec4 //false

// первый неравный элемент: 1, 2 ivecl < ivec5 //true

ivecl == ivecl //true ivecl == ivec4 //false ivecl != ivec4 //true

ivecl > ivec2 //true ivec3 > ivecl //true ivec5 > ivec2 //true

Существуют три ограничения на тип элементов контейнера (практически это касается только пользовательских классов). Для должны быть определены:

операция равно”;

операция меньше” (все операции сравнения контейнеров, о которых говорилось выше, используют только эти две операции сравнения);

значение по умолчанию (для класса это означает наличие конструктора по умолчанию).

С++ для начинающих

256

Все предопределенные типы данных, включая указатели и классы из стандартной библиотеки С++ удовлетворяют этим требованиям.

Упражнение 6.5

#include <string> #include <vector> #include <iostream>

#int main()

{

vector<string> svec; svec.reserve( 1024 );

string text_word;

while ( cin >> text_word ) svec.push_back( text_word );

svec.resize( svec.size()+svec.size()/2 );

// ...

Объясните, что делает данная программа:

}

Упражнение 6.6

Может ли емкость контейнера быть меньше его размера? Желательно ли, чтобы емкость была равна размеру: изначально или после вставки элемента? Почему?

Упражнение 6.7

Если программа из упражнения 6.5 прочитает 256 слов, то какова наиболее вероятная емкость контейнера после изменения размера? А если она считает 512 слов? 1000? 1048?

Упражнение 6.8

Какие из данных классов не могут храниться в векторе: