Динамические структуры данных. Обработка цепочек
Структуры данных являются важным понятием в информатике как науке, что находит свое выражение в описании любого языка программирования. Особенно это касается структурированных языков, каким является язык Паскаль. В этом языке сильно развит институт организации данных, причем для работы с этими данными имеются несколько типов данных и способов их включения в сложные структуры. Чаще всего переменные этих типов используются самостоятельно (обособленно), однако можно создавать на их основе другие типы данных более высокого уровня сложности, которые принято называть комбинированными. Мы уже знаем пример такого типа - RECORD, позволяющего объединить в единое целое данные практически всех указанных выше типов (поля записи имеют разный тип данных). Введение ссылочных переменных дает возможность усилить этот прием, а ссылки в сочетании с регулярными (массивами и типом STRING) и комбинированными (RECORD) типами позволяют образовать так называемые динамические структуры данных в виде цепочек, очередей, стеков, деков и пр. С понятием "цепочка" связано понятие строки - упорядоченной последовательности данных алфавита языка. Строка - самая универсальная структура данных, с ней связаны решения многих задач. Есть три классические задачи работы со строками: 1) поиск вхождения заданной литеры в строку; 2) вставка заданной литеры в указанное место строки; 3) исключение литеры из указанного места строки. Решение этих задач зависит от способа представления строки: 1) векторное представление; 2) представление строки в виде цепочки с использованием ссылочного и комбинированного типов. Сюда относятся типы STRING и символьный массив. Например, слово PASCAL можно представить двумя способами: VAR S1: STRING[6]; S2: ARRAY[1..6] OF CHAR. В этом случае S1[1]='P', S2[4]='C'. Итак, мы имеем непосредственный доступ к литере, и это удобно для решения первой задачи. Сложнее обстоит вопрос с решением задачи вставки элемента в строку (или удаления из строки). Например, в слово PASAL нужно вставить пропущенную букву C ® PASCAL. Здесь элементы, идущие за вставкой, увеличивают свои индексы, т.е. после вставки надо проводить переиндексацию программным путем. Такая же ситуация и при удалении элемента. При вставке и при удалении длина строки меняется. Следовательно, нужно заказывать длину объекта чуть больше реального и предусматривать указатель конца строки, например, знак "#". ПРИМЕР 6. Удаление в литерном векторе элемента, следующего за указанным индексом program UDAL; const N =... var ST: array[1..N] of char; K, IND: integer; begin {ввод строки, последний элемент = '#'} ¦................... ¦ writeln('индекс?'); read(IND); K:=IND+1; ¦ while ST[K]<>'#' do ¦ begin ST[K]:=ST[K+1]; K:=K+1; end; end. Эта задача решается гораздо проще, если представить литерный вектор с помощью типа STRING и применить процедуру DELETE, однако и здесь надо заранее заказывать длину вектора. При работе со строками важно понятие "следующий элемент". В векторном представлении оно тесно связано с местом расположения предыдущего элемента. В этом случае следующий элемент физически находится рядом с предыдущим (в соседней ячейке памяти). Однако, сплошное расположение строки в памяти не всегда удобно и эффективно. Переменные типа указатель позволяют реализовывать так называемые связанные структуры данных, среди которых наиболее распространены линейные списки - цепочки, где элемент вызывается с помощью указателя на предшествующий или последующий элементы. Эту ситуацию можно сравнить с очередью на прием к врачу: в приемной пациенты не обязательно сидят друг за другом, но каждый субъект (элемент списка) знает, за кем или перед кем он "стоит". При такой организации, если кто-то покидает очередь, то это не требует физического перемещения остальных: просто стоящий за ушедшим теперь запоминает другого человека (меняются ссылки). Геометрически это можно представить так:
Исключенный элемент можно использовать для других целей. С помощью ссылок легче вставить новую компоненту в цепочку данных. Для этого достаточно изменить две ссылки: вновь пришедший в очередь запоминает впередистоящего, а стоящий сзади теперь запоминает вновь пришедшего. Схематически это выглядит так:
Новый элемент при этом может быть размещен в любом свободном месте памяти. Итак, в цепочке для каждого элемента надо знать, где находится следующий. Чтобы реализовать эту идею, следует представить каждый элемент (звено) связанного списка (цепочки) в виде записи, состоящей из двух полей. В первом поле находится сам элемент (данное какого-то типа, в нашем случае - типа CHAR), второе содержит ссылку на следующее звено цепочки (тип - ссылка). Конец списка (цепочки) помечается указателем NIL, а начало формируется переменной типа указатель, содержащей ссылку на первый элемент списка. Пусть в памяти ЭВМ находится цепочка (строка) 'PASCAL', которая инициализируется (связывается) с переменной-ссылкой STR. Это можно представить в виде схемы:
1) CHAR - для обозначения самого элемента цепочки; 2) RECORD - для образования звеньев цепочки из двух полей; 3) ссылку (^) - для установления связи между звеньями. Обозначим тип ссылочной переменной через SVYAZ, а тип динамической переменной через ZVSTR (звено строки). Этот факт описывается следующим образом: type SVYAZ = ^ZVSTR. Говорят, что тип SVYAZ указывает (ссылается) на компоненты типа ZVSTR, или тип SVYAZ связан с типом ZVSTR. Чтобы объединить динамические переменные в цепочку, надо в каждой компоненте иметь ссылку на следующую. Исходя из этого, заключаем, что тип данных ZVSTR есть запись с двумя полями - полем символьного значения ELEM и полем ссылки SLED: type ZVSTR = record elem: char; sled: SVYAZ; end. Мы видим, что здесь при описании типов происходит перекрытие имен. Возникает вопрос, какой тип поставить первым и возможно ли это в принципе, ведь прежде чем упомянуть идентификатор, необходимо описать его тип. Однако правила языка Паскаль делают исключение при описании ссылок, поэтому допускается использование идентификатора ZVSTR до его описания: type SVYAZ = ^ZVSTR; ZVSTR = record elem: char; sled: SVYAZ; end. Теперь остается с помощью VAR ввести ссылочную переменную (в нашем примере STR), в которую нужно записать ссылку на первое звено цепочки. Следовательно, эта переменная также должна иметь тип SVYAZ. Итак, VAR STR: SVYAZ. С точки зрения техники программирования выход на цепочку осуществляется через его заглавное (нулевое) звено. Отсюда имеем: STR - ссылочная переменная, указывающая на первое звено; STR^- сама динамическая переменная; STR^.elem - поле символьного значения (информационное поле); STR^.sled - поле ссылки. ПРИМЕР 7. Схема образования цепочки динамических данных 1. Зарезервировать место в памяти для указателей 2. Зарезервировать место в памяти для значений динамических переменных и поместить их адреса в указатели UKZV и UKSTR: NEW(UKZV); NEW(UKSTR);
3. Заполнить поля ELEM значениями UKSTR^.ELEM:='P'; UKZV^.ELEM:='A':
4. Заполнить поля SLED значениями UKSTR^.SLED:=UKZV;
UKZV^.SLED:=NIL:
Это пример построения цепочки из двух звеньев. Если же звеньев много, то все следует делать в цикле. Рассмотрим пример образования и распечатки цепочки, состоящей из последовательности букв и заканчивающейся ".". Несколько предварительных соображений по данному примеру: 1) для ссылки на цепочку как единое целое введен указатель UKSTR; 2) для ссылки на очередное звено в цепочке введен указатель UKZV; 3) для продвижения по цепочке от одного звена к другому нужно текущему указателю UKZV присваивать в качестве значения ссылку на это следующее звено: UKZV:= UKZV^.SLED; 4) т.к. поле SLED имеет тип SVYAZ, т.е. ссылку на запись, то можно записать UKZV^.SLED^.SLED, что означает переход на звено, находящееся через звено от исходного; 5) при организации цепочки будем использовать "нулевое" (заглавное) звено, которое указывает на первое звено цепочки и не содержит никакого элемента. Так поступают для удобства обработки цепочки в цикле. ПРИМЕР 8. Формирование и распечатка цепочки символов program SOZDANIE_ZEPOCHKI; type SVYAZ = ^ZVSTR; ZVSTR = record elem: char; sled: SVYAZ; end; var UKSTR, UKZV: SVYAZ; SYM: char; begin { Создание головного (нулевого) звена } ¦ new(UKSTR); UKZV:= UKSTR; UKZV^.sled:= nil; ¦ read(SYM); ¦ { Создание всей цепочки} ¦ while SYM <> '.' do ¦ begin ¦ ¦ new(UKZV^.sled); UKZV:= UKZV^.sled; ¦ ¦ UKZV^.elem:= SYM; UKZV^.sled:= nil; ¦ ¦ read(SYM); ¦ end; ¦ UKZV:= UKSTR^.sled; writeln; {Печать цепочки} ¦ while UKZV <> nil do ¦ begin ¦ ¦ write(UKZV^.elem,' '); ¦ ¦ UKZV:= UKZV^.sled; ¦ end; end. ПРИМЕР 9. Процедура удаления из списка SP элемента, содержащего в качестве данных некоторую букву procedure UDALENIE_VNUTRI(var SP: SVYAZ; BUKVA: char); var ZV: SVYAZ; begin ¦ if SP = nil then writeln('Нет такого элемента!') else ¦ if SP^.elem <> BUKVA then UDALENIE(SP^.sled, BUKVA) ¦ else begin ZV:=SP; SP:=SP^.sled; ¦ dispose(ZV); end; end. ПОЯСНЕНИЕ. Данная процедура является рекурсивной. Выход из рекурсии осуществляется либо по нахождению и удалению соответствующей буквы, либо по достижению конца цепочки (обнаружение ссылки NIL). При удалении звена освобождается место в памяти с помощью DISPOSE. Последний пример показывает, что для удаления одного элемента из цепочки достаточно применение одного оператора: SP:= SP^.SLED. И это действительно так, ибо устранение звена не есть его "физическое" уничтожение, а переброска ссылки на следующее звено, как это показано на схеме
ПРИМЕР 10. Процедура удаления первого элемента цепочки procedure UDALENIE_NACHALO(var SP: SVYAZ); var Q: SVYAZ; begin ¦ if SP^.sled <> nil then ¦ begin ¦ ¦ Q:= SP; ¦ ¦ SP:= SP^.sled; ¦ ¦ dispose(Q); ¦ end ¦ else writeln('Список пуст!'); end. ПОЯСНЕНИЕ. Здесь введена вспомогательная переменная Q для временного хранения ссылки на удаляемое звено, прежде чем уничтожить его с помощью DISPOSE. Вставка нового звена в цепочку занимает уже больше операций, т.к. для этого надо сделать две переброски: одну - из предыдущего звена на новое, вторую - из нового на следующее звено. Кроме того, необходимо образовать само это звено. Названные операции видны в следующей процедуре. ПРИМЕР 11. Процедура вставки в список элемента, содержащего в качестве данных D, после элемента, содержащего X procedure VSTAVKA_VNUTRI(var SP: SVYAZ; X, D: char); var Q: SVYAZ; begin ¦ if SP = nil then writeln('Нет такого элемента!') ¦ else if SP^.elem <> X then VSTAVKA(SP^.sled,X,D) ¦ else begin ¦ ¦ new(Q); Q^.elem:= D; ¦ ¦ Q^.sled:= SP^.sled; SP^.sled:= Q end. end; ПОЯСНЕНИЕ. Как и в примере 9, данная процедура является рекурсивной и по ней производится сначала поиск по цепочке звена, содержащего элемент Х, а затем сама вставка (если такое звено найдено). ПРИМЕР 12. Процедура вставки звена в начало цепочки procedure VSTAVKA_NACHALO(var SP: SVYAZ; D: char); var Q: SVYAZ; begin new(Q); Q^.elem:= D; Q^.sled:= SP^.sled; SP^.sled:= Q
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (518)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |