Единицы представления, измерения и хранения данных

Структура данных

Р

абота с большими наборами данных проще, если они образуют упорядоченную структуру. Существуют три основных типа структур данных: линейная, табличная и иерархическая. Они различаются методом адресации к данным.

Линейные структуры данных (списки) – это упорядоченные структуры, в которых адрес каждого элемента однозначно определяется своим номером в списке. Разделителем между элементами списка может быть конец строки, пробел или какой-либо другой специальный символ. Примером линейной структуры данных может служить список студентов в журнале посещаемости занятий.

Если все элементы списка имеют одинаковую длину, то разделители вообще не нужны. Такие упрощенные списки называются векторами данных. Работать с ними особенно удобно.

Табличные структуры данных – это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая этот элемент. Примером может служить таблица умножения. Если все элементы имеют равную длину, то такие таблицы называются матрицами. В этом случае разделители можно не использовать. Если число измерений в таблице больше двух, то такая таблица называется многомерной.

Приведем пример таблицы с размерностью, равной четырем.

Номер факультета:
Номер курса:
Номер группы:
Номер студента в группе:

С помощью такой таблицы может быть организован учет студентов. Для отыскания данных о студенте в подобной структуре надо знать все четыре параметра.

Иерархические структуры данных – это структуры в виде дерева, в котором адрес каждого элемента определяется указанием пути (маршрута), ведущим от вершины структуры к данному элементу. Вот, например, как выглядит путь к команде, запускающей программу Калькулятор.

Пуск®Все программы®Стандартные®Калькулятор

Файловые структуры данных – это иерархические структуры хранения файлов на диске в специальных областях памяти, называемых каталогами (или папками). В отдельном файле хранятся данные одного типа. Уникальность имени файла обеспечивается тем, что полное имя файла (полный адрес) включает в себя собственное имя файла и путь доступа к нему.

Например, следующие два файла имеют одно и то же собственное имя (выделено курсивом), но отличаются полными именами, так как имеют разные пути доступа.

D:\Мои документы\Группа 251\Статистика\Гистограммы.xls

D:\Мои документы\Excel 253\Гистограммы.xls

Обработка данных

О

бработка данных включает в себя множество различных процедур, полный список которых составить практически невозможно. К числу основных можно отнести следующие процедуры.

Сбор данных – накопление информации с целью обеспечения достаточной полноты для принятия решений.

Формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить уровень их доступности.

Преобразование данных – перевод данных из одной формы или структуры в другую форму или структуру соответственно. Необходимость преобразования данных, например, возникает при транспортировке цифровых потоков данных по каналам телефонной сети, которые изначально ориентированы на передачу аналоговых сигналов. Для преобразования цифровых данных в аналоговые сигналы используются специальные устройства – модемы.

Фильтрация данных – отсеивание «лишних» данных. При этом уменьшается «уровень шума», а достоверность и адекватность данных возрастает.

Сортировка данных – упорядочение данных с целью повышения доступности информации.

Архивация данных – специальная организация хранения данных. Служит для снижения затрат на хранение данных и повышает надежность информационного процесса.

Защита данных – комплекс мер, предназначенных на предотвращение потери данных, их воспроизведения и модификации.

Транспортировка данных – прием и передача данных между удаленными участниками информационного процесса. При этом источник данных в информатике принято называть сервером, а потребителя – клиентом.

Задачи по обработке данных предполагают способы описания процесса обработки. Процедуры обработки представляются как на внешнем уровне в виде алгоритма, так и на внутреннем в виде программы, которая кодируется средствами машинного языка.

Единицы измерения информации


admin