Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Файловая организация данных.

Изначально компьютерные файлы в файловой структуре были очень похожи на документы картотеки.

Описание компьютерных файлов требует специального словаря. Каждая отрасль старается разработать свой жаргон, чтобы все исполнители хорошо понимали друг друга. Краткий основной словарь, которым оперируют пользователи систем файлов, приведенный в табл. 1.1.

Таблица 1.1. Основная терминология файловых систем

Термин Описание
Данные (Data) " Сырые" необработанные сведения, такие, например, как номера телефонов, даты рождения, имена клиентов, дата, объем сде-лок и т. д. Данные не играют большой роли, если они не организованы некоторым логическим образом. Наименьший фрагмент данных, распознаваемый компьютером, это простой символ, например, буква А, число " 5". Для хранения простого символа в памяти компьютера требуется один байт.
Поле (Field) Символ или группа символов (алфавитных или цифровых), которые имеют определенное значение. Поля используются для определения и хранения данных
Запись (Record) Логически связанный набор из одного или более полей, описывающих персону, местоположение или предмет.
Файл (File) Совокупность связанных записей. Например, файл может содержать данные о поставщиках компании, или записи о студентах

 

На основе содержимого файлов специалисты по обработке данных (Data processing specialists) писали программы, создававшие необходимые отчеты для коммерческих отделов:

С точки зрения управления система файлов включает в себя следующие составные части.

1. Аппаратные средства. Компьютер.

2. Программное обеспечение. Операционная система, утилиты, файлы, программы управления файлами и прикладные программы для создания отчетов на основе данных из файлов.

3. Сотрудники. DР-менеджер, DР-специалисты, программисты и конечные пользователи.

4. Процедуры. Инструкции и правила, в соответствии с которыми разрабатываются и используются программные компоненты.

5. Данные. Совокупность " сырых" неупорядоченных сведений.

По мере роста числа файлов небольшая файловая структура разрастается.

Каждый файл в этой системе принадлежит сотруднику или отделу, по заказу которого он был создан.

По мере роста системы файлов объем задач программирования растет еще быстрее, это приводит к необходимости:

1) увеличения штата DP-специалистов (штат программистов увеличивался)

2)приобретения новых компьютеров с более мощными ресурсами

Несмотря на эти организационные изменения, все же основная деятельность нового DР-отдела сводится к программированию, и поиску ошибок в программах.

По мере расширения системы файлов усложняется и системное администрирование. Каждый файл должен иметь собственную систему управления, состоящую из программ, дающих клиентам возможность выполнять следующие действия:

1. создание структуры файла;

2. добавление данных в файл;

3. удаление данных из файла;

4. изменение данных в файле;

5. вывод содержимого файла.

Даже простая система, состоящая из 20 файлов, потребует 5 х 20 = 100 управляющих программ. Если к каждому из этих файлов осуществляется доступ из 10 различных программ, генерирующих отчеты, то необходимо написать дополнительно 20 х 10 = 200 программ. Поскольку нерегламентированные (в данном случае незапрограммированные) запросы невозможны, число программ генерации отчетов быстро умножается. А если каждый отдел организации является единоличным хозяином своих данных и создает собственные файлы, то общее число таких файлов растет очень быстро.

Тщательное планирование структур файлов является очень важной обязанностью ВР-менеджеров, поскольку изменение существующей структуры файла — дело слишком трудоемкое. Например, чтобы изменить только одно поле в исходном файле

1. Поместить новую файловую структуру в буфер.

2. Открыть исходный файл, используя другой буфер.

3. Считать запись из исходного файла,

4. Преобразовать исходные данные в форму новой структуры хранения."

5. Записать преобразованные данные в новую файловую структуру.

Затем исходный файл удаляется. Наконец, все программы, использующие файл, должны быть настроены для использования новой структуры файла.

Важным шагом в развитии информационных систем является переход к использованию централизованных систем управления файлами.

С точки зрения прикладной программы, файл – это именованная область внешней памяти, в которую можно записывать и из которой можно считывать данные. Пользователи видят файл как линейную последовательность записей и могут выполнить над ним ряд стандартных операций:

1. создать файл (требуемого типа и размера);

2. открыть ранее созданный файл;

3. прочитать из файла некоторую запись (текущую, следующую, предыдущую, первую, последнюю);

4. записать в файл на место текущей записи новую, добавить новую запись в конец файла.

В разных файловых системах эти операции могли немного отличаться.

Информационные технологии первоначально основывались на файловой организации данных. Каждый программный продукт работал с одним или несколькими файлами данных, структура которых находились в прямой зависимости от приложений. При этом существовал «примат» программного обеспечения: информационные возможности системы полностью определялись возможностями программ; любые изменения в структуре данных были возможны только при условии соответствующего изменения приложений; информация, содержащаяся в файлах данных, в большинстве случаев оказывалась недоступной для других программных средств.

В целом такую организацию программного и информационного обеспечения можно представить в виде схемы:

На схеме видно, что некоторые приложения могут использовать одни и те же файлы данных; в других случаях требуется специальная программа-конвертер для преобразования данных из одного формата в другой, доступный для использования другим программным средством. Каждое из приложений хранит внутри себя описание используемых данных.

Среди недостатков такой организации можно выделить следующие:

  1. Зависимость данных от приложений. Файлы данных обычно жестко привязаны к программному обеспечению. Использование их возможно только вместе с соответствующими приложениями. Это, во-первых, ограничивает сферу использования данных: они не могут использоваться в тех узлах вычислительной системы, где не установлено соответствующее программное обеспечение. Во-вторых, ограничены возможности обработки информации; они полностью исчерпываются алгоритмами, заложенными в материнской программе, а разработка нового программного обеспечения на базе существующих файлов весьма затруднено, так как описания данных и их структуры опять же хранятся внутри материнской программы.
  2. Трудоемкость внесения изменений. Как уже говорилось, любые изменения в структуре информации требуют соответствующего изменения программного обеспечения, то есть, фактически, включают этап дополнительного программирования. Это ставит пользователя в зависимость от разработчиков программного обеспечения и в значительной мере увеличивает затраты на поддержание работоспособности автоматизированной информационной системы. Положение еще более усложняется, если одни и те же файлы используются несколькими приложениями - в этом случае потребуется переработка всех связанных программных средств.
  3. Избыточность информации и дублирование данных. Очевидно, что разные программные средства могут использовать одну и ту же информацию, например, нормативно-справочные данные. Но, поскольку каждое приложение использует файлы данных собственного формата, приходится дублировать эту информацию для каждой из использующих программ. Это, с одной стороны, увеличивает непроизводительные затраты на хранение и использование излишней информации, с другой стороны, увеличивает расходы на программирование, поскольку в различных программах повторяются одни и те же процедуры обработки данных. Наконец, это приводит к дополнительным трудовым и материальным затратам при внесении любых изменений в данные, так как эту процедуру приходится повторять для каждого из приложений.
  4. Разобщение данных. Файлы данных, используемые разными приложениями, не связаны или только частично связаны между собой. Это зачастую приводит к невозможности получить полную картину состояния предметной области, серьезным затруднениям при решении экономических задач, требующих работы с данными разных программ. Кроме того, это может вызывать временную или постоянную противоречивость данных, нарушение их целостности.
  5. Неоперативность информации. Дублирование, переработка большого числа файлов, отсутствие целостности приводит к значительному снижению оперативности всей информационной системы.

 

<== предыдущая лекция | следующая лекция ==>
Операційна система — це набір програм, які призначені для функціонування та взаємодії усіх пристроїв комп'ютера, забезпечення доступу до файлів і до засобів керування комп'ютером. | Make.cpp, name.c, age.pc, name.cpp
Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.011 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал