Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Основні поняття та визначення теорії баз даних
1.1. ПРИЧИНИ ВИНИКНЕННЯ СИСТЕМ БАЗ ДАНИХ Основою вирішення більшості завдань є обробка інформації. Інформація – це сукупність фактів, спостережень, дані про об'єкти, явища, події реального світу. Для обробки інформації створюються інформаційні системи, які сприймають інформацію з навколишнього середовища, зберігають, обробляють її і видають у навколишнє середовище. Як правило, обробці піддається інформація, що відноситься до однієї певної предметної області, тобто до певної галузі знань, що має практичну цінність для користувача. У 1960-х рр. з'явилися перші автоматизовані інформаційні системи (АІС), що включають до свого складу обчислювальну техніку. Масиви інформації в АІС, для їх комп'ютерного зберігання і обробки, необхідно оптимальним чином організовувати, забезпечувати їх цілісність і несуперечність. Рішення подібних завдань з потрібною продуктивністю неможливо здійснювати, використовуючи тільки функції стандартних файлових систем. Зазначимо явні недоліки файлової організації даних на зовнішніх носіях. 1. Ізольованість і розділеність даних. Операційна система контролює і розмежовує доступ до даних, як правило, на рівні файлів. Тому декілька паралельно працюючих додатків не зможуть одночасно оновлювати різні записи в одному і тому ж файлі. Операції спільної обробки декількох файлів так само досить складні. 2. Залежність програм від даних. Оскільки опис структури даних задається в прикладній програмі, то будь-яке внесення змін у цю структуру вимагає, як мінімум, перекомпіляції всіх програм, які використовують цей файл. 3. Дублювання даних. У разі, коли різні програми використовують дані, що відносяться до одного і того ж об'єкту, але зберігають цю інформацію в своїх незалежних файлах, виникає неконтрольоване дублювання даних. Це призводить до мимовільної витраті пам'яті на зовнішніх пристроях, що набагато небезпечніше, може призвести до суперечливості даних. Дані, змінені в одному файлі, в іншому файлі можуть залишитися в колишньому вигляді. 4. Відсутність описів даних. У файлах операційної системи дані, оброблювані прикладними програмами, що зберігаються без опису. Це створює складності при документуванні системи, що ускладнює пошук потрібних даних і призводить до появи помилок. Для усунення перерахованих недоліків було запропоновано відокремити процес зберігання даних від процесу їх обробки, виділивши спеціальну програму-посередник – систему управління базами даних (СУБД), а самі дані організувати і зберігати у вигляді певної структури бази даних.
1.2. БАЗИ ДАНИХ Предметна область АІС «матеріалізується» у формі, що зберігається в пам'яті ЕОМ структурованої сукупності даних, які характеризують складу об'єктів предметної області, їх властивості та взаємозв'язки. Таке відображення предметної області прийнято називати базою даних (БД). Більш суворе визначення звучить наступним чином. База даних – це іменована сукупність даних, що відображає стан об'єктів та їх взаємозв'язків (відносин) у розглянутій предметній області. Життєвий цикл системи обробки даних складається з декількох етапів: 1) проектування бази даних; 2) проектування додатків; 3) реалізація бази даних, що включає початкову завантаження і запуск в експлуатацію; 4) розробка спеціальних засобів адміністрування бази даних; 5) експлуатація бази даних (аналіз функціонування, модифікація та адаптація). Процес проектування бази даних являє собою послідовність переходів від неформального словесного опису інформаційної структури предметної області до формалізованого опису в термінах деякої моделі і в свою чергу включає декілька етапів. 1. Системний аналіз і словесний опис інформаційних об'єктів предметної області. Основним завданням цього етапу є збір вимог, що висуваються користувачами до вмісту бази даних і процесу обробки інформації. Об'єднуючи приватні уявлення про вміст БД, отримані в результаті опитування користувачів, і свої уявлення про дані, які можуть знадобитися в майбутніх додатках, проектувальники створюють узагальнений неформальний опис БД. Воно виконується з використанням природної мови, математичних формул, таблиць, графіків і інших засобів, зрозумілих усім людям, що працюють над проектуванням бази даних. 2. Проектування інфологічної моделі, що представляє собою частково формалізований опис об'єктів предметної області в термінах деякої семантичної моделі, наприклад ER-моделі. В результаті виконання цього етапу будується концептуальна (СУБД-незалежна) модель предметної області, яка в подальшому буде конкретизована. Інфологічна модель повністю незалежна від фізичних параметрів середовища зберігання даних. 3. Логічне проектування бази даних, тобто опис бази даних в термінах прийнятої логічної моделі даних. На цьому етапі виконується вибір типу СУБД, будується схема бази даних в термінах відповідної моделі даних, підсхеми для різних користувачів, створюється набір можливих типових запитів і специфікації для програмного забезпечення. 4. Фізичне проектування бази даних полягає у виборі ефективного розміщення бази даних на зовнішніх носіях для забезпечення найбільш ефективної роботи додатку. Визначається використовується СУБД. Створюється реальна БД, програмуються і налагоджують програми, які будуть працювати з БД. Результатом етапу проектування є готова до заповнення реальною інформацією база даних і готове до роботи програмне забезпечення. Сучасні бази даних, як правило, мають трирівневу архітектуру, яка утворюється в процесі проектування БД. Трирівнева архітектура, тобто інфологічний, логічний і фізичний рівні, дозволяє забезпечити логічну і фізичну незалежність збережених даних від використовують їх програм. При необхідності можна переписати збережені дані на інші носії інформації та (або) реорганізувати їх фізичну структуру, змінивши лише фізичну модель даних. Можна підключити до системи будь-яку кількість нових користувачів (нових додатків), доповнивши, якщо треба, логічну модель. Зазначені зміни фізичної та логічної моделей не будуть помічені користувачами системи (будуть «прозорими» для них), так само як не будуть помічені і нові користувачі. Отже, незалежність даних забезпечує можливість розвитку системи баз даних без руйнування існуючих додатків.
1.3. СИСТЕМИ УПРАВЛІННЯ БАЗАМИ ДАНИХ СУБД – це програмний комплекс, що забезпечує функціонування бази даних. Він відповідає за схоронність, безпеку, цілісність, взаємну відповідність даних і забезпечує доступ користувачів до даних. Дамо чітке визначення. Система управління базами даних являє собою сукупність мовних і програмних засобів, призначених для створення, ведення і сумісного використання БД багатьма користувачами. Перші СУБД з'явилися наприкінці 1960-1970-х рр. Вони орієнтувалися на мейнфрейми і підтримували ієрархічну і мережеву моделі. У процесі подальшого розвитку СУБД постійно удосконалювалися: – виникали нові підходи до зберігання та обробки даних, організації процесу розробки баз даних і додатків, розроблялися нові моделі даних. Більш детально структура і функції СУБД будуть розглянуті нижче.
|