Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Класифікація моделей даних






2.1. МОДЕЛЮВАННЯ ДАНИХ

Модель даних – це деяка абстракція, яка, будучи прикладена до конкретних даних, що дозволяє користувачам і розробникам трактувати їх як інформацію, тобто як відомості, що містять не тільки дані, але й взаємозв'язки між ними.

Можливі наступні зв'язки між об'єктами предметної області і відповідно описують їх даними: «один до одного»; «один до багатьох», «багато до одного»; «багато до багатьох». Зв'язок «один до одного» (1: 1) означає, що кожному екземпляру об'єкта А може відповідати тільки один екземпляр об'єкта і навпаки. Зв'язок «один до багатьох (1: М) означає, що можуть існувати екземпляри об'єкта, яким відповідає більше одного екземпляра об'єкта, але кожному екземпляру об'єкту може відповідати тільки один екземпляр об'єкта А. Зв'язок «багато до одного» (М: 1) має місце, коли кожному екземпляру об'єкта А ставиться у відповідність рівно один екземпляр об'єкта, але екземпляру об'єкту можуть відповідати більш одного екземпляра об'єкта А. І нарешті, зв'язок «багато до багатьох» (М: N) означає, що кількох екземплярів об'єкта А можуть відповідати кілька екземплярів об'єкта В.

Подання інформації в базі даних здійснюється в рамках певних обмежень, обумовлених використовуваної інформації цивілізаційною системою, ресурсами, обраної логічної і фізичної структурами організації даних. Насамперед, ці обмеження визначають допустимі типи даних і допустимі зв'язку між даними. Обмеження стосуються і операцій, які можуть виконуватися над даними і зв'язками. Існує і безліч обмежень, що обумовлюють цілісність бази даних. Цілісність бази даних означає, що в ній міститься повна, несуперечлива і адекватно відображає предметну область інформація, тобто окремі фрагменти даних взаємно узгоджені і коректні. Узгодженість означає, що всі порції даних повинні бути одноманітно змодельовані і включені в систему. Коректність – що вони достовірні, точні і значущі. Безліч допустимих типів даних і зв'язків між ними, множина допустимих операцій над даними і зв'язками, безліч обмежень цілісності в сукупності визначають використовувану модель даних. Розглянемо існуючі моделі даних.

2.2. ІЄРАРХІЧНА МОДЕЛЬ

Основною логічною структурою для ієрархічної моделі є орієнтован е дерево з коренем. Вершини дерева відповідають цікавлять нас об'єктів, а дуги – зв'язків між об'єктами. Усі вершини дерева, за винятком кореня, повинні мати предка. Між двома вершинами може бути тільки один зв'язок. Зв'язку вершини з безпосередньо підпорядкованими вершинами повинні мати певне упорядкування, як правило, зліва направо. Основними типами даних є два: запис і дерево. Дерево складається з однієї кореневої запису і впорядкованого набору з нуля або більше підлеглих записів, кожна з яких в свою чергу може мати нуль або більше підлеглих записів. Кожна вершина дерева може бути представлена у вигляді деякої запису або упорядкованого набору записів, а кожна дуга – вбудованим в запис покажчиком (адресою). Ієрархічна база даних являє собою упорядковану сукупність примірників даних типу «дерево».

Основними операціями маніпулювання даними в ієрархічній моделі є: пошук зазначеного примірника дерева; перехід від одного дерева до іншого; перехід від одного запису до іншого всередині дерева; вставка нового запису у вказану позицію; видалення поточного запису і т. д. Використовуються два методи доступу до записів всередині дерева. Прямий порядок обходу починається з кореня з подальшою обробкою всього дерева в порядку зліва направо. Зворотний порядок обходу починається з лівої висячої вершини з поступовим переходом від одного піддерева до іншого зліва направо з завершенням обробки в корені.

Ієрархічна модель підтримує зв'язки «один до одного» та «один до багатьох». Можлива організація зв'язку «багато до багатьох» за рахунок дублювання даних. Основне обмеження цілісності полягає в тому, що нащадок не може існувати без батька. Тому при видаленні запису батьківського видаляється все обумовлене нею піддерево.

До переваг ієрархічної моделі відносяться ефективне використання пам'яті ЕОМ, непогані показники часу виконання основних операцій над даними, зручність роботи з ієрархічно упорядкованою інформацією.

Недоліками ієрархічної моделі є неможливість зберігання примірників, не мають батьківських записів, труднощі реалізації зв'язків «багато до багатьох» і інших більш складних ієрархічних зв'язків.

 

 

2.3. МЕРЕЖЕВА МОДЕЛЬ

Мережевий підхід до організації даних є розширенням ієрархічного. В ієрархічній моделі запис-нащадок повинна мати в точності одного предка; у мережевий моделі запис-нащадок може мати будь-яке число предків. Для реалізації ієрархічної структури використовуються дві групи типів даних: запис і набір. Набір встановлює іменовану зв'язок для запису-предка і однієї або декількох записів потомків, тобто підтримує зв'язки «один до одного» та «один до багатьох». Для організації зв'язку «багато до багатьох» утворюються дві зв'язку «один до багатьох», об'єднані в єдину сполучну запис. При цьому повинні виконуватися наступні обмеження:

1) тільки один запис може бути предком в кожному наборі, але одна і та ж запис може бути предком в декількох різних наборах;

2) одна або більше записів можуть бути членами одного і того ж набору;

3) запис може входити в кілька наборів;

4) запис може бути предком в одних наборах і нащадком інших наборах;

5) між будь-якими двома записами не може бути визначена будь-кількість наборів;

6) набори можуть бути визначені так, що в результаті вони утворюють циклічну структуру;

7) запис необов'язково повинна бути членом двох примірників одного й того ж типу набору;

8) запис необов'язково повинна бути членом будь-якого набору.

Основними операціями при маніпулюванні даними мережної моделі є: пошук запису; створення нового запису; видалення запису; модифікація запису; перехід від предка до першого нащадку; перехід від нащадка до наступного нащадку; перехід від нащадка до предка; включення запису в набір; виключення запису з набору; перестановка запису в інший набір.

Доступ до типів запису здійснюється шляхом «переміщення» по структурі і залежить від методу реалізації наборів – з допомогою ланцюжків покажчиків або масивів покажчиків. Цілісність у мережевий моделі підтримується за допомогою наборів. Якщо записи включені в набір, то видалення запису-предка набору приводить до видалення всього набору і каскадне видалення наступних наборів. Якщо записи-нащадки не входять в набір, видалення запису-предка еквівалентно видалення зв'язку.

До переваг мережевої моделі відноситься можливість встановлення довільних зв'язків між записами. Недоліком мережевої моделі є висока складність схеми бази даних. Складність сіткових і ієрархічних моделей пояснюється тим, що вони побудовані з використанням внутрішніх фізичних покажчиків, що зв'язують запису між собою.

2.4. РЕЛЯЦІЙНА МОДЕЛЬ

Реляційна модель була розроблена доктором Е. Ф. Коддом на початку 1970-х рр. З її створенням почався новий етап в еволюції СУБД. Простота і гнучкість моделі привернули до неї увагу розробників і здобули їй безліч прихильників. Незважаючи на деякі недоліки, реляційна модель стала домінуючою, а реляційні СУБД стали промисловим стандартом де-факто. Реляційна модель заснована на математичному понятті відносини, фізичним представленням якого є двомірна таблиця, що складається з рядків однакової структури. Логічна структура даних представляється набором зв'язаних таблиць. Модель підтримує зв'язки «один до одного» та «один до багатьох». Зв'язок «багато до багатьох» реалізується з допомогою декомпозиції.

Розглянемо більш детально реляційну модель.

Як вже зазначалося, будь-яка база даних складається з описів об'єктів певної предметної області, а також містить інформацію про взаємозв'язки між об'єктами. Тип об'єкта називається сутністю, а характеристики об'єктів – атрибути. Таким чином, сутністю відповідає певний набір атрибутів, а кожному конкретному об'єкту відповідає набір значень атрибутів. Набір атрибутів, що однозначно визначає кожен об'єкт, називають ключем. Атрибут можна розглядати як змінну, що приймає значення з деякої множини значень, званого домен атрибута.

Розглянемо об'єкт типу Т, має набір атрибутів А1, А2,..., Ап. Атрибут Aj може приймати значення з області (домену) Dj, j = 1, 2,..., n. Позначимо через аіј значення атрибута Aj для об'єкта i, тоді кожному конкретному об'єкту i типу Т відповідає кортеж виду

ai = (аі1, аі2,..., аіп), aij ∈ Dj, i = l, 2,..., m; j = l, 2,..., n;

де m – кількість об'єктів типу Т. Всьому набору розглянутих об'єктів типу Т відповідає набір кортежів:

a11, a12, …, a1n

R = a21, a22, …, a2n

…………….

am1, am2, …, amn

 

Ясно, що R ⊆ Dl × D2 ×...× Dn.

Безліч кортежів R називають відношенням, а кількість атрибутів n – арностью відносини. Кількість утримуваних у відношенні кортежів називається кардинальністю відношення. Зазначимо, що оскільки відношення – це множина, то порядок кортежів у відношенні несуттєвий; відношення не містить однакових елементів – кортежів і, отже, обов'язково має набір атрибутів, що є ключем.

Сукупність атрибутів R = (Al, A2,..., Ап) називається схемою відношення. Якщо позначити U = {Al, A2,..., An}, то схему відносини можна записати у вигляді R = (U). Саме відношення R називається поточним значенням чи екземпляром схеми відносини R. База даних зазвичай містить кілька відносин: Rl, R2,..., Rk; сукупність їх схем R1 = = (U1), R2 = (U2),..., Rk = (Uk) називається схемоюреляційної бази даних.

Відношення можна розглядати як двовимірну таблицю, кожен стовпець якої має ім'я – атрибут, а кожен рядок містить дані по одному об'єкту або дані про зв'язок між кількома конкретними об'єктами.

Таким чином, набір кортежів R можна записати у вигляді:

A1 A2 An
a11 a12 a1n
a21 a22 a2n
am1 am2 amn

 

Для таблиці повинні виконуватися наступні правила: таблиця має ім'я, відмінне від імен інших таблиць; кожна клітина містить тільки атомарний значення; кожен стовпець має унікальне ім'я; дані для стовпця беруться з одного безлічі значень; порядок стовпчиків не має значення; таблиця не має повторюваних рядків; рядки не мають імен; порядок слідування рядків не має значення.

Будь-яка таблиця має один або декілька стовпців, значення яких однозначно ідентифікують кожну її рядок. Такий стовпець (або сукупність стовпців) називається первинним ключем. Взаємозв'язку таблиць реляційної моделі підтримуються зовнішніми ключами. Зовнішній ключ – це стовпець (або сукупність стовпців), значення якого однозначно характеризують сутності, представлені рядками деякого іншого ставлення, тобто задають значення їх первинного ключа.

Для користувачів АІС необхідно, щоб база даних відображала предметну область однозначно і несуперечливо, тобто задовольняла умовам цілісності. Для забезпечення виконання умов цілісності на базу даних накладаються деякі обмеження, які називають обмеженнями цілісності. Виділяють два основних типи таких обмежень : цілісність сутностей і цілісність посилань. Обмеження першого типу означає, що будь-яке відношення повинне мати первинний ключ (в принципі для стосунки це властивість має виконуватися автоматично). Обмеження посилальної цілісності полягає в тому, що зовнішній ключ не може бути дороговказом на неіснуючу рядок у таблиці. Контроль цілісності здійснюється перевіркою обмежень цілісності:

1) ключовий стовбець не може містити невизначене значення (визначник NULL);

2) для пов'язаних таблиць кожному рядку основної таблиці відповідає нуль або більше рядків підпорядкованої таблиці;

3) для пов'язаних таблиць у підпорядкованій таблиці немає рядків, які не мають батьківських рядків в основній таблиці;

4) для пов'язаних таблиць кожна рядок підпорядкованої таблиці має тільки одну батьківську рядок в основній таблиці.

Основними операціями маніпулювання даних є: додавання рядків; модифікація рядків; видалення рядків.

В основі операцій над відносинами лежать операції реляційної алгебри та реляційного числення, про які буде розказано у відповідному розділі.

Переваги реляційної моделі є простота, наочність, незалежність від даних. До того ж, на відміну від мережевих та ієрархічних моделей, реляційні моделі для організації зв'язків між записами не застосовують внутрішні вказівники, а фактичні значення атрибута, використовуючи загальний атрибут у кожній із записів.

Недоліки реляційної моделі пов'язані з однорідністю структури даних, семантичної перевантаженістю моделі, обмеженим набором операцій.

2.5. ОБ'ЄКТНО-ОРІЄНТОВАНА МОДЕЛЬ

Об'єктно-орієнтована модель даних враховує семантику об'єктів, застосовувану в об'єктно-орієнтованому програмуванні. Основними модельними поняттями є об'єкти та літерали. Об'єкт володіє унікальним ідентифікатором, який не змінюється і не використовується після видалення об'єкта. Об'єкти можуть бути розбиті на типи: атомарні, колекції або структуровані типи. Тип також є об'єктом. Об'єкт інкапсулює стан і поведінку. Поведінка об'єкта – це операції, які можуть бути виконані або самим об'єктом, або над ним. У сукупності ці операції називаються методами. Стан об'єкта визначається значеннями, які є в набору властивостей об'єкта. Є два типи властивостей – атрибутів і зв'язку. Атрибут визначається для об'єктів одного типу. Він не є об'єктом, але може приймати в якості значень літерал або ідентифікатор об'єкта. Об'єкт може зберігати всі зв'язки, якими він пов'язаний з іншими об'єктами, включаючи зв'язок «багато до багатьох». Зв'язку представлені з допомогою посилальних атрибутів. Запит одного об'єкта до іншого називають повідомленням. Об'єкти, що мають однакові атрибути і відповідають на одні і ті ж повідомлення, утворюють клас. Успадкування дозволяє визначити один клас як окремий випадок більш загального класу. Поліморфізм означає допустимість в об'єктах різних типів мати методи з однаковими іменами.

Типи літералів можна розбити на атомарні, колекції, структуровані типи і об'єкти без типу. Літерали не можуть існувати окремо. Вони завжди вбудовані в об'єкт. За допомогою механізму успадкування допускається створення нових абстрактних типів даних на основі вже існуючих. Логічно структура об'єктно-орієнтованої бази даних схожа на структуру ієрархічної бази даних. Основна відмінність полягає в методах маніпулювання даними.

Переваги об'єктно-орієнтованої моделі є поліпшені можливості моделювання об'єктів реального світу. Об'єктні типи даних, а також об'єктні таблиці представляють потужний єдиний рівень інтерпретації об'єктів ділової сфери і дозволяють відмовитися від поділу на частини бізнес-даних для зберігання їх в БД при використанні реляційної моделі.

Недоліками моделі є висока понятійна складність, відсутність стандарту об'єктно-орієнтованої моделі з-за її недостатньої теоретичної розробки.

2.6. ОБ'ЄКТНО-РЕЛЯЦІЙНА МОДЕЛЬ

У зв'язку з нерозпрацьованістю об'єктно-орієнтованої моделі на практиці застосовується об'єктно-реляційна модель, що є як би сумішшю реляційні та об'єктно-орієнтованої методології для представлення даних. Ця модель являє собою розширену реляційну модель, в якої знято обмеження неподільності даних, що зберігаються в записах таблиць. Допускаються багатозначні поля – поля, значеннями яких є самостійні таблиці, вбудовані в основну таблицю. Крім цього, підтримуються такі концепції об'єктно-орієнтованого програмування, як «абстракція», «клас», «примірник», «інкапсуляція», «метод», «перевантаження» і «повідомлення». Хоча спадкування і є однією з найбільш важливих характеристик об'єктів, але в об'єктно-реляційної моделі воно не підтримується.

У моделі вводиться спеціальний об'єктний тип, за допомогою якого можна створити абстрактний тип даних будь-якого ступеня складності. Використовуючи вкладені об'єктні типи, можна створювати структури, в яких використовуються всі види зв'язків: «один до одного», «один до багатьох» і «багато до багатьох». Хоча це і може призвести до певної надмірності, такий підхід дає переваги у порівнянні з використанням безлічі нормалізованих таблиць в чисто реляційної моделі.

Перевагою об'єктно-реляційної моделі є можливість використання існуючих реляційних баз даних з знову розробляються об'єктними додатками.

До недоліків моделі можна віднести складність вирішення проблеми забезпечення цілісності збережених даних.

2.7. БАГАТОВИМІРНА МОДЕЛЬ

Багатовимірна модель даних є вузькоспеціалізованою моделлю, призначеної для оперативної аналітичної обробки інформації. В основі моделі лежить не двомірна, як в реляційної моделі, а багатовимірна таблиця і багатовимірне логічне представлення структури інформації при описі даних та операції маніпулювання даними. Порівняно з реляційною моделлю багатовимірна організація даних володіє більш високою наочністю і інформативністю. Моделі повинні бути притаманні агрегируемость, історичність і прогнозованість даних.

Агрегіруємість даних означає розгляд інформації на різних рівнях її узагальнення.

Історичність даних передбачає забезпечення високого рівня статичності даних і їх взаємозв'язків, а також обов'язкову прив'язку даних до часу.

Прогнозованість даних передбачає завдання функцій прогнозування і застосування їх до різних тимчасових інтервалах.

До числа основних понять багатовимірної моделі відносяться вимірювання і комірка. Вимірювання – це безліч однотипних даних, що утворюють одну з граней багатовимірної таблиці. Комірка – це поле, значення якого однозначно визначається фіксованим набором вимірювань.

Використовуються два основних варіанти організації даних: гіперкубічна і полікубічна.

У гіперкубічній схемі передбачається, що всі багатовимірні таблиці мають однакову розмірність і збігаються вимірювання.

У полікубічній схемі може бути визначено кілька таблиць з різною розмірністю і різними вимірами.

У багатовимірної моделі реалізуються такі спеціальні операції, як формування «зрізу», обертання, агрегація і деталізація.

Основною перевагою багатовимірної моделі даних є зручність і ефективність аналітичної обробки великих обсягів даних, пов'язаних з часом.

Недоліком багатовимірної моделі є складність її структури при реалізації найпростіших задач звичайної оперативної обробки даних.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.012 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал