Повна версія

Головна arrow Інформатика arrow Бази даних: проектування

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

БАЗИ ДАНИХ: ПОНЯТТЯ, МОДЕЛІ, ТЕХНОЛОГІЇ

За підсумками вивчення матеріалу даного розділу студент повинен: знати

  • • термінологію, яка використовується під час розробки інформаційних систем в рамках створення баз даних;
  • • історію розвитку баз даних;
  • • застосовувані в інформаційних системах моделі даних;
  • • рівні уявлення моделей даних;
  • • відмінні риси різних моделей даних і рівнів їх подання;
  • • місце застосування баз даних в інформаційних системах;
  • • основні особливості використання реляційної алгебри при роботі з даними;

вміти

  • • вибирати застосовується для реалізації бази даних модель даних;
  • • застосовувати правила реляційної алгебри при роботі з даними;
  • • представляти дані в табличному вигляді; володіти
  • • навичками використання правил реляційної алгебри в обробці даних;
  • • методами табличного представлення взаємозв'язаних даних;
  • • використання термінології при розгляді різних рівнів представлення моделей даних.

Перша глава підручника розглядає загальні питання понятійного апарату в області баз даних і технологій їх реалізації. Матеріал має теоретичний характер, і для його освоєння потрібні базові знання про технології роботи з інформацією, побудовою графічних структур і діаграм із застосуванням базових засобів, наприклад, МБ \% ю або аналогічних.

Основні поняття баз даних

Бази даних як сформувався термін можна розглядати з моменту появи систем зберігання інформації. Розуміючи, що інформацію люди намагалися зберегти досить давно (наприклад, облік фінансових коштів державної скарбниці, вузликова писемність інків і т.д.), можна розглядати періодом виникнення баз даних як засобу зберігання даних час задовго до настання нашої ери (наприклад, 4000 р до н.е.).

Однак термінологічно его поняття не було сформовано в ті часи. І тільки зараз, коли існує чітке розуміння суті баз даних, ми можемо сказати, що в 4000 р до н.е. теж існували бази даних, які були орієнтовані на збереження важливої ​​інформації для подальшого використання при виникненні такої необхідності.

Таке розуміння терміна "бази даних", в широкому сенсі, вводить нас в якийсь оману з приводу сутності цього терміна і не формує хорошого і правильного (сучасного) його розуміння. Особливо це очевидно з визначень різних термінів, які даються в рамках теорії баз даних і характеризують певні особливості подання та зберігання даних. У широкому сенсі під терміном "База даних" можна розуміти систему зберігання відомостей про предметну область, призначених для задоволення інформаційних потреб користувачів. Таким чином, будь-яка система зберігання даних, якщо вона дозволяє користувачам отримувати з неї необхідні відомості, може ставитися до баз даних. Візьмемо для прикладу запис інформації в єгипетській писемності (рис. 1.1).

image1

Мал. 1.1. Приклад єгипетської записи даних


Чи можна вважати записані відомості на папірусах базою даних? Очевидно, з огляду на затребуваність збереження даних, використання при необхідності, складування в бібліотеку, їх можна віднести до бази даних. Але чи буде це базою даних в сучасному розумінні? Однозначної відповіді на це питання, швидше за все, знайти буде неможливо. Особливо, зважаючи на те, що сучасні бази даних орієнтовані на автоматизовану обробку за допомогою комп'ютерних засобів, записи на папірусах буде дуже складно назвати базою даних. По суті, єгипетські записи на папірусах є всього лише збереженими відомостями, представленими в неструктурованому вигляді за допомогою відповідної форми писемності.

Практично будь-який літературний твір є таким же, як єгипетські папіруси, засобом збереження даних. Хіба можна назвати книги Л. М. Толстого "Війна і мир" або В. О. Ключевського "Курс російської історії" базою даних? Практично будь-який фахівець в області баз даних скаже, що такого вони не є. Пояснюється це тим, що для сучасного фахівця база даних визначається не тільки можливістю зберігання даних і отримання відомостей з інформаційних потреб, а й тим фактом, що база даних повинна зберігати структуровані відомості.

Жодне літературний твір, як сильно вона не була б структуровано, враховуючи подання інформації на природній мові в неструктурованому вигляді, не можна віднести до бази даних. Проте, якщо ми зберемо безліч літературних творів і розділимо їх по авторам, тематиками, жанрами і іншими показниками, представивши тим самим не самі тексти цих творів у вигляді бази даних, а інформацію про ці твори, то поступово таке уявлення стане формуватися в базу даних про літературних творах.

Тепер уявімо собі набір відомостей фінансового характеру, які зберігаються і обробляються бухгалтерами в організаціях. Фінансові відомості, в силу їх числового уявлення і набору супутніх характеристик, представляються в структурованому вигляді і формують розгалужену структуру опису фінансової діяльності організації, що дозволяє з високим ступенем зручності провести аналіз діяльності організації, виконати відповідні запити до збережених даних. Фактично така організація даних дозволяє не тільки зберігати відомості про фінанси організації, але і задовольняти інформаційні потреби користувачів щодо вирішення різних завдань: від отримання окремих даних до формування складних аналітичних звітів. Структурованість відомостей надає такі широкі можливості користувачам. Саме цей фактор, будучи одним з ключових, дозволяє такі відомості, представлені на будь-якому носії інформації, назвати базою даних. Таким чином, під терміном "База даних" можна розуміти систему зберігання структурованих даних про предметну область, призначених для задоволення інформаційних потреб користувачів. Чи буде дане визначення повним і відображати всі аспекти, що визначають базу даних? Цілком очевидно, що для широкого сучасного розуміння цього терміна таке визначення цілком достатньо. Воно дозволяє не тільки зрозуміти, які завдання виконуються за допомогою бази даних, але і виділити ключові характеристики, якими база даних повинна володіти: структурованість; схоронність відомостей; надання відомостей з інформаційних потреб.

К. Дж. Дейт визначає термін "База даних" як деякий набір перманентних (постійно зберігаються) даних, що використовуються прикладними системами будь-якого підприємства 1 .

Дане визначення досить узагальнене і може застосовуватися до будь-яких систем зберігання даних, але, при цьому, орієнтоване на використання відомостей в інтересах організацій (підприємств), що не зовсім точно, оскільки базою даних можна назвати і набір постійно збережених даних про особисте фільмотеці користувача. Тому найбільш точним і повним визначенням буде таке, яке продемонструє всі аспекти роботи з даними.

В результаті під терміном "База даних" в сучасних умовах варто розуміти технологію структурованого уявлення перманентних (постійно зберігаються) відомостей про предметну область, що використовуються в прикладних системах для задоволення інформаційних потреб користувача.

Це визначення, як і багато інших визначення терміна "База даних", містить одну важливу складову - структуроване уявлення даних. Таке уявлення даних визначається терміном "Схема даних".

Структурування даних є досить складною процедурою, яка передбачає не тільки розподіл елементів предметної області на набори пов'язаних атрибутів, а й організацію правильної зв'язку між елементами, накладення обмежень на значення і процеси обробки даних, що зберігаються, забезпечення цілісності структури та інформаційного наповнення бази даних.

Термін "Схема даних", як і в випадку з терміном "База даних" і багатьма іншими, ие має жорстко закріпленого визначення, по, на відміну від терміна "База даних", ще має різні визначення в залежності від точки зору розгляду і застосування даного терміна. Як мінімум, па поточний час, можна говорити про три точках зору застосування даного терміна: з точки зору графічного представлення структури даних, з точки зору опису представлення даних в форматі XML, з точки зору опису даних в системі управління базами даних (СКБД). Всі три точки зору відносять схему даних до варіантів представлення даних з метою певного її використання.

Говорячи про рівень розробки бази даних, зазвичай розглядається термін "Схема даних" з точки зору її графічного представлення. Обумовлено це кількома причинами:

- Графічне представлення структури даних дозволяє краще, на візуальному рівні, розглядати і аналізувати структури даних і зв'язку між ними, забезпечуючи можливість ефективного моделювання бази даних;

взаємодія розробника бази даних з замовником інформаційної системи є досить складною процедурою, часто не дає належного ефекту, якщо не застосовуються графічні уявлення, в тому числі структур даних, і схема даних таку можливість надає;

- Кожна інформаційна система взагалі і база даних зокрема вимагають документального супроводу з метою подальшої підтримки та проведення, що частково вирішується за допомогою графічного представлення схеми даних.

Таким чином, під терміном "Схема даних" - можна розуміти графічне представлення структур даних, що відображають атрибутивний складу елементів даних в базі даних, зв'язку між ними, правила взаємодії примірників елементів даних (рис. 1.2).

image2

Мал. 1.2. Приклад схеми даних


Звичайно, з огляду на, що існує кілька рівнів подання даних, схеми даних можуть описувати не тільки елементи даних на логічному і концептуальному рівні, а й на рівні фізичному, коли в якості елемента уявлення виступають таблиці і поля (колонки). Таке уявлення візуально нічим не відрізняється від уявлення логічного рівня, але використовує правила відображення елементом схеми в термінології і за правилами, що застосовуються в СУБД.

Оскільки в сучасних інформаційних системах зазвичай використовуються технології реляційних баз даних, то і схеми даних підкоряються правилам відображення реляційних структур. Але поряд з цим можуть застосовуватися і інші технології подання та роботи з даними. Наприклад, розвиток інтернет-технологій призвело до відродження ієрархічних (деревовидних) структур, які застосовуються при розмітці web-сторінок, а в разі необхідності оперативної роботи з даними на web-сторінці і організації технології передачі структурованих даних забезпечують інструментами можливості структурованого зберігання даних. Для вирішення цих завдань застосовується спеціалізований розширювана мова розмітки XML, схему подання даних для якого також представляють в графічному вигляді (рис. 1.3).

image3


Мал. 1.3. Приклад візуалізації схеми XML [1]

Використання XML в якості опису і обробки даних стало ефективною технологією роботи з даними при необхідно їх подання в інтернет-системах і для передачі даних між інформаційними системами, ставши неписаним стандартом інформаційної комунікації. Більшість даних представляється в ієрархічному вигляді, логічно

подається відповідною схемою [2] , що було використано в якості технології побудови бази даних в 1968 р компанією IBM в системі Information Management System (IMS) та Е. Коддом в 1970 р в якості моделі, найбільш незалежною від апаратних засобів комп'ютера.

З точки зору представлення даних в XML під терміном "Схема даних" розуміється ієрархічне представлення моделі даних для опису структури XML-документа.
Широке використання схеми даних XML обумовлено необхідністю представляти дані в ієрархічному вигляді для публікації в інтернет-системах. Ця обставина змусила розробників систем управління базами даних забезпечити можливості зберігання і обробки даних в форматі XML. Такі обробки в деяких СУБД інтегровані з технологією реляційної обробки даних і істотно розширюють можливості роботи з базами даних.

Термін "Схема даних" також застосовується на рівні СУБД, що знайшло відображення в двох її уявленнях: візуалізація фізичної моделі даних і структурування таблиць даних. У першому випадку, коли схема даних є об'єктом бази даних і спрямована на візуалізацію моделі даних, в СУБД надаються інструменти роботи з таблицями, зв'язками, полями (колонками) і іншими елементами. У другому випадку схема даних являє собою каталогізований елемент структури бази даних, що дозволяє виділити частину таблиць в окрему, умовно незалежну, структуру, організовуючи більш ефективні технології управління структурами даних, такі як таблиці, умовчання, обмеження, нуля (колонки), ключі і т. д.

З точки зору СУБД під терміном "Схема даних" розуміється об'єкт бази даних, що виділяє окремі структури фізичного представлення даних з метою підвищення ефективності зберігання і обробки інформації.

Результатом використання схеми даних в СУБД є створення словника даних, який організовує структурування бази даних, забезпечує можливість управління таблицями, полями (колонками), ключами, зв'язками та іншими об'єктами засобами самої СУБД, реалізуючи деякі принципи побудови реляційних баз даних, сформульовані Е. Коддом.

Важливим елементом будь-якої бази даних є дані, але в галузі інформатики є кілька термінів, що мають відношення до цього терміну: дані, інформація, відомості, знання і т.д. Правильна інтерпретація цих понять дозволяє краще розуміти суть представляються відомостей в базі даних, в інформаційній системі, в даній діяльності. Інформатика розглядає чотири основні стани інформації (рис. 1.4), кожне з яких має певний сенс з точки зору зберігання, обробки та подання.

image4

Мал. 1.4. Життєвий цикл інформації


Дані є первинним джерелом відомостей, які можна виділити в будь-якому інформаційному потоці незалежно від форми і способу представлення. Відомості, що знаходяться в такому стані, не несуть явно вираженого смислового значення, не можуть визначити особливості діяльності, описати завдання, функції, об'єкти предметної області. Наприклад, в описі діяльності магазину використовується артикул товару, який видається символьно-числового рядком з фіксованої кількості символів.

Якщо уявити список товарів тільки значеннями артикулів (табл. 1.1) при відсутності інформації про принципи і правила дешифрування, то неможливо з'ясувати, про які товари йдеться в цьому списку. У такому вигляді перелік артикулів все лише, дані про значення артикулів, що застосовуються в предметної області. З цих даних можна отримати тільки відомості технічного характеру, що описують правила подання і зберігання: символьно-числові відомості, зміст в значенні символів, цифр і знаків "-", уявлення тільки великими символами, динамічна розмірність (кількість символів) і т.д.

Таблиця 1.1

список артикулів

№ п / п

Артикул

1

НІD2113СS

2

СВРS4.5L

3

SХ-HW-hм Р130-01

4

SХ-SW-ЕL-МЗ



Як тільки визначаються правила обробки даних і їх зв'язку в деякій структурі, вони (дані) набувають додаткові властивості і переходять в стан "Інформація". Якщо для представленого раніше прикладу (див. Табл. 1.1) визначити спосіб інтерпретації артикулу товару, то представлені значення починають набувати сенс і стає зрозуміло, про який товар йде мова в таблиці.

Отримавши такий опис інтерпретації артикулу, можна сформувати інформаційні відомості про продаж товарів в магазині у вигляді банки з акумулятором і світловий головки ліхтаря. Тепер користувач інформації може розуміти сенс зазначеного артикулу і виробляти рішення про необхідно придбання відповідного товару (табл. 1.2), тобто артикул для користувача перетворився з даних в інформацію.

Також представлені в табл. 1.2 відомості мають певну структуру уявлення в формі таблиці, по якій користувач інформації може однозначно зрозуміти, яким чином потрібно читати відповідний артикул товару, що також додає сенсу в подаються відомості.

інтерпретація артикулів

Таблиця 1.2

Артикул

інтерпретація

1

СВР84,5Ь

Банку з акумулятором

СВР - каністра

  • 8 - РУС-ссрий корпус
  • 4,5 - розмір каністри

Б - літієво-іонний акумулятор

2

НГО2113С8

Світлова голівка ліхтаря

НГО - лампа газорозрядна

2113 - здвоєна лампа на 21 і 13 Вт

З - скляна колба на лампі

Б - наявність перемикача на світловий голівці



Розглядаючи базу даних як сховище відомостей, потрібно розуміти, що самі відомості, що зберігаються в нолях (колонках) і записах бази даних є даними, але при їх використанні, представляючи в певній структурі, або розгляді в структурі таблиці бази даних вони стають інформаційними відомостями ( інформація) і для користувача наповнюються сенсом, в зв'язку з чим він може їх застосувати для вирішення поставлених перед ним завдань.

Подальше використання інформації, спрямоване на розуміння правил використання, отримання будь-яких зведених відомостей, на основі яких можна вирішити завдання не тільки уявлення, а й аналізу, призводить до перетворення інформації в новий стан - "Знання". Такий стан відомостей також застосовується в базах даних, але самі бази даних теж змінюють свій стан, перетворюючись в бази знань, які використовуються в інтелектуальних інформаційних системах (наприклад, експертні системи).

  • [1] Документація до інструменту Oxygen XML Editor [режим доступу: URL: oxygenxml.com/doc/ug-editor].
  • [2] Представлення і використання ієрархічної моделі даних буде розглянуто в параграфі 1.3.
 
<<   ЗМІСТ   >>