Relační datový model je jedinečný přístup ke správě parametrů pomocí struktury a jazyka podle predikátové logiky jednoho řádu. Poprvé byl popsán v roce 1969 anglickým vědcem Coddem. V tomto projektu jsou všechny parametry prezentovány jako n-tice seskupené v určitých vztazích.
Účel relačního datového modelu…
…je poskytnout deklarativní metodu pro specifikaci modelů a dotazů.
Uživatelé přímo zaznamenávají, jaké informace databáze obsahuje a jakou teorii od ní chtějí. A také nechte software pro správu databází, aby se postaral o popis struktur pro její uložení. Důležitý je také postup získávání informací pro reakci na požadavky.
Většina RDB používá definice dat SQL a jazyk vyhledávání. Tyto systémy implementují to, co lze považovat za inženýrskou aproximacirelační model.
Tabulka ve schématu databáze SQL odpovídá predikátové proměnné. Klíčová omezení a dotazy SQL se shodují s predikáty.
Takové databáze se však v mnoha detailech odchylují od relačního modelu a Codd se vehementně postavil proti změnám, které narušují původní principy.
Přehled
Hlavní myšlenkou relačního datového modelu je popis celé databáze jako sady predikátů pro finální složku proměnných, popisující omezení možných hodnot a jejich kombinací. Obsah v daném okamžiku je konečným (logickým) modelem. Tedy množina relací, jedna na predikátovou proměnnou, aby byly splněny všechny složky. Toto je relační datový model.
Alternativy
Další modely jsou hierarchické a síťové systémy. Některé z nich využívající starší architektury jsou stále oblíbené ve vysokokapacitních datových centrech. Nebo v případech, kdy jsou stávající systémy tak složité a abstraktní, že přechod na ně pomocí relačního modelu by byl neúměrně nákladný. Za zmínku stojí také nové objektově orientované databáze.
Implementace
Bylo několik pokusů získat skutečnou materializaci RMD, původně definované Coddem a vysvětlené ostatnímivědci.
Relační model reprezentace dat byl hlavním svého druhu, který byl popsán formálně matematickými termíny. Hierarchické a síťové základy existovaly před relačními systémy, ale jejich specifikace byly relativně neformální. Jakmile byl definován RMD, bylo učiněno mnoho pokusů srovnávat a porovnávat různé modely – a to vedlo k přesnějšímu popisu raných systémů. Ačkoli procedurální povaha rozhraní pro manipulaci s daty pro hierarchické a síťové databáze omezovala možnosti formalizace.
Témata
Základním předpokladem konceptu relačního datového modelu je, že jsou všechny reprezentovány jako matematické "p" - typické vztahy, "Cn" - párový vztah, který je podmnožinou v kartézském součinu několika domény. V matematickém modelu se uvažování o takových datech provádí ve dvouhodnotové predikátové logice, což znamená, že pro každou větu existují dvě možná hodnocení: buď pravdivá, nebo nepravdivá (a neexistuje žádná třetí hodnota, například neznámá nebo nepoužitelná, z nichž každý je často spojován s pojmem 0). Data se zpracovávají pomocí kalkulu nebo algebry, které jsou ekvivalentní ve vyjadřovací síle.
Typy datových modelů, relační datový model
RMD umožňuje vývojáři vytvořit konzistentní, logický pohled na informace. Toho všeho je dosaženo začleněním uvedených omezení do návrhu databáze, běžně označovaného jako logické schéma. Teorií je vyvinout procesnormalizace modelu, kdy lze ze sady logicky ekvivalentních alternativ vybrat design s určitými požadovanými vlastnostmi. V přístupových plánech a dalších implementacích a operacích jsou podrobnosti zpracovávány modulem DBMS a nejsou zohledněny v logickém modelu. To je v rozporu s běžnou praxí, kdy ladění výkonu často vyžaduje změny logické funkce.
Základní relační datový model představuje stavební blok – je to doména nebo typ informace, obvykle redukovaný na minimum. N-tice je uspořádaná sada hodnot atributů. A oni jsou zase vzájemnou dvojicí jména a typu. Může to být buď skalární hodnota, nebo složitější.
Vztah se skládá ze záhlaví a těla
První je sada atributů.
Tělo (s n-tým vztahem) je množina n-tic.
Tečné záhlaví je také předmětem každé struktury.
Relační datový model je definován jako množina n-tic. V matematice i MRD je množina neuspořádanou sbírkou jedinečných neduplikovaných prvků, ačkoli některé DBMS ukládají svým datům sekvenci. V matematice má n-tice pořadí a umožňuje duplikaci. E. F. Codd původně nastavil n-tice pomocí této matematické definice.
Později jedním ze skvělých nápadů E. F. Codda bylo, že používání názvů atributů místo řazení by bylo mnohem pohodlnější (obecněcase) v počítačovém jazyce založeném na vztazích. Toto prohlášení je užitečné i dnes. Přestože se koncept změnil, název „n-tice“se nezměnil. Bezprostředním a důležitým důsledkem tohoto rozlišení je, že v relačním modelu se kartézský součin stává komutativním.
Tabulka je běžná vizuální reprezentace vztahů. N-tice je podobný konceptu řetězce.
Relvar je pojmenovaná proměnná určitého typu tečny, ke které je vždy přiřazen nějaký vztah tohoto typu, ačkoli pohled může obsahovat nulové n-tice.
Základy relačního datového modelu: všechny informace jsou reprezentovány informačními hodnotami ve vztazích. V souladu s tímto principem je relační bází množina relvarů a výsledek každého dotazu je reprezentován jako tečnost.
Konzistence relační databáze není vynucována pravidly zabudovanými do aplikací, které ji používají, ale spíše omezeními deklarovanými jako součást logického schématu a vynucenými DBMS pro všechny aplikace. Omezení jsou vyjádřena v použití relačních porovnávacích operátorů, z nichž pouze jeden je podmnožinou (⊆), teoreticky dostačující. V praxi se očekává, že bude k dispozici několik užitečných zkratek, z nichž nejdůležitější jsou kandidátské klíče a externí zdrojová omezení. O tom je relační datový model.
Výklad
Aby bylo možné plně docenit RMD, je nutné porozumět zamýšlenému výkladujako vztah.
Tělo doteku se někdy nazývá jeho prodloužení. Je to proto, že by to mělo být interpretováno tak, že představuje nárůst nějakého predikátu. Toto je soubor pravdivých vět, které lze vytvořit nahrazením každé volné proměnné jménem.
Mezi objektově-relačními datovými modely existuje vzájemná shoda. Každá n-tice těla vztahu poskytuje hodnoty atributů pro vytvoření instance predikátu nahrazením každé z jeho volných proměnných. Výsledkem je tvrzení, které je považováno za pravdivé kvůli výskytu n-tice v těle vztahu. Naopak každý proces, jehož název odpovídá názvu vztahu, ale neobjevuje se v těle, je považován za nepravdivý.
Tento předpoklad je známý jako hypotéza uzavřeného světa. Často je porušován v praktických databázích, kde nepřítomnost n-tice může znamenat, že není známa pravdivost příslušné věty. Například absence určitých výrazů ("Jan", "španělština") v tabulce jazykových dovedností nemusí nutně dokazovat, že chlapec jménem John nemluví španělsky.
Aplikace na databáze, teorie normalizace
Předmětem informací používaným v typickém relačním RDM může být množina celých čísel, množina řetězců znaků, které tvoří data, nebo dva booleovské hodnoty true a false a tak dále. Odpovídající názvy předmětů pro tyto obrázky mohou být řetězce s názvy "Index", "Udělejte potřebnou práci","Čas", "Booleovský" a tak dále a tak dále.
Je však důležité pochopit, že relační teorie nespecifikuje, které typy by měly být podporovány. A je to skutečně pravda, v současnosti se očekává, že kromě těch vestavěných, které poskytuje systém, budou ustanovení dostupná i pro vlastní subjekty.
Atribut
Toto je termín používaný v teorii pro to, co se obvykle nazývá sloupec. Podobně se místo teoretického termínu tečnost běžně používá tabulka (ačkoli to v žádném případě není synonymem pro relace v SQL). Datová struktura tabulky je určena jako seznam definic sloupců, z nichž každá má jedinečný název sloupce a typ hodnot, které jsou pro něj povoleny.
Hodnota atributu je položka na konkrétním místě, jako je John Doe a 35.
N-tice je v podstatě totéž jako řádek, kromě toho, že v SQL RDBMS, kde jsou významy sloupců v řádku seřazeny, nejsou n-tice odděleny. Namísto toho je každá definiční hodnota identifikována výhradně svým názvem, nikoli svou pořadovou pozicí v n-tici. Název atributu může být Jméno nebo Věk.
Postoj
Je to tabulka definice struktury spolu se vzhledem dat v této struktuře. Definice je záhlaví a data v něm jsou tělo, sada řádků. Proměnná vztahu se obvykle nazývá hlavní tabulka. Název hodnoty, která je k němu přiřazenakdykoli odpovídá tomu zadanému v dané buňce a jeho tělo odpovídá tomu, kterému bylo naposledy přiřazeno, což vyvolá nějaký aktualizační příkaz (obvykle INSERT, UPDATE nebo DELETE).
Formulace teoretické množiny
Základními pojmy v relačním modelu vztahů jsou jména a názvy atributů. Musí být reprezentovány jako řetězce, jako je „Osoba“a „Jméno“a k jejich rozprostření je obvykle nutné použít proměnné. Dalším základním konceptem je soubor atomických hodnot, který obsahuje nezbytné a důležité významy, jako jsou čísla a řetězce.