Průvodce kandidátským klíčem
A kandidátský klíč je kombinace atributů, které jednoznačně identifikují záznam databáze, aniž by odkazovaly na jakákoli jiná data. Každá tabulka může mít jednoho nebo více kandidátů. Jeden z těchto kandidátských klíčů je vybrán jako tabulka primární klíč. Tabulka obsahuje pouze jeden primární klíč, ale může obsahovat několik kandidátských klíčů. Pokud se kandidátský klíč skládá ze dvou nebo více sloupců, nazývá se a kompozitní klíč.
Vlastnosti kandidátského klíče
Všechny kandidátské klíče mají některé společné vlastnosti. Jednou z vlastností je, že po dobu životnosti kandidátského klíče musí atribut použitý k identifikaci zůstat stejný. Další je, že hodnota nemůže být null. A konečně, kandidátský klíč musí být jedinečný.
Například ke konkrétní a jedinečné identifikaci každého zaměstnance může společnost použít číslo sociálního zabezpečení zaměstnance. Někteří lidé sdílejí stejná křestní jména, příjmení a pozici, ale žádní dva lidé nepoužívají stejné číslo sociálního zabezpečení.
Číslo sociálního pojištění | Jméno | Příjmení | Pozice |
---|---|---|---|
123-45-6780 | Craig | Jones | Manažer |
234-56-7890 | Craig | Beal | Spolupracovník |
345-67-8900 | Sandra | Beal | Manažer |
456-78-9010 | Trina | Jones | Spolupracovník |
567-89-0120 | Sandra | Kovář | Spolupracovník |
Příklady kandidátských klíčů
Některé typy dat se snadno hodí jako kandidáti:
- Mezinárodní standardní čísla knih: ISBN jednoznačně identifikuje knihy a související média. Vydávání čísel ISBN je přísně regulováno správci bran a vydavatelé nikdy znovu nepoužívají čísla ISBN.
- Čísla bankovních účtů: Většina bank nerecykluje čísla účtů.
- Sériová čísla: Ačkoli sériová čísla se neřídí napříč odvětvími, v kontextu jednoho dodavatele by sériové číslo mělo být vždy jedinečné.
- Čísla řidičských průkazů: Obvykle se tato čísla neduplikují. Osoba, která se stěhuje ze státu do státu, však může mít více než jedno číslo DL.
- ID národního poskytovatele: Lékaři a další licencovaní poskytovatelé lékařské péče mají každý alespoň jeden NPI, který je pro ně jedinečný, vydaný ministerstvem zdravotnictví a sociálních služeb USA.
Některé typy informací, které se mohou zdát jako dobří kandidáti, se však ve skutečnosti ukáží jako problematické:
- Telefonní čísla: Většina operátorů recykluje telefonní čísla a jednotliví předplatitelé mohou používat několik telefonních čísel současně.
- Univerzální cenové kódy: UPC jsou jedinečné, ale vlastník bloku UPC může produkty libovolně recyklovat.
- Čísla lékařských záznamů: MRN se obecně vydávají na úrovni nemocnic, bez jakéhokoli druhu vnitrostátních pokynů o struktuře a formátu těchto identifikátorů.
- čísla sociálního pojištění: Ačkoli jsou teoreticky jedinečná, SSN se recyklují a podvody s SSN jsou natolik běžné, že činí tento identifikátor problematickým u velkých souborů dat. (V kontextu zaměstnavatele, který ověřuje SSN, tato výzva nepředstavuje problém.)