Průvodce kandidátským klíčem

A kandidátský klíč je kombinace atributů, které jednoznačně identifikují záznam databáze, aniž by odkazovaly na jakákoli jiná data. Každá tabulka může mít jednoho nebo více kandidátů. Jeden z těchto kandidátských klíčů je vybrán jako tabulka primární klíč. Tabulka obsahuje pouze jeden primární klíč, ale může obsahovat několik kandidátských klíčů. Pokud se kandidátský klíč skládá ze dvou nebo více sloupců, nazývá se a kompozitní klíč.

databáze
enot-poloskun / Getty Images

Vlastnosti kandidátského klíče

Všechny kandidátské klíče mají některé společné vlastnosti. Jednou z vlastností je, že po dobu životnosti kandidátského klíče musí atribut použitý k identifikaci zůstat stejný. Další je, že hodnota nemůže být null. A konečně, kandidátský klíč musí být jedinečný.

Například ke konkrétní a jedinečné identifikaci každého zaměstnance může společnost použít číslo sociálního zabezpečení zaměstnance. Někteří lidé sdílejí stejná křestní jména, příjmení a pozici, ale žádní dva lidé nepoužívají stejné číslo sociálního zabezpečení.

Číslo sociálního pojištění Jméno Příjmení Pozice
123-45-6780 Craig Jones Manažer
234-56-7890 Craig Beal Spolupracovník
345-67-8900 Sandra Beal Manažer
456-78-9010 Trina Jones Spolupracovník
567-89-0120 Sandra Kovář Spolupracovník

Příklady kandidátských klíčů

Některé typy dat se snadno hodí jako kandidáti:

  • Mezinárodní standardní čísla knih: ISBN jednoznačně identifikuje knihy a související média. Vydávání čísel ISBN je přísně regulováno správci bran a vydavatelé nikdy znovu nepoužívají čísla ISBN.
  • Čísla bankovních účtů: Většina bank nerecykluje čísla účtů.
  • Sériová čísla: Ačkoli sériová čísla se neřídí napříč odvětvími, v kontextu jednoho dodavatele by sériové číslo mělo být vždy jedinečné.
  • Čísla řidičských průkazů: Obvykle se tato čísla neduplikují. Osoba, která se stěhuje ze státu do státu, však může mít více než jedno číslo DL.
  • ID národního poskytovatele: Lékaři a další licencovaní poskytovatelé lékařské péče mají každý alespoň jeden NPI, který je pro ně jedinečný, vydaný ministerstvem zdravotnictví a sociálních služeb USA.

Některé typy informací, které se mohou zdát jako dobří kandidáti, se však ve skutečnosti ukáží jako problematické:

  • Telefonní čísla: Většina operátorů recykluje telefonní čísla a jednotliví předplatitelé mohou používat několik telefonních čísel současně.
  • Univerzální cenové kódy: UPC jsou jedinečné, ale vlastník bloku UPC může produkty libovolně recyklovat.
  • Čísla lékařských záznamů: MRN se obecně vydávají na úrovni nemocnic, bez jakéhokoli druhu vnitrostátních pokynů o struktuře a formátu těchto identifikátorů.
  • čísla sociálního pojištění: Ačkoli jsou teoreticky jedinečná, SSN se recyklují a podvody s SSN jsou natolik běžné, že činí tento identifikátor problematickým u velkých souborů dat. (V kontextu zaměstnavatele, který ověřuje SSN, tato výzva nepředstavuje problém.)