ఉదాహరణలతో డేటా వేర్‌హౌస్‌లో స్టార్ మరియు స్నోఫ్లేక్ స్కీమా

మల్టీ డైమెన్షనల్ స్కీమా అంటే ఏమిటి?

బహుమితీయ పథకం ముఖ్యంగా డేటా వేర్‌హౌస్ సిస్టమ్‌లను రూపొందించడానికి రూపొందించబడింది. విశ్లేషణాత్మక ప్రయోజనం (OLAP) కోసం రూపొందించిన చాలా పెద్ద డేటాబేస్‌ల ప్రత్యేక అవసరాలను తీర్చడానికి ఈ స్కీమాలు రూపొందించబడ్డాయి.

డేటా వేర్‌హౌస్ స్కీమా రకాలు:

ప్రతి దాని ప్రత్యేక ప్రయోజనాలను కలిగి ఉన్న 3 ప్రధాన రకాల మల్టీ డైమెన్షనల్ స్కీమాలు క్రింది విధంగా ఉన్నాయి.

  • స్టార్ షెడ్యూల్
  • స్నోఫ్లేక్ స్కీమా
  • గెలాక్సీ రేఖాచిత్రం

ఈ ట్యుటోరియల్‌లో, మీరు దీని గురించి మరింత నేర్చుకుంటారు-

స్టార్ స్కీమా అంటే ఏమిటి?

స్టార్ షెడ్యూల్ డేటా గిడ్డంగిలో, దీనిలో నక్షత్రం మధ్యలో ఒక వాస్తవ పట్టిక మరియు అనేక అనుబంధ పరిమాణ పట్టికలు ఉండవచ్చు. దీని నిర్మాణం నక్షత్రాన్ని పోలి ఉన్నందున దీనిని స్టార్ స్కీమా అని పిలుస్తారు. స్టార్ స్కీమా డేటా మోడల్ అనేది డేటా వేర్‌హౌస్ స్కీమా యొక్క సరళమైన రకం. దీనిని స్టార్ జాయిన్ స్కీమా అని కూడా అంటారు మరియు పెద్ద డేటా సెట్‌లను ప్రశ్నించడానికి ఆప్టిమైజ్ చేయబడింది.

కింది స్టార్ స్కీమా ఉదాహరణలో, వాస్తవ పట్టిక మధ్యలో ఉంది, ఇందులో డీలర్_ఐడి, మోడల్ ఐడి, తేదీ_ఐడి, ప్రొడక్ట్_ఐడి, బ్రాంచ్_ఐడి మరియు విక్రయించిన యూనిట్లు మరియు ఆదాయం వంటి ఇతర డైమెన్షన్ టేబుల్‌కు కీలు ఉంటాయి.

స్టార్ స్కీమా రేఖాచిత్రం యొక్క ఉదాహరణ



స్టార్ స్కీమా యొక్క లక్షణాలు:

  • స్టార్ స్కీమాలోని ప్రతి డైమెన్షన్ ఒకే ఒక డైమెన్షన్ టేబుల్‌తో ప్రాతినిధ్యం వహిస్తుంది.
  • డైమెన్షన్ టేబుల్‌లో లక్షణాల సమితి ఉండాలి.
  • డైమెన్షన్ టేబుల్ విదేశీ కీని ఉపయోగించి ఫ్యాక్ట్ టేబుల్‌కి జతచేయబడుతుంది
  • డైమెన్షన్ టేబుల్ ఒకదానితో ఒకటి జతచేయబడలేదు
  • వాస్తవం పట్టికలో కీ మరియు కొలత ఉంటుంది
  • స్టార్ స్కీమా అర్థం చేసుకోవడం సులభం మరియు సరైన డిస్క్ వినియోగాన్ని అందిస్తుంది.
  • డైమెన్షన్ టేబుల్స్ సాధారణీకరించబడలేదు. ఉదాహరణకు, పై చిత్రంలో, కంట్రీ_ఐడిలో ఓఎల్‌టిపి డిజైన్ ఉన్నట్లుగా కంట్రీ లుక్అప్ టేబుల్ లేదు.
  • BI టూల్స్ ద్వారా ఈ స్కీమాకు విస్తృతంగా మద్దతు ఉంది

స్నోఫ్లేక్ స్కీమా అంటే ఏమిటి?

స్నోఫ్లేక్ స్కీమా డేటా వేర్‌హౌస్‌లో మల్టీ డైమెన్షనల్ డేటాబేస్‌లో టేబుల్‌ల తార్కిక అమరిక ఉంది IS రేఖాచిత్రం స్నోఫ్లేక్ ఆకారాన్ని పోలి ఉంటుంది. స్నోఫ్లేక్ స్కీమా అనేది స్టార్ స్కీమా యొక్క పొడిగింపు, మరియు ఇది అదనపు పరిమాణాలను జోడిస్తుంది. డైమెన్షన్ టేబుల్స్ సాధారణీకరించబడ్డాయి, ఇది డేటాను అదనపు టేబుల్స్‌గా విభజిస్తుంది.

కింది స్నోఫ్లేక్ స్కీమా ఉదాహరణలో, దేశం వ్యక్తిగత పట్టికగా మరింత సాధారణీకరించబడింది.

స్నోఫ్లేక్ స్కీమా యొక్క ఉదాహరణ

స్నోఫ్లేక్ స్కీమా యొక్క లక్షణాలు:

  • స్నోఫ్లేక్ స్కీమా యొక్క ప్రధాన ప్రయోజనం చిన్న డిస్క్ స్థలాన్ని ఉపయోగిస్తుంది.
  • స్కీమాకు ఒక డైమెన్షన్‌ను అమలు చేయడం సులభం
  • బహుళ పట్టికల కారణంగా ప్రశ్న పనితీరు తగ్గుతుంది
  • స్నోఫ్లేక్ స్కీమాను ఉపయోగిస్తున్నప్పుడు మీరు ఎదుర్కొనే ప్రాధమిక సవాలు ఏమిటంటే, మరిన్ని లుకప్ టేబుల్స్ కారణంగా మీరు మరింత నిర్వహణ ప్రయత్నాలు చేయాల్సి ఉంటుంది.

స్టార్ స్కీమా వర్సెస్ స్నోఫ్లేక్ స్కీమా: కీలక తేడాలు

స్టార్ స్కీమా మరియు స్నోఫ్లేక్ స్కీమా మధ్య ఒక ముఖ్యమైన తేడా ఉంది:

స్టార్ షెడ్యూల్ స్నోఫ్లేక్ స్కీమా
డైమెన్షనల్ పట్టికలో కొలతల కోసం సోపానక్రమాలు నిల్వ చేయబడతాయి.సోపానక్రమాలు ప్రత్యేక పట్టికలుగా విభజించబడ్డాయి.
డైమెన్షన్ టేబుల్స్ చుట్టూ ఉన్న ఫ్యాక్ట్ టేబుల్ ఇందులో ఉంది.డైమెన్షన్ టేబుల్‌తో చుట్టుముట్టబడిన ఒక వాస్తవ పట్టిక డైమెన్షన్ టేబుల్ చుట్టూ ఉంటుంది
స్టార్ స్కీమాలో, సింగిల్ జాయిన్ మాత్రమే ఫ్యాక్ట్ టేబుల్ మరియు ఏ డైమెన్షన్ టేబుల్‌ల మధ్య సంబంధాన్ని సృష్టిస్తుంది.స్నోఫ్లేక్ స్కీమాకు డేటాను పొందడానికి అనేక జాయిన్‌లు అవసరం.
సాధారణ DB డిజైన్.చాలా క్లిష్టమైన DB డిజైన్.
డీనోర్మలైజ్డ్ డేటా స్ట్రక్చర్ మరియు క్వెరీ కూడా వేగంగా నడుస్తుంది.సాధారణీకరించిన డేటా నిర్మాణం.
అధిక స్థాయి డేటా రిడెండెన్సీచాలా తక్కువ-స్థాయి డేటా రిడెండెన్సీ
సింగిల్ డైమెన్షన్ టేబుల్‌లో మొత్తం డేటా ఉంటుంది.డేటా వివిధ డైమెన్షన్ టేబుల్‌లుగా విభజించబడింది.
క్యూబ్ ప్రాసెసింగ్ వేగంగా ఉంది.సంక్లిష్ట చేరడం వలన క్యూబ్ ప్రాసెసింగ్ నెమ్మదిగా ఉండవచ్చు.
స్టార్ జాయిన్ క్వెరీ ఆప్టిమైజేషన్ ఉపయోగించి అధిక పనితీరు గల ప్రశ్నలను అందిస్తుంది. పట్టికలు బహుళ పరిమాణాలతో అనుసంధానించబడి ఉండవచ్చు.స్నోఫ్లేక్ స్కీమా అనేది కేంద్రీకృత వాస్తవ పట్టిక ద్వారా ప్రాతినిధ్యం వహిస్తుంది, ఇది బహుళ కోణాలతో అనుసంధానించబడదు.

గెలాక్సీ స్కీమా అంటే ఏమిటి?

కు గెలాక్సీ రేఖాచిత్రం వాటి మధ్య డైమెన్షన్ టేబుల్‌లను పంచుకునే రెండు ఫ్యాక్ట్ టేబుల్ ఉంది. దీనిని ఫ్యాక్ట్ కాన్స్టెలేషన్ స్కీమా అని కూడా అంటారు. ఈ స్కీమాను నక్షత్రాల సమాహారంగా చూస్తారు, అందుకే గెలాక్సీ స్కీమా అనే పేరు వచ్చింది.

గెలాక్సీ స్కీమా యొక్క ఉదాహరణ



పై ఉదాహరణలో మీరు చూడగలిగినట్లుగా, రెండు వాస్తవాల పట్టిక ఉన్నాయి

  1. ఆదాయం
  2. ఉత్పత్తి

గెలాక్సీ స్కీమా షేర్ల కొలతలు కన్ఫార్మ్డ్ డైమెన్షన్స్ అంటారు.

గెలాక్సీ స్కీమా యొక్క లక్షణాలు:

  • ఈ స్కీమాలోని కొలతలు వివిధ స్థాయిల సోపానక్రమం ఆధారంగా ప్రత్యేక కొలతలుగా విభజించబడ్డాయి.
  • ఉదాహరణకు, భౌగోళికంలో ప్రాంతం, దేశం, రాష్ట్రం మరియు నగరం వంటి నాలుగు స్థాయిల సోపానక్రమం ఉంటే గెలాక్సీ స్కీమా నాలుగు కొలతలు కలిగి ఉండాలి.
  • అంతేకాకుండా, వన్-స్టార్ స్కీమాను మరిన్ని స్టార్ స్కీమ్‌లుగా విభజించడం ద్వారా ఈ రకమైన స్కీమాను రూపొందించడం సాధ్యమవుతుంది.
  • ఈ స్కీమాలో కొలతలు పెద్దవిగా ఉంటాయి, ఇది సోపానక్రమం స్థాయిల ఆధారంగా నిర్మించడానికి అవసరం.
  • ఈ స్కీమా మెరుగైన అవగాహన కోసం వాస్తవ పట్టికలను సమగ్రపరచడానికి సహాయపడుతుంది.

స్టార్ క్లస్టర్ స్కీమా అంటే ఏమిటి?

స్నోఫ్లేక్ స్కీమా పూర్తిగా విస్తరించిన సోపానక్రమాలను కలిగి ఉంది. అయితే, ఇది స్కీమాకు సంక్లిష్టతను జోడించగలదు మరియు అదనపు చేరికలు అవసరం. మరోవైపు, స్టార్ స్కీమా పూర్తిగా కూలిపోయిన సోపానక్రమాలను కలిగి ఉంది, ఇది పునరావృతానికి దారితీస్తుంది. కాబట్టి, స్టార్ క్లస్టర్ స్కీమా డిజైన్ అయిన ఈ రెండు స్కీమాల మధ్య సమతుల్యత ఉత్తమ పరిష్కారం.

స్టార్ క్లస్టర్ స్కీమాకు ఉదాహరణ

అతివ్యాప్తి కొలతలు సోపానక్రమాలలో ఫోర్క్‌లుగా కనుగొనవచ్చు. ఒక సంస్థ రెండు విభిన్న డైమెన్షనల్ సోపానక్రమాలలో పేరెంట్‌గా వ్యవహరించినప్పుడు ఫోర్క్ జరుగుతుంది. ఫోర్క్ ఎంటిటీలు ఒకటి నుండి అనేక సంబంధాలతో వర్గీకరణగా గుర్తించబడ్డాయి.

సారాంశం:

  • మల్టీ డైమెన్షనల్ స్కీమా ప్రత్యేకంగా డేటా వేర్‌హౌస్ సిస్టమ్‌లను రూపొందించడానికి రూపొందించబడింది
  • స్టార్ స్కీమా అనేది డేటా వేర్‌హౌస్ స్కీమా యొక్క సరళమైన రకం. దీని నిర్మాణం నక్షత్రాన్ని పోలి ఉన్నందున దీనిని స్టార్ స్కీమా అని పిలుస్తారు.
  • స్నోఫ్లేక్ స్కీమా అనేది స్టార్ స్కీమా యొక్క పొడిగింపు, మరియు ఇది అదనపు పరిమాణాలను జోడిస్తుంది. దీనిని స్నోఫ్లేక్ అని పిలుస్తారు ఎందుకంటే దాని రేఖాచిత్రం స్నోఫ్లేక్‌ను పోలి ఉంటుంది.
  • స్టార్ స్కీమాలో, సింగిల్ జాయిన్ మాత్రమే ఫ్యాక్ట్ టేబుల్ మరియు ఏ డైమెన్షన్ టేబుల్‌ల మధ్య సంబంధాన్ని నిర్వచిస్తుంది.
  • స్టార్ స్కీమా డైమెన్షన్ టేబుల్స్ చుట్టూ ఉన్న ఫాక్ట్ టేబుల్‌ను కలిగి ఉంది.
  • స్నోఫ్లేక్ స్కీమా డైమెన్షన్ టేబుల్ చుట్టూ ఉంటుంది, ఇవి డైమెన్షన్ టేబుల్ చుట్టూ ఉన్నాయి
  • స్నోఫ్లేక్ స్కీమాకు డేటాను పొందడానికి అనేక జాయిన్‌లు అవసరం.
  • గెలాక్సీ స్కీమాలో డైమెన్షన్ టేబుల్‌లను పంచుకునే రెండు ఫ్యాక్ట్ టేబుల్ ఉన్నాయి. దీనిని ఫ్యాక్ట్ కాన్స్టెలేషన్ స్కీమా అని కూడా అంటారు.
  • స్టార్ క్లస్టర్ స్కీమాలో స్టార్ మరియు స్నోఫ్లేక్ స్కీమా లక్షణాలు ఉన్నాయి.