Arazo ekonomikoak konpontzeko tresnetako bat kluster analisia da. Bere laguntzarekin, klusterrak eta datu-arrayko gainerako objektuak taldeetan sailkatzen dira. Teknika hau Excel-en aplika daiteke. Ikus dezagun hori nola egiten den praktikan.
Kluster analisia erabiliz
Klusterren analisiaren laguntzaz, laginketa egitea da aztertzen ari den atributuaren arabera. Bere zeregin nagusia dimentsio anitzeko array bat talde homogeneotan zatitzea da. Taldekatze irizpide gisa, parametro jakin bateko objektuen arteko korrelazio koefizientea edo objektuen arteko distantzia euklidearra erabiltzen da. Elkarrengandik gertuen dauden balioak biltzen dira.
Analisi mota hau ekonomian gehien erabiltzen den arren, biologian ere erabil daiteke (animaliak sailkatzeko), psikologian, medikuntzan eta gizakiaren jardueraren beste arlo askotan. Klusterren analisia Excel tresna-tresna estandarra erabiliz aplika daiteke helburu horietarako.
Erabileraren adibidea
Aztertutako bi parametro bereizten dituzten bost objektu ditugu x eta y.
- Distantzia euklidearraren formula balio horiei aplikatzen diegu, txantiloiaren arabera kalkulatzen dena:
= ROOT ((x2-x1) ^ 2 + (y2-y1) ^ 2)
- Balio hori bost objektu bakoitzaren artean kalkulatzen da. Kalkuluaren emaitzak distantzia matrizean kokatzen dira.
- Distantzia gutxien duten baloreen artean begiratzen dugu. Gure adibidean objektuak dira 1 eta 2. Bien arteko distantzia 4.123106 da, hau da, biztanleria honetako beste edozein elementuen artean baino txikiagoa da.
- Datu datuak talde batean eta osatu balioak non matrize berri bat osatu 1,2 elementu bereizi gisa jokatu. Matriza osatzerakoan, aurreko taulatik balio txikienak uzten ditugu elementu konbinatuarentzat. Berriro ere begiratzen dugu, elementuen artean distantzia minimoa da. Oraingo hau da 4 eta 5baita objektua ere 5 eta objektuen taldea 1,2. Distantzia 6.708204 da.
- Zehaztutako elementuak klusterra orokorrean gehitzen ditugu. Matrize berria eratzen dugu aurreko denboraren printzipio beraren arabera. Hau da, balio txikienak bilatzen ari gara. Horrela, gure datu multzoa bi multzotan banatu daitekeela ikusten dugu. Lehenengo klusterrak elkarrengandik gertuen dauden elementuak ditu - 1,2,4,5. Gure kasuan bigarren klusterrean, elementu bakarra aurkezten da - 3. Beste objektuetatik nahiko urrun dago. Klusterren arteko distantzia 9,84 da.
Horrek biztanleria taldeetan banatzeko prozedura osatzen du.
Ikus dezakezuenez, orokorrean klusterren azterketak prozedura konplexua dirudien arren, egia esan, metodo honen ñabardurak ulertzea ez da hain zaila. Gauza nagusia taldekatzeko oinarrizko eredua ulertzea da.