Analiza clusterului în Excel

Anonim

Analiza clusterului în Microsoft Excel

Unul dintre instrumentele de rezolvare a sarcinilor economice este o analiză a clusterului. Cu ea, grupurile și alte obiecte de ardy de date sunt clasificate de grupuri. Această tehnică poate fi aplicată în programul Excel. Să vedem cum se face acest lucru în practică.

Utilizarea analizei clusterului

Cu ajutorul analizei clusterului, puteți face un eșantion pe baza investigației. Sarcina sa principală este de a împărți o matrice multidimensională pentru grupuri omogene. Ca criteriu de grupare, se aplică un coeficient de corelare a perechilor sau o distanță euclido între obiecte conform parametrului specificat. Cel mai apropiat unul de celălalt sunt grupate împreună.

Deși cel mai adesea acest tip de analiză este utilizat în economie, acesta poate fi utilizat și în biologie (pentru clasificarea animalelor), psihologia, medicina și multe alte domenii ale activității umane. Analiza clusterului poate fi aplicată utilizând setul standard de instrumente exil în aceste scopuri.

Exemplu de utilizare

Avem cinci obiecte care sunt caracterizate de doi parametri studiați - x și y.

  1. Aplicați la aceste valori, formula distanței EVKLIDE care este calculată de șablon:

    = Rădăcină ((x2-x1) ^ 2 + (Y2-Y1) ^ 2)

  2. Obiecte învățate în Microsoft Excel

  3. Această valoare este calculată între fiecare dintre cele cinci obiecte. Rezultatele de calcul sunt plasate în matricea distanțelor.
  4. Distanțele matricei în Microsoft Excel

  5. Ne uităm, între ceea ce este valorile pe care distanța este cea mai mică. În exemplul nostru, acestea sunt obiecte 1 și 2. Distanța dintre ele este de 4,123106, care este mai mică decât între orice alte elemente ale totalității.
  6. Distanța dintre obiecte este minimă în Microsoft Excel

  7. Combinăm aceste date în grup și formați o nouă matrice, în care valorile 1.2 efectuează un element separat. Când faceți o matrice, lăsăm cele mai mici valori din tabelul anterior pentru elementul combinat. Ne uităm din nou, între elementele pe care distanța este minimă. Acest timp este de 4 și 5, precum și obiectul 5 și un grup de obiecte 1.2. Distanța este de 6,708204.
  8. Distanța dintre obiecte este minimă în cea de-a doua matrice din Microsoft Excel

  9. Adăugați elementele specificate la clusterul comun. Formăm o nouă matrice pe același principiu ca și timpul anterior. Adică, căutăm cel mai puțin. Astfel, vedem că setul de date poate fi împărțit în două clustere. Primul cluster conține cele mai apropiate elemente între ele - 1,2,4,5. În cel de-al doilea cluster, în cazul nostru, este prezentat un singur element - 3. Este relativ disponibil de la alte obiecte. Distanța dintre clustere este de 9.84.

Valoarea finală în Microsoft Excel

Aceasta completează procedura de împărțire a unei totalități în grupuri.

După cum puteți vedea, deși în general, analiza clusterului și poate părea o procedură complexă, dar, de fapt, înțelegeți că nuanțele acestei metode nu sunt atât de greu. Principalul lucru este de a înțelege modelul de bază al asociației din grup.

Citeste mai mult