Phân tích cụm trong Excel

Anonim

Phân tích cụm trong Microsoft Excel

Một trong những công cụ để giải quyết các nhiệm vụ kinh tế là một phân tích cụm. Với nó, các cụm và các đối tượng mảng dữ liệu khác được phân loại theo nhóm. Kỹ thuật này có thể được áp dụng trong chương trình Excel. Hãy xem làm thế nào điều này được thực hiện trong thực tế.

Sử dụng phân tích cụm

Với sự trợ giúp của phân tích cụm, bạn có thể tạo một mẫu trên cơ sở được điều tra. Nhiệm vụ chính của nó là phân chia một mảng đa chiều cho các nhóm đồng nhất. Như một tiêu chí nhóm, một hệ số tương quan cặp hoặc khoảng cách euklido giữa các đối tượng theo tham số được chỉ định được áp dụng. Gần nhau nhất với nhau được nhóm lại với nhau.

Mặc dù thường thì loại phân tích này được sử dụng trong nền kinh tế, nhưng nó cũng có thể được sử dụng trong sinh học (để phân loại động vật), tâm lý học, y học và nhiều khu vực khác của hoạt động của con người. Phân tích cụm có thể được áp dụng bằng cách sử dụng bộ công cụ lưu vong tiêu chuẩn cho các mục đích này.

Ví dụ về sử dụng

Chúng tôi có năm đối tượng được đặc trưng bởi hai tham số được nghiên cứu - x và y.

  1. Áp dụng cho các giá trị này, công thức khoảng cách EVKLIDE được tính theo mẫu:

    = Root ((x2-x1) ^ 2 + (Y2-Y1) ^ 2)

  2. Các đối tượng đã học trong Microsoft Excel

  3. Giá trị này được tính giữa mỗi trong số năm đối tượng. Các kết quả tính toán được đặt trong ma trận khoảng cách.
  4. Khoảng cách ma trận trong Microsoft Excel

  5. Chúng tôi nhìn, giữa những gì giá trị khoảng cách ít nhất. Trong ví dụ của chúng tôi, đây là các đối tượng 1 và 2. Khoảng cách giữa chúng là 4.123106, ít hơn so với bất kỳ yếu tố nào khác của toàn bộ.
  6. Khoảng cách giữa các đối tượng là tối thiểu trong Microsoft Excel

  7. Chúng tôi kết hợp dữ liệu này vào nhóm và tạo thành một ma trận mới, trong đó các giá trị 1.2 thực hiện một phần tử riêng biệt. Khi tạo ma trận, chúng tôi để lại các giá trị nhỏ nhất từ ​​bảng trước cho mục kết hợp. Chúng tôi nhìn lại, giữa các yếu tố mà khoảng cách là tối thiểu. Lần này là 4 và 5, cũng như đối tượng 5 và một nhóm các đối tượng 1.2. Khoảng cách là 6.708204.
  8. Khoảng cách giữa các đối tượng là tối thiểu trong ma trận thứ hai trong Microsoft Excel

  9. Thêm các mục được chỉ định vào cụm chung. Chúng tôi tạo thành một ma trận mới về cùng một nguyên tắc như lần trước. Đó là, chúng tôi đang tìm kiếm ít nhất. Do đó, chúng ta thấy rằng bộ dữ liệu của chúng ta có thể được chia thành hai cụm. Cụm đầu tiên chứa các yếu tố gần nhất giữa bản thân - 1,2,4,5. Trong cụm thứ hai, trong trường hợp của chúng tôi, chỉ có một yếu tố được trình bày - 3. Nó tương đối một lần với các đối tượng khác. Khoảng cách giữa các cụm là 9,84.

Giá trị cuối cùng trong Microsoft Excel

Điều này hoàn thành thủ tục chia một tổng số thành các nhóm.

Như bạn có thể thấy, mặc dù nói chung, phân tích cụm và có thể là thủ tục phức tạp, nhưng thực tế hiểu các sắc thái của phương pháp này không quá khó. Điều chính là để hiểu mô hình hiệp hội cơ bản trong nhóm.

Đọc thêm