Trải Nghiệm Nổ Hũ Tại 58win

Danh Mục Sản Phẩm

Biểu đồ phân tán là gì? Cách tạo và phân tích Scatter Diagram trong Excel

Mã Sản Phẩm
: Quan ly chat luong 9
Tên Sản Phẩm
: Biểu đồ phân tán là gì? Cách tạo và phân tích Scatter Diagram trong Excel
Danh Mục
: HỆ THỐNG QLSX MES
Thương Hiệu
: Hệ thống điều hành và thực thi sản xuất
Giá

: Liên Hệ



Biểu đồ phân tán là một công cụ rất quan trọng trong quản lý chất lượng, giúp trực quan hóa dữ liệu hiệu quả để phân tích mối tương quan giữa hai biến số

Chi Tiết Sản Phẩm


Biểu đồ phân tán (Scatter Diagram) là một trong những công cụ quản lý chất lượng được nhiều doanh nghiệp sử dụng để phân tích về sự tác động lẫn nhau của 2 yếu tố cụ thể. Cùng DACO tìm hiểu về loại biểu đồ này cũng như các bước để tạo một biểu đồ Scatter trong Excel trong bài viết này nhé!

1. Biểu đồ phân tán là gì? Nên sử dụng biểu đồ Scatter khi nào?

1.1. Biểu đồ phân tán là gì?

Biểu đồ phân tán (Scatter diagram) là một công cụ trực quan biểu diễn mối quan hệ giữa hai biến số dựa trên tọa độ trong toán học. Trên biểu đồ này, trục tung Oy thể hiện các giá trị của biến phụ thuộc, trong khi trục hoành Ox thể hiện các giá trị của biến độc lập được sử dụng để dự đoán và phân tích.

bieu-do-phan-tan-scatter-diagram-la-gi-1

Scatter Diagram còn có một số tên gọi khác là Scatter Plot, Scatter graph, biểu đồ Scatter hay biểu đồ tán xạ. Biểu đồ này có nguồn gốc từ thế kỷ 19 khi nhà khoa học Francis Galton (người Anh) nghiên cứu về di truyền và sự biến đổi của các đặc tính sinh học. Vào đầu thế kỷ 20, biểu đồ phân tán trở nên phổ biến hơn nhờ việc phát triển các phương pháp thống kê để đo lường và kiểm tra mối tương quan giữa các biến số. 

1.2. Nên sử dụng biểu đồ Scatter khi nào?

Biểu đồ phân tán được sử dụng chủ yếu với mục đích quan sát và biểu diễn mối quan hệ giữa hai biến số. Khi chúng ta muốn phân tích về sự tương quan hoặc hồi quy, việc sử dụng Scatter Diagram trước tiên là rất quan trọng. Biểu đồ này giúp chúng ta hiểu mối quan hệ tuyến tính hoặc nhận biết được những điểm ngoại lệ có thể tồn tại trong dữ liệu.

Bằng cách sử dụng biểu đồ phân tán, chúng ta có thể xác định hướng, tính tuyến tính và độ mạnh của mối quan hệ giữa hai biến số. Nó cũng cho phép chúng ta nhận thấy sự tương quan ban đầu giữa hai biến độc lập một cách dễ dàng.

2. Cách thức hoạt động của biểu đồ phân tán

Biểu đồ phân tán là một loại biểu đồ được sử dụng hai trục để biểu diễn hai biến số và quan hệ giữa chúng. Mỗi điểm ở trên biểu đồ Scatter đại diện cho một cặp giá trị của hai biến số. Những điểm này được vẽ trên Scatter Diagram sao cho vị trí của chúng trên trục tương ứng thể hiện giá trị của hai biến số.

Một số khía cạnh quan trọng trong một biểu đồ phân tán:

  • Mối quan hệ tuyến tính / phi tuyến tính: Nếu các điểm nằm trên biểu đồ phân tán thẳng hàng với nhau ⇒ Một mối quan hệ tuyến tính. Ngược lại, nếu các điểm không thẳng hàng có hình dạng cong ⇒ Mối quan hệ phi tuyến tính.
  • Mức độ mạnh yếu của mối quan hệ: Nếu các điểm trên biểu đồ tán xạ gần nhau và có xu hướng tạo thành hình dạng gần thẳng hoặc một đường thẳng ⇒ Mối quan hệ mạnh. Nếu các điểm phân tán cách xa nhau và không có hình dạng rõ ràng ⇒ Mối quan hệ yếu.

Để làm rõ hơn về mối quan hệ và xu hướng trên Scatter Diagram, ta có thể sử dụng đường xu hướng. Đường xu hướng là một đường thẳng hay đường cong được vẽ trên biểu đồ Scatter để hướng dẫn, mô tả xu hướng chung của dữ liệu.

3. Ý nghĩa của biểu đồ phân tán trong quản lý chất lượng

Là một trong 7 công cụ quản lý chất lượng cơ bản (7 Basic QC Tools), biểu đồ phân tán có ý nghĩa quan trọng, mang lại các giá trị cho doanh nghiệp như:

  • Thể hiện mối quan hệ giữa hai biến: Scatter Diagram hiển thị mối quan hệ giữa hai biến một cách trực quan giúp doanh nghiệp quan sát sự tương quan của mối quan hệ đó. Mối quan hệ có thể là tỷ lệ thuận hay nghịch với nhau, mang tính tích cực hoặc tiêu cực.
  • Nhận diện mẫu dữ liệu và dự đoán xu hướng: Doanh nghiệp có thể xác định tình trạng và dự đoán xu hướng về mẫu dữ liệu trong tương lai thông qua biểu đồ Scatter. Ví dụ: Scatter Diagram có thể được sử dụng để xác định xem doanh nghiệp sẽ xảy ra tình trạng sản phẩm có bị lỗi nhiều hơn vào thời điểm nào trong năm. Từ đó dự đoán được số lượng tình trạng lỗi vào các năm tiếp theo.
  • Xác định các điểm ngoại lai: Điểm ngoại lai là các điểm dữ liệu sai khác không tuân theo sự tương quan chung, nó thường phân bổ cách xa các điểm còn lại của biểu đồ. Biểu đồ phân tán giúp doanh nghiệp dễ dàng phát hiện các điểm này, từ đó xem xét liệu đó có phải là tín hiệu của các vấn đề hoặc sai sót phát sinh trong quá trình quản lý chất lượng hay không.

4. Ưu và nhược điểm của Scatter diagram

Mỗi công cụ đều sẽ có ưu và nhược điểm riêng, biểu đồ phân tán cũng không phải là ngoại lệ. Cụ thể như sau:

4.1. Ưu điểm của Scatter Diagram

- Biểu diễn mối quan hệ giữa các dữ liệu một cách rõ ràng, dễ hiểu: Biểu đồ phân tán cho thấy hướng, tính tuyến tính và độ mạnh của mối quan hệ giữa hai biến số. Bằng cách nhìn vào hình dạng của các điểm trên biểu đồ Scatter, chúng ta có thể nhận ra các xu hướng tiềm ẩn trong dữ liệu. 

- Dễ dàng để xây dựng: Scatter Diagram là một công cụ đồ họa đơn giản và linh hoạt, không đòi hỏi có nhiều dữ liệu để vẽ. Chỉ cần có ít nhất hai hàng dữ liệu số hoặc cột và tiêu đề tương ứng, chúng ta có thể vẽ biểu đồ phân tán bằng nhiều phần mềm khác nhau như Excel, R, Tableau, Python, Power BI, Spotfire,...

- Dễ dàng xác định được phạm vi dữ liệu: Scatter Diagram cho thấy giá trị nhỏ nhất,  trung bình và lớn nhất của mỗi biến số trên trục ngang và trục dọc. Chúng ta cũng có thể sử dụng các công cụ như khoảng dự đoán hay khoảng tin cậy để ước lượng giá trị của một biến số khi biết được giá trị của biến số kia.

4.2. Nhược điểm của Scatter Diagram

- Không hiệu quả trong các trường hợp có quá nhiều dữ liệu: Khi dữ liệu quá lớn, các chấm trên biểu đồ phân tán có thể bị xếp chồng lên nhau, làm mất đi sự trực quan, rõ ràng và khả năng phân tích của biểu đồ Scatter. Điều này cũng có thể gây ra hiện tượng overplotting - Sự chồng lắp của các thành phần hình họa (điểm) khi chúng có cùng tọa độ hay rất gần nhau. Ví dụ: Mật độ điểm quá dày khiến chúng chồng lên nhau một cách hỗn loạn:

bieu-do-phan-tan-scatter-diagram-la-gi-2

⇒ Giải pháp: Sử dụng các kỹ thuật như làm mờ, thay đổi màu sắc hoặc kích thước của các chấm trong biểu đồ Scatter hoặc sử dụng các công cụ, biểu đồ khác.

- Đôi khi các biến có sự liên kết nhưng không có ý nghĩa về quan hệ: Thường khi hai biến số trên Scatter Diagram có mối tương quan cao, nghĩa là chúng có xu hướng thay đổi cùng nhau. Tuy nhiên, điều này không đồng nghĩa với việc chúng sẽ có mối quan hệ nguyên nhân - kết quả. Có thể hai biến số đó chỉ là những biến trung gian cho một biến số khác, hoặc đó chỉ là sự trùng hợp ngẫu nhiên. 

Để xác định được mối quan hệ nguyên nhân – kết quả, cần phải có sự nghiên cứu kỹ lưỡng và phân tích bổ sung để loại trừ các yếu tố ngẫu nhiên và xác định được cơ chế tương quan giữa 2 biến số.

⇒ Giải pháp: Chọn lọc những biến phù hợp khi biểu diễn biểu đồ Scatter.

5. Các bước để tạo một biểu đồ phân tán

Để tạo một Scatter Diagram, chúng ta cần thực hiện theo 4 bước sau:

Bước 1: Xác định và thu thập dữ liệu của các cặp biến số. Số lượng các cặp biến số cần phải lớn hơn 30. 

Bước 2: Vẽ đồ thị, trục tung y là một biến số, trục hoành x là kết quả của biến số đó hoặc một biến số thứ hai

Bước 3: Biểu diễn các điểm nằm trên biểu đồ scatter bằng các điểm thể hiện mối tương quan giữa hai biến số. Nếu những điểm trùng nhau thì sử dụng ký hiệu khác nhau để phân biệt.

Bước 4: Đánh giá về mối quan hệ giữa hai biến số theo hệ số tương quan:

  • Nếu hệ số tương quan dương ⇒ Mối tương quan thuận, khi đó sự gia tăng của biến số (biến độc lập) này sẽ dẫn đến sự gia tăng của biến số (biến phụ thuộc) kia.
  • Nếu hệ số tương quan âm ⇒ Mối tương quan nghịch, khi đó sự gia tăng của biến số (biến độc lập) này sẽ dẫn đến sự giảm kết quả của biến số (biến phụ thuộc) kia.
  • Nếu hệ số tương quan bằng 0 ⇒ Không có mối tương quan giữa hai biến.

6. Hướng dẫn chi tiết cách tạo và đọc biểu đồ phân tán trong Excel

Để hình dung rõ về các bước tạo một hơn Scatter Diagram trong Excel, chúng ta có một tình huống cụ thể: Một tập dữ liệu tổng hợp ngân sách marketing (Mktng Exp) và doanh thu (Revenue) của 10 công ty như hình bên dưới và chúng ta sẽ tạo một biểu đồ phân tán bằng cách sử dụng nguồn dữ liệu này.

bieu-do-phan-tan-scatter-diagram-la-gi-3

Mục đích của việc này nhằm xét xét có sự tương quan giữa Mktng Exp và doanh thu Revenue hay không. Cột bên trái (Mktng Exp) sẽ được biểu diễn ở trên Trục hoành và (Revenue) sẽ được biểu diễn ở trên Trục tung của biểu đồ Scatter.

6.1. Chi tiết các bước tạo biểu đồ phân tán trong Excel

Bước 1: Chọn các cột chứa dữ liệu (B1-C11)

bieu-do-phan-tan-scatter-diagram-la-gi-4

Bước 2: Chọn Insert

bieu-do-phan-tan-scatter-diagram-la-gi-5

Bước 3: Trong nhóm Chart, chọn biểu tượng Insert Scatter Chart

bieu-do-phan-tan-scatter-diagram-la-gi-6

Bước 4: Nhấp vào tùy chọn Scatter Chart trong những biểu đồ xuất hiện

bieu-do-phan-tan-scatter-diagram-la-gi-7

Sau khi thao tác các bước, chúng ta sẽ có một biểu đồ phân tán được hiển thị như hình bên dưới:

bieu-do-phan-tan-scatter-diagram-la-gi-8

6.2 Cách thêm đường xu hướng vào Scatter Diagram

Để trực quan hơn, việc cần làm tiếp theo sau khi tạo biểu đồ phân tán là thêm đường xu hướng. Điều này giúp chúng ta dễ dàng xác định nguồn 2 biến số có mối quan hệ tỷ lệ thuận hay nghịch nhau. Sau đây là các bước để thêm đường xu hướng vào Scatter Diagram trong Excel:

Bước 1: Nhấp chọn biểu đồ Scatter đã tạo trước đó.

Bước 2: Nhấp vào Chart Design. 

bieu-do-phan-tan-scatter-diagram-la-gi-9

Bước 3: Trong Chart Layouts, nhấp vào Add Chart Element

bieu-do-phan-tan-scatter-diagram-la-gi-10

Bước 4: Chọn Trendline rồi nhấp vào Linear

bieu-do-phan-tan-scatter-diagram-la-gi-11

Sau đó, biểu đồ phân tán sẽ xuất hiện một đường xu hướng sẽ xuất hiện.

bieu-do-phan-tan-scatter-diagram-la-gi-12

Khi nhìn vào các điểm dữ liệu được phân bổ và đường xu hướng trong biểu đồ Scatter, chúng ta có thể hình dung được sự tương quan.

6.3 Đọc kết quả của biểu đồ

Sau khi đã tạo được biểu đồ, chúng ta sẽ tiến hành phân tích và đọc kết quả:

  • Trong ví dụ, chúng ta thấy đường xu hướng có chiều hướng đi lên⇒ Dữ liệu có tương quan đồng thuận. Nghĩa là khi Mktng Exp tăng lên thì Revenue cũng sẽ tăng lên và ngược lại.
  • Nếu chiều của đường xu hướng đi xuống ⇒ Hai biến sẽ có mối quan hệ nghịch đảo. Điều này thể hiện nếu chi phí tăng lên thì doanh thu sẽ giảm xuống và ngược lại.
  • Sẽ có trường hợp cả 2 biến này không có mối tương quan. Nghĩa là nếu chi phí tiếp thị tăng lên, doanh thu của họ có thể sẽ tăng hoặc không tăng.

Lưu ý rằng đường xu hướng trong Biểu đồ Scatter chỉ cho biết dữ liệu có tương quan thuận hay nghịch. Nó không thể hiện được tỷ lệ chính xác là bao nhiêu phần trăm. Như ví dụ trên, khi quan sát đường xu hướng, chúng ta không thể kết luận Revenue sẽ tăng bao nhiêu % khi chi phí tiếp thị tăng 50%. 

Tuy nhiên, trong trường hợp cụ thể thì con số này có thể được tính toán bằng cách dùng hệ số tương quan với công thức sau:

=CORREL(B2:B11,C2:C11)

Hệ số tương quan nằm trong khoảng từ -1 → 1, trong đó 1 biểu thị là mối tương quan cao nhất và -1 biểu thị là mối tương quan thấp nhất. Trong trường hợp trên con số đó là 0,945, nó thể hiện rằng hai biến Mktng Exp và Revenue có mối tương quan đồng thuận cao.

7. Lưu ý khi phân tích biểu đồ phân tán

Khi phân tích một biểu đồ phân tán, có rất nhiều yếu tố quan trọng ảnh hưởng và tác động tới các biến cần xem xét. Trong đó, có 5 yếu tố cần phải chú ý đặc biệt đến:

  • Đừng cho rằng biến này gây ra biến kia ngay cả khi Scatter Diagram cho thấy một mối quan hệ. Cũng có thể do cả hai biến đều bị ảnh hưởng bởi một biến thứ ba nào đó.
  • Khi dữ liệu được thể hiện lên biểu đồ, nếu biểu đồ Scatter càng giống một đường thẳng ⇒ Mối quan hệ càng chặt chẽ.
  • Nếu một đường không rõ ràng, số liệu thống kê xác định liệu có sự chắc chắn hợp lý rằng đó có phải một mối quan hệ tồn tại hay không. Nếu số liệu thống kê nói rằng không có mối quan hệ nào tồn tại ⇒ Mô hình có thể xảy ra một cách ngẫu nhiên.
  • Nếu biểu đồ phân tán không hiển thị về mối quan hệ giữa các biến, hãy xem xét xem liệu dữ liệu có thể được phân tầng hay không.
  • Nếu biểu đồ Scatter không thể hiện một mối quan hệ nào, hãy xem xét liệu biến độc lập (trục Ox) có bị thay đổi nhiều hay không. Đôi khi một mối quan hệ không rõ ràng do phạm vi của dữ liệu không đủ rộng.

Kết luận

Biểu đồ phân tán là một công cụ rất quan trọng trong quản lý chất lượng, giúp trực quan hóa dữ liệu đơn giản và hiệu quả để phân tích mối tương quan giữa hai biến số. Biểu đồ này sử dụng các điểm dữ liệu để biểu diễn mối liên hệ giữa hai biến số trên hệ tọa độ. Hình dạng của đường xu hướng đi qua các điểm dữ liệu có thể cung cấp thông tin về mức độ và loại mối tương quan giữa hai biến số.

Ngoài biểu đồ Scatter, doanh nghiệp có thể kết hợp cùng các công cụ quản lý chất lượng khác như check sheet, biểu đồ xương cá, biểu đồ histogram,... và ứng dụng phần mềm quản lý sản xuất (MES Software) giúp tăng khả năng đánh giá và kiểm soát chất lượng một cách tự động và hiệu quả hơn theo thời gian thực. Liên hệ ngay với Đơn vị cung cấp giải pháp tự động hóa DACO qua số hotline: 0904.675.995 - Minh Anh để được tư vấn hoàn toàn miễn phí.


Tin Mới

Sản Phẩm Nổi Bật