Phân tích dữ liệu trong Nghiên cứu khoa học sư phạm ứng dụng

Phân tích dữ liệu là BƯỚC THỨ SÁU của quá trình nghiên cứu. Phân tích các dữ liệu thu được để đưa ra kết quả chính xác trả lời cho câu hỏi nghiên cứu.

 Tại sao sử dụng thống kê trong NCKHSPƯD?

Trước hết, thống kê được coi là “ngôn ngữ thứ hai” để biểu đạt một cách khách quan các kết quả nghiên cứu. Thống kê là phương tiện giúp giáo viên - người nghiên cứu truyền đạt một cách đầy đủ các kết quả nghiên cứu tới những người quan tâm như đồng nghiệp, cán bộ quản lý nhà trường hoặc các nhà nghiên cứu khác.

 

doc20 trang | Chia sẻ: ngochuyen96 | Lượt xem: 1647 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Phân tích dữ liệu trong Nghiên cứu khoa học sư phạm ứng dụng, để tải tài liệu về máy bạn click vào nút TẢI VỀ ở trên
ử dụng các tiêu chí của Cohen, trong đó phân ra các mức độ ảnh hưởng từ không đáng kể đến rất lớn.
Giá trị mức độ ảnh hưởng 
Ảnh hưởng
> 1,00
Rất lớn
0,80 – 1,00
Lớn
0,50 – 0,79
Trung bình
0,20 – 0,49
Nhỏ
< 0,20
Rất nhỏ
Về mặt lý thuyết, không có giới hạn trên của mức độ ảnh hưởng. Giá trị SMD = 0,63, mức độ ảnh hưởng nằm ở mức trung bình, nghĩa là tác động mang lại ảnh hưởng ở mức độ trung bình. 
Tác động của NC được xác định thông qua mức độ ảnh hưởng là một cơ sở tốt để người quản lý đưa ra quyết định. Ví dụ, nhà trường có thể lựa chọn thực hiện các nghiên cứu có ảnh hưởng lớn hơn thay vì các nghiên cứu có ảnh hưởng nhỏ.
 Các bước kiểm tra mức độ ảnh hưởng
Tính độ lệch chuẩn theo công thức trong phần mềm Excel:
 =Stdev(number1, number 2, )
2. Tính độ chênh lệch giá trị trung bình chuẩn (SMD) theo công thức:
SMD =
Trung bình thực nghiệm – Trung bình đối chứng
Độ lệch chuẩn đối chứng
3. So sánh giá trị của mức độ ảnh hưởng với bảng tiêu chí Cohen:
Giá trị mức độ ảnh hưởng 
Ảnh hưởng
Trên 1,00
Rất lớn
0,80 đến 1,00
Lớn
0,50 đến 0,79
Trung bình
0,20 đến 0,49
Nhỏ
Dưới 0,20
Không đáng kể
4. Kết luận mức độ ảnh hưởng
4. Phép kiểm chứng Khi bình phương
Đối với các dữ liệu rời rạc, chúng ta sử dụng phép kiểm chứng Khi bình phương thay vì phép kiểm chứng t-test. Chúng ta cùng xét ví dụ sau. Có hai hạng mục phân biệt (“Đỗ” và “Trượt”) về kết quả kiểm tra của nhóm thực nghiệm và nhóm đối chứng. Dựa vào điểm số quy định đỗ và trượt, số học sinh trong mỗi hạng mục được liệt kê vào bảng tương ứng.
Trong nhóm thực nghiệm, số học sinh đỗ (108) nhiều hơn số học sinh trượt (42). Trong nhóm đối chứng, số học sinh đỗ (17) ít hơn số học sinh trượt (38). Đối với dữ liệu này, câu hỏi đặt ra là liệu có tương quan có ý nghĩa giữa thành phần nhóm (nhóm thực nghiệm và nhóm đối chứng) và các hạng mục kết quả (đỗ và trượt) hay không. Nói cách khác, hai câu hỏi đặt ra là:
Học sinh nhóm thực nghiệm có khả năng đỗ cao hơn không?
Học sinh nhóm đối chứng có khả năng trượt cao hơn không?
Để tính giá trị p, có thể sử dụng phần mềm Khi bình phương sẵn có trên mạng internet. Tất cả những gì các bạn cần làm là đưa dữ liệu vào mỗi hạng mục, và phần mềm sẽ tự động tính kết quả. Chúng ta chỉ quan tâm đến giá trị p. 
Khác với phép kiểm chứng t-test cho biết giá trị p khi so sánh hai giá trị trung bình, phép kiểm chứng Khi bình phương chỉ tính được một giá trị p cho toàn bộ bảng dữ liệu. 
Trên cơ sở tính được giá trị p=9x10-8, nhỏ hơn 0,001, có thể kết luận rằng có tương quan có ý nghĩa giữa thành phần nhóm và kết quả.
Tất cả các dữ liệu trong bảng ma trận này KHÔNG xảy ra ngẫu nhiên. Điều này có nghĩa là học sinh trong nhóm thực nghiệm có khả năng đỗ nhiều hơn và học sinh trong nhóm đối chứng có khả năng trượt nhiều hơn.
Có thể sử dụng phép kiểm chứng Khi bình phương cho các bảng dữ liệu có số cột và hàng khác nhau. Nói cách khác, thành viên nhóm có thể thuộc nhiều hơn hai hạng mục (Phương pháp A, Phương pháp B, và nhóm đối chứng). Tương tự như vậy, có thể có nhiều hơn hai hạng mục kết quả (ví dụ: Cao, Trung bình, Thấp).
Đối với các dữ liệu về thái độ, các hạng mục phản hồi có thể tuân theo thiết kế của thang đo thái độ (Ví dụ: Hoàn toàn đồng ý, Đồng ý, Bình thường, Không đồng ý, Hoàn toàn không đồng ý).
Phép kiểm chứng Khi bình phương đòi hỏi tất cả dữ liệu trong các ô phải có giá trị lớn hơn 5 để đảm bảo độ tin cậy của phép tính. Trong ví dụ này, chúng ta có thể kết hợp một số cột liền kề để một bảng có kích thước hàng cột là 3x3 trở thành 2x2, Chẳng hạn, có thể kết hợp Lớp “Sao” và Lớp “Khác” thành Nhóm thực nghiệm, kết hợp Miền 1 và Miền 2-3 thành mục “Đỗ”.
Các bước thực hiện phép kiểm chứng khi bình phương 
(Đối với các dữ liệu rời rạc)
Truy cập vào công cụ tính khi bình phương 
Vào địa chỉ:  trên Internet để sử dụng công cụ tính khi bình phương
2. Nhập dữ liệu vào bảng theo ví dụ trên:
3. Kích chuột vào ô “Calculate” kết quả hiện ra.
4. Lấy giá trị p (p-value) (trong bảng trên là 9*e-8 - tương đương 0.00000009) so sánh với bảng tham chiếu “Kiểm tra sự tương quan giữa các thành phần nhóm và kết quả” sau: 
Khi kết quả
Tương quan giữa thành phần nhóm và kết quả
p ≤ 0,001 Þ
Tương quan CÓ Ý NGHĨA
(các dữ liệu KHÔNG CÓ KHẢ NĂNG xảy ra ngẫu nhiên)
p > 0,001 Þ
Tương quan KHÔNG có ý nghĩa
(các dữ liệu CÓ KHẢ NĂNG xảy ra ngẫu nhiên)
5. Kết luận tương quan giữa thành phần nhóm và kết quả có ý nghĩa hay không.
III. Liên hệ dữ liệu (tương quan dữ liệu)
Chức năng thứ ba của thống kê trong nghiên cứu tác động là liên hệ dữ liệu. 
Để xem xét mối liên hệ giữa hai dữ liệu cùng một nhóm, ta sử sụng Hệ số tương quan Pearson (r).
Khi nhóm duy nhất thực hiện hai bài kiểm 
tra hoặc làm một bài kiểm tra hai lần, chúng ta cần biết tương quan giữa điểm số của hai bài kiểm tra. Hệ số tương quan Pearson (r) được sử dụng để đo mức độ tương quan.
Ví dụ: Tìm tương quan giữa chiều cao và cân nặng của một nhóm người tham gia nghiên cứu. Mặc dù chúng ta đều biết không phải lúc nào một người cao hơn cũng nặng hơn, nhưng có thể tính hệ số tương quan (r) để đo mức độ của mối quan hệ tuyến tính giữa hai biến (chiều cao và cân nặng).
Khi một nhóm duy nhất được đo bằng hai bài kiểm tra hoặc làm một bài kiểm tra hai lần, chúng ta cần đặt một trong các câu hỏi sau:
Mức độ tương quan của hai tập hợp điểm như thế nào?
Kết quả bài kiểm tra sau tác động có phụ thuộc vào kết quả bài kiểm tra trước tác động không?
Từ ví dụ trong bảng, chúng ta cần biết trong mỗi nhóm:
Kết quả kiểm tra ngôn ngữ có ảnh hưởng tới kết quả kiểm tra trước và sau tác động không?
Kết quả kiểm tra trước tác động có ảnh hưởng đến kết quả kiểm tra sau tác động không?
Để tính sự tương quan giữa 2 hàng dữ liệu, chúng ta sẽ tính hệ số tương quan (r) theo công thức trong phần mềm Excel: 
r =correl(array 1,array 2)
Áp dụng công thức trên vào ví dụ kết quả các hệ số tương quan (r) như sau:
Nhóm thực nghiệm
Nhóm đối chứng
Giá trị r
Tương quan
Giá trị r
Tương quan
KT ngôn ngữ - KT trước tác động
0,39
Trung bình
0,31
Trung bình
KT ngôn ngữ - KT sau tác động
0,36
Trung bình
0,25
Nhỏ
KT trước – KT sau tác động
0,92
Gần như hoàn toàn
0,93
Gần như
hoàn toàn
Để giải thích giá trị r, chúng ta sẽ tra bảng Hopkin. Bảng này mô tả sự tương quan từ rất nhỏ đến gần như hoàn toàn. 
Trong trường hợp này, điều thú vị là với nhóm thực nghiệm, bài kiểm tra ngôn ngữ có tương quan trung bình đến kết quả kiểm tra trước tác động (r = 0,39) và kiểm tra sau tác động (r = 0,36). Đối với nhóm đối chứng, bài kiểm tra ngôn ngữ có tương quan trung bình đến bài kiểm tra trước tác động (r = 0,31) và có tương quan nhỏ đến bài kiểm tra sau tác động (r = 0,25).
Với cả hai nhóm, giá trị độ tương quan (r) giữa kết quả kiểm tra trước và sau tác động lần lượt là 0,92 và 0,93. Giá trị này cho chúng ta thấy, đối với cả hai nhóm, kết quả kiểm tra trước tác động có độ tương quan gần như hoàn toàn với kết quả kiểm tra sau tác động. Điều này có nghĩa là trong cả hai nhóm, những học sinh làm tốt bài kiểm tra trước tác động cũng sẽ đạt kết quả cao trong bài kiểm tra sau tác động.
Một phương pháp khác để hiểu mức độ tương quan của dữ liệu là sử dụng biểu đồ phân tán. Hai biểu đồ phân tán dưới đây cho biết tương quan của các dữ liệu trong nhóm thực nghiệm. Mỗi điểm trên biểu đồ biểu thị điểm hai bài kiểm tra của một học sinh. Sau khi vẽ ra tất cả các điểm, chúng ta vẽ một đường thẳng xu hướng để kiểm tra độ tương quan.
Chúng ta hiểu rằng giá trị r = 0,39 biểu thị tương quan ở mức trung bình, các điểm trong biểu đồ phân tán về cả hai phía của đường thẳng xu hướng nhiều hơn so với biểu đồ có giá trị r = 0,92. Với hệ số tương quan giữa bài kiểm tra trước và sau tác động r = 0,92, chúng ta kết luận tương quan của hai bài kiểm tra này là gần như hoàn toàn. Hầu hết các điểm trên biểu đồ phân bố tập trung xung quanh đường thẳng xu hướng cho thấy những học sinh có kết quả cao trong bài kiểm tra trước tác động cũng sẽ đạt kết quả cao trong bài kiểm tra sau tác động. 
Các bước xem xét mối liên hệ giữa hai dữ liệu cùng một nhóm
Tính hệ số tương quan Pearson ( r ) bằng công thức trong phần mềm Excel :
 r =correl(array 1,array 2)
Giải nghĩa giá trị hệ số tương quan (r) theo bảng tham chiếu Hopkins:
Giá trị r
Mức độ tương quan
< 0,1
Không đáng kể
0,1 – 0,3
Nhỏ
0,3 – 0,5
Trung bình
0,5 – 0,7
Lớn
0,7 – 0,9
Rất lớn
0,9 – 1
Gần hoàn hảo
Kết luận mức độ tương quan.
Lưu ý:
Trong thực tế, ta chỉ quan tâm tới tương quan từ mức TRUNG BÌNH và lớn hơn.
Hệ số tương quan chỉ cho ta thấy 2 hàng dữ liệu có sự tương quan. Nhưng nó không cho chúng ta biết được dữ liệu nào là nguyên nhân và dữ liệu nào là kết quả. Trong ví dụ trên, mặc dù chúng ta biết điểm Ngôn ngữ và Văn học có sự tương quan ở mức trung bình nhưng không thể biết được liệu năng lực Ngôn ngữ có ảnh hưởng đến Văn học hoặc ngược lại.
Thiết kế nghiên cứu và thống kê
Thiết kế nghiên cứu và thống kê có mối quan hệ mật thiết với nhau. Nói cách khác, các kỹ thuật thống kê sử dụng trong nghiên cứu được thể hiện trong thiết kế nghiên cứu. Chúng ta hãy tóm tắt lại các kỹ thuật thống kê vừa tìm hiểu trong mối liên hệ với các thiết kế nghiên cứu.
Không thể sử dụng hệ số tương quan (r) 
ở đây, vì sao?
Đối với nhóm thực nghiệm (N1), O1 và O3 là các bài kiểm tra trước và sau tác động của cùng một nhóm. Trong trường hợp này, chúng ta sử dụng phép kiểm chứng t-test theo cặp để xem xét liệu giá trị chênh lệch êO3 – O1êcó ý nghĩa hay không. Chúng ta cũng có thể tính Mức độ ảnh hưởng để biết ảnh hưởng của tác động X và tìm hệ số tương quan để biết tương quan giữa bài kiểm tra trước và sau tác động.
Có thể thực hiện tương tự như vậy với hai tập hợp điểm (O2 và O4) đối với nhóm đối chứng (N2).Trong hàng dưới, chúng ta sử dụng phép kiểm chứng t-test độc lập để xem xét sự tương đương giữa hai nhóm trước khi có tác động bằng cách kiểm tra giá trị chênh lệch êO1 -O2ê. Chúng ta cũng có thể tính mức độ ảnh hưởng, nhưng không tính được hệ số tương quan (r). Thực hiện tương tự với các bài kiểm tra sau tác động (O3 và O4).

File đính kèm:

  • docB4.Phan tich du lieu.doc
  • xlsBT tham khao.xls
  • xlsThuc hanh tinh toan.xls