Phương pháp T-Test được dùng để xác định giá trị trung bình của một quần thể có sự khác biệt về giá trị trung bình giả thiết hoặc giá trị trung bình của quần thể khác. Phương pháp này có tác dụng để kiểm định số liệu và hỗ trợ các nhà nghiên cứu đưa ra kết luận giá trị nhất. Vậy T-Test là gì, cách thực hiện T-Test và đọc kết quả ra sao? Cùng Luận Văn 24 tìm hiểu trong bài viết dưới đây.
1. Khái niệm chính xác “T-Test là gì”?
T-Test là gì? Kiểm định T-Test là phương pháp được ứng dụng thường xuyên để kiểm tra sự khác nhau của giá trị trung bình biến đơn với giá trị cho trước hoặc giá trị trung bình tổng thể.
Nếu bạn quan tâm đến phần mềm SPSS chắc hẳn sẽ hiểu tầm trong trọng của T-Test trong SPSS là gì và hiểu được ý nghĩa của nó.
Thông thường, người nghiên cứu sẽ thực hiện phương pháp này để bác bỏ hoặc chấp nhận giải thiết ban đầu đưa ra và cho ra chỉ số ý nghĩa quan sát tốt nhất.
2. 3 loại kiểm định T-Test
2.1 Kiểm định One-Sample T-Test
Đây là loại kiểm định dùng để so sánh giá trị trung bình tổng với số cụ thể.
2.2. Kiểm định Independent-Samples T-Test
Đây là loại phương pháp dùng để so sánh hai giá trị trung bình với hai tổng thể độc lập.
2.3. Kiểm định Paired-Sample T-Test
Là loại phương pháp so sánh giá trị trung bình hai tổng thể riêng có những phần tử tương đồng theo cặp với nhau.
Để tìm hiểu chi tiết về 3 loại kiểm định T-test trên, bạn có thể tham khảo tại bài viết này: 3 loại kiểm định T-test trong SPSS
3. Ví dụ về “kiểm định T-test” dễ hiểu
Nếu chỉ đọc khái niệm T-Test là gì chắc hẳn bạn đọc khó có thể hình dung về phương pháp này. Vì vậy, Luận Văn 24 sẽ chia sẻ đến bạn đọc nhưng ví dụ cụ thể như sau:
3.1. Ví dụ về “Kiểm định One-Sample T-Test”
Để hiểu rõ hơn về kiểm định One Sample T Test là gì bạn có thể tham khảo ví dụ dưới đây:
Tìm kiếm độ tuổi kết hôn trung bình của nữ giới tại Việt Nam cao hơn hay bằng 20 tuổi. Phát biểu giả thiết thống kê là
H0: Độ tuổi kết hôn trung bình của nữ giới là nhỏ hơn hoặc bằng 20
H1: Độ tuổi kết hôn trung bình nữ giới lớn hơn 10
Các bước thực hiện như sau:
Bước 1: Chọn Analyze > Compare Means > One Samples T Test trên thanh công cụ
Bước 2: Chọn biến cần phân tích ở cột trái sang cột Test Variables qua nút mũi tên. Tại mục Test Value điền số 20
Bước 3: Nhấn Options chuyển qua cửa sổ mới và nhập độ tin cậy 95% nhấn Continue cho về cửa sổ trước
Bước 4: Có 2 bảng hiện lên là bảng One-Sample Statistics thống kê giá trị trung bình và độ lệch biến số và bảng One-Sample Test cho kết quả kiểm định. Bạn đọc và phân tích kết quả.
3.2. Ví dụ về “Kiểm định Independent-Samples T-Test”
Ví dụ sẽ giúp bạn hiểu rõ hơn về Independent Sample T test là gì như sau:
So sánh sự khác biệt giữa các nhóm giới tính nam, nữ với sự hài lòng trên thang điểm 5.
Bước 1: Chọn Analyze > Compare Means > Independent Sample T-Test
Bước 2: Chọn biến định lượng giá trị trung bình vào khung Test Variables
Bước 3: Chọn biến định tính chia số quan sát thành hai nhóm và so sánh hai nhóm đưa vào khung Grouping Variable
Bước 4: Chọn Define Groups nhập mã số hai nhóm và Continue trở lại hộp thoại chính
Bước 5: Nếu giá trị Sig trong kiểm định F< 0.05 thì phương sai hai tổng thể khác nhau và có thể sử dụng kết quả kiểm định ở Equal Variances not assumed. Nếu Sig > 0.05 thì phương sai hai tổng thể không khác nhau nên sử dụng kết quả kiểm định ở Equal Variances Assumed.
3.3. Ví dụ về “Kiểm định Paired-Sample T-Test”
T-test Paired Two Sample For Means là gì là từ khóa được nhiều người quan tâm. Để hiểu rõ hơn bạn có thể tham khảo ví dụ về cách phân tích Paired-Sample T-Test như sau:
Bước 1: Đặt giả thuyết Ho: “Không có sự khác nhau về trị hai trung bình tổng thể”, tức là khác biệt giữa 2 trung bình là bằng 0.
Bước 2: Thực hiện kiểm định Paired-Samples T-Test .
Bước 3: So sánh giá trị sig của kiểm định t được xác định ở bước 2 với 0.05 (mức ý nghĩa 5% = 0.05 | độ tin cậy 95%)
Bước 4: Nếu sig > 0.05 thì ta chấp nhận giả thuyết Ho. Nghĩa là trung bình 2 tổng thể là bằng nhau, không có sự khác biệt.
Nếu sig < 0.05 thì ta bác bỏ giả thuyết Ho. Nghĩa là có khác biệt trung bình 2 tổng thể.
Tìm hiểu thêm về phần mềm Eviews phân tích dữ liệu phức tạp và dự báo yếu tố cần nghiên cứu TẠI ĐÂY.
4. 3 Lý do khiến bạn cần kiểm định T-Test cho các kết quả
4.1. Xác thực kết quả có thực sự đúng hay không cho 1 biến lớn
Kiểm định T-Test giúp bạn xác định được kết quả có thực sự đúng so với giả thiết ban đầu.
Ví dụ như giả định tuổi kết hôn của nữ giới ở Việt Nam là lớn hơn 20 tuổi, việc thực hiện kiểm định T-Test giúp nhà nghiên cứu xác định xem thông tin giả định này có độ xác thực là bao nhiêu.
4.2. Xác định xem kết quả này có tốt hơn kết quả kia hay không (tổng quan)
Kiểm định T-Test giữa hai nhóm mẫu khác nhau giúp người sử dụng xác định xem nhóm kết quả nào tốt hơn kết quả kia và có kết quả nghiên cứu cuối cùng tốt nhất.
4.3. Đưa ra kết quả rõ ràng, xác thực
Nếu thực hiện đúng công thức xác định T-Test, bạn sẽ nhận được kết quả rõ ràng và có tính xác thực cao phục vụ cho quá trình nghiên cứu.
5. 4 giả định khi kiểm tra T-Test
5.1. Giả định liên quan đến thang đo
Giả thiết đầu tiên được đưa ra liên quan đến phép thử t liên quan đến thang đo. Giả định cho bài kiểm tra t là thang đo áp dụng cho dữ liệu thu thập được tuân theo thang đo liên tục hoặc theo thứ tự, chẳng hạn như điểm của bài kiểm tra IQ.
5.2. Giả định liên quan đến 1 mẫu ngẫu nhiên
Giả thiết thứ hai được đưa ra là một mẫu ngẫu nhiên đơn giản, dữ liệu được thu thập từ một phần đại diện, được chọn ngẫu nhiên của tổng dân số.
5.3. Giả định liên quan đến dữ liệu
Giả thiết thứ ba là dữ liệu, khi được vẽ biểu đồ, dẫn đến phân phối chuẩn, đường cong phân phối hình chuông.
5.4. Giả định liên quan đến tính đồng nhất của phương sai
Giả thiết cuối cùng là tính đồng nhất của phương sai. Phương sai đồng nhất, hoặc bằng nhau tồn tại khi độ lệch chuẩn của các mẫu xấp xỉ bằng nhau.
6. 3 giá trị chính khi tính toán kiểm tra T-Test
6.1. Sự khác biệt giữa các giá trị TB
Tính toán kiểm tra t yêu cầu ba giá trị dữ liệu chính. Chúng bao gồm sự khác biệt giữa các giá trị trung bình từ mỗi tập dữ liệu (được gọi là sự khác biệt trung bình), độ lệch chuẩn của mỗi nhóm và số lượng giá trị dữ liệu của mỗi nhóm.
Kết quả của phép thử t tạo ra giá trị t. Giá trị t được tính toán này sau đó được so sánh với giá trị thu được từ bảng giá trị tới hạn (được gọi là Bảng phân phối T). Sự so sánh này giúp xác định ảnh hưởng của cơ hội đơn thuần đối với sự khác biệt và liệu sự khác biệt có nằm ngoài phạm vi cơ hội đó hay không. Bài kiểm tra t đặt câu hỏi liệu sự khác biệt giữa các nhóm thể hiện sự khác biệt thực sự trong nghiên cứu hay nó có thể là sự khác biệt ngẫu nhiên vô nghĩa hay không.
6.2. Độ lệch chuẩn của mỗi nhóm
Phép thử T-Test tạo ra hai giá trị làm đầu ra của nó bao gồm giá trị T-Test và bậc tự do.
- Giá trị T-Test là tỉ số giữa sự khác biệt giữa giá trị trung bình của hai tập mẫu và sự biến thiên tồn tại trong các tập mẫu. Mặc dù giá trị tử số (sự khác biệt giữa giá trị trung bình của hai tập mẫu) có thể dễ dàng tính toán được nhưng mẫu số (biến thể tồn tại trong các tập mẫu) có thể trở nên phức tạp một chút tùy thuộc vào loại giá trị dữ liệu có liên quan. Mẫu số của tỷ lệ là phép đo độ phân tán hoặc độ biến thiên. Các giá trị cao hơn của giá trị T-test còn được gọi là điểm số t, chỉ ra rằng tồn tại sự khác biệt lớn giữa hai tập mẫu. Giá trị T-Test càng nhỏ thì càng có nhiều sự giống nhau giữa hai tập mẫu.
- Mức độ tự do đề cập đến các giá trị trong một nghiên cứu có quyền tự do thay đổi và rất cần thiết để đánh giá tầm quan trọng và tính hợp lệ của giả thuyết vô hiệu. Việc tính toán các giá trị này thường phụ thuộc vào số lượng bản ghi dữ liệu có sẵn trong tập mẫu.
6.3. Số lượng giá trị dữ liệu
Bảng phân phối chữ T có sẵn ở định dạng một đuôi và hai đuôi. Đầu tiên được sử dụng để đánh giá các trường hợp có giá trị hoặc phạm vi cố định với hướng rõ ràng (tích cực hoặc tiêu cực).
Ví dụ: xác suất giá trị đầu ra còn lại dưới -3 hoặc nhận được nhiều hơn bảy khi tung một cặp xúc xắc là bao nhiêu. Sau đó được sử dụng để phân tích giới hạn phạm vi, chẳng hạn như hỏi liệu tọa độ có nằm trong khoảng -2 đến +2 hay không. Các phép tính có thể được thực hiện với các chương trình phần mềm tiêu chuẩn hỗ trợ các chức năng thống kê cần thiết, như các chức năng được tìm thấy trong MS Excel.
Xem thêm: Hướng dẫn tải và cài đặt link SPSS đầy đủ và chi tiết của Luận Văn 24.
7. 3 công thức kiểm tra T-Test
7.1. Công thức kiểm tra T-Test liên quan
Chú thích:
mean1 and mean2: Các giá trị trung bình của bộ mẫu
s (diff): Độ lệch chuẩn của các giá trị dữ liệu ghép nối
n: Cỡ mẫu
n-1: Bậc tự do
Phép thử được thực hiện khi các mẫu thường bao gồm những cặp đơn vị tương tự phù hợp hoặc những trường hợp đo lặp lại. Ví dụ như trường hợp một bệnh nhân được kiểm tra nhiều lần và mỗi lần bệnh nhân sẽ sử dụng như một mẫu đối chứng để chống lại kết quả trước của chính họ.
Phương pháp này cũng được ứng dụng cho những mẫu liên quan theo cách nào đó hoặc đặc điểm phù hợp như so sánh liên quan đến quan hệ huyết thống. Nhìn chung là phép thử này liên quan hoặc ghép đôi có sự phụ thuộc với nhau.
Mặc dù giá trị trung bình của Bộ 2 cao hơn Bộ 1 nhưng chưa thể kết luận rằng dân số tương ứng với Bộ 2 có giá trị trung bình cao hơn tổng số tương ứng với Bộ 1. Sự khác biệt từ 19,4 đến 21,6 có thể là do ngẫu nhiên hoặc do sự khác biệt thực sự tồn tại trong quần thể tổng thể của tất cả các bức tranh nhận được trong phòng trưng bày nghệ thuật. Vì vậy, chúng ta thiết lập vấn đề bằng cách đặt giả thuyết rỗng rằng giá trị trung bình là như nhau giữa hai tập mẫu và tiến hành kiểm định t để kiểm tra xem giả thuyết có hợp lý hay không.
Vì số lượng bản ghi dữ liệu là khác nhau (n1 = 10 và n2 = 20) và phương sai cũng khác nhau, giá trị t và bậc tự do được tính cho tập dữ liệu trên bằng công thức được đề cập trong Kiểm định T-Phương sai không đồng đều.
Giá trị t là -2.24787. Vì có thể bỏ qua dấu trừ khi so sánh hai giá trị t nên giá trị được tính là 2,24787.
Giá trị bậc tự do là 24,38 và giảm xuống 24, do định nghĩa công thức yêu cầu làm tròn giá trị xuống giá trị nguyên ít nhất có thể.
Xác định chỉ định một mức xác suất (mức alpha, mức ý nghĩa, p) như một tiêu chí để chấp nhận. Trong hầu hết các trường hợp, giá trị 5% có thể được giả định.
Sử dụng giá trị bậc tự do là 24 và mức ý nghĩa 5%, xem bảng phân phối giá trị t cho giá trị là 2,064. So sánh giá trị này với giá trị được tính là 2,247 chỉ ra rằng giá trị T-Test được tính toán lớn hơn giá trị trong bảng với mức ý nghĩa là 5%. Do đó, có thể bác bỏ giả thuyết không có sự khác biệt giữa các phương tiện. Tập hợp dân số có những khác biệt nội tại và chúng không phải do ngẫu nhiên mà có.
7.2. Công thức phép thử T-Test phương sai bằng nhau
Chú thích:
mean1 và mean2: Giá trị trung bình của các bộ mẫu
var1 và var2: Phương sai của từng bộ mẫu
n1 và n2: Số bản ghi trong mỗi tập mẫu
n1+n2-2: Mức độ tự do
Kiểm định T-Test phương sai bằng nhau được sử dụng khi số lượng mẫu trong mỗi nhóm như nhau hoặc phương sai hai tập dữ liệu tương tự nhau.
7.3. Công thức kiểm tra T-Test phương sai không đều
Phép thử phương sai không bằng nhau được sử dụng khi số lượng mẫu trong mỗi nhóm khác nhau và phương sai hai tập dữ liệu cũng khác nhau. Phép thử này còn được gọi là phép thử T-Test Welch’s.
Chú thích:
mean 1 và mean 2: Giá trị trung bình của mỗi bộ mẫu
var1 và var2: Phương sai từng bộ mẫu
n1 và n2: Số bản ghi của mỗi mẫu
Ví dụ chúng ta thực hiện phép đo đường chéo của bức tranh trong phòng trưng bày nghệ thuật. Một nhóm mẫu sẽ bao gồm 10 bức tranh và nhóm còn lại là 20 bức tranh. Những tập dữ liệu và giá trị trung bình, phương sai tương ứng.
8. Lưu đồ xác định T-Test chính xác nên sử dụng
Lưu đồ dưới đây được nhiều nhà nghiên cứu sử dụng để xác định nên sử dụng T-Test nào dựa trên đặc tính của bộ mẫu. Những mục chính nên được xem xét kỹ càng như số liệu các bản ghi mẫu có giống nhau hay khác nhau, số liệu bản ghi trong mỗi mẫu và phương sai của mỗi bộ mẫu.
- Nhân tố khám phá EFA và cách chạy EFA trong spss
- Hướng dẫn cách chạy hồi quy đa biến spss
9. 4 bài học chính được rút ra cho câu hỏi “T-test là gì”
9.1. Câu hỏi T Test là gì
Kiểm định T-Test là phương pháp được ứng dụng thường xuyên để kiểm tra sự khác nhau của giá trị trung bình biến đơn với giá trị cho trước hoặc giá trị trung bình tổng thể.
9.2 Mục đích
T Test được dùng để xác định giá trị trung bình tổng thể có khác biệt như thế nào so với giá trị trung bình giả thiết hoặc giá trị trung bình của quần thể khác nhằm phục vụ cho nghiên cứu.
9.3. Ba dữ liệu chính
Có ba loại T-Test được ứng dụng hiện nay là:
- Kiểm định One-Sample T-Test
- Kiểm định Independent-Samples T-Test
- Kiểm định Paired-Sample T-Test
9.4. Sự phụ thuộc của các loại T-Test khác nhau
Để kết quả T-Test cuối cùng có sự chính xác cao phụ thuộc vào nhiều tiêu chí như kích cỡ hai mẫu so sánh, giá trị so sánh và dữ liệu của mẫu thu thập.
Trên đây là những chia sẻ về T-Test là gì và những thông tin liên quan đến phương pháp kiểm định này. Luận Văn 24 hy vọng bạn đã có thêm nhiều kiến thức bổ ích để phục vụ quá trình nghiên cứu của mình. Nếu bạn cảm thấy kiểm định khó khăn quá, bạn có thể tìm đến dịch vụ xử lý số liệu SPSS. Hãy liên hệ tới hotline: 0988552424 để có thể được tư vấn cụ thể và nhanh nhất.