TCVN 11183:2015 do Ban kỹ thuật tiêu chuẩn quốc gia TCVN/TC/F13 Phương pháp phân tích và lấy mẫu biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.

PHÂN TÍCH CẢM QUAN - PHƯƠNG PHÁP LUẬN - XẾP HẠNG

Sensory analysis - Methodology - Ranking

1 Phạm vi áp dụng

Tiêu chuẩn này quy định phương pháp đánh giá cảm quan với mục tiêu sắp xếp dãy mẫu thử theo thứ tự.

Phương pháp này cho phép đánh giá sự khác biệt giữa một số mẫu dựa trên cường độ của một thuộc tính đơn lẻ, của một số thuộc tính 1) hoặc của một cảm giác tổng thể. Phương pháp này được dùng để xác định sự khác biệt nếu có, nhưng không thể xác định mức độ của sự khác biệt giữa các mẫu.

Phương pháp này thích hợp trong các trường hợp sau:

a) đánh giá năng lực của người thử cảm quan

1) huấn luyện người thử;

2) xác định ngưỡng cảm nhận của các cá nhân hay của cả nhóm;

b) đánh giá sản phẩm

1) sắp xếp sơ bộ mẫu

i) theo một tiêu chí mô tả,

ii) theo thị hiếu;

2) xác định ảnh hưởng đến các mức cường độ của một hoặc nhiều chỉ tiêu (ví dụ như thứ tự của độ pha loãng, ảnh hưởng của nguyên liệu thô, của phương thức sản xuất, đóng gói hoặc bảo quản)

i) theo một tiêu chí mô tả,

ii) theo thị hiếu;

3) xác định thứ tự ưu tiên trong phép thử thị hiếu toàn diện.

2 Tài liệu viện dẫn

Các tài liệu viện dẫn sau rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi, bổ sung (nếu có).

TCVN 8244-1 (ISO 3534-1), Thống kê học - Từ vựng và kí hiệu - Phần 1: Thuật ngữ chung về thống kê và thuật ngữ dùng trong xác suất

TCVN 11182 (ISO 5492), Phân tích cảm quan - Thuật ngữ và định nghĩa

ISO 6658, Sensory analysis - Methodology - General guidance (Phân tích cảm quan - Phương pháp luận - Hướng dẫn chung)

ISO 8586-1:1993 *), Sensory analysis - General guidance for the selection, training and monitoring of assessors - Part 1: Selected assessors (Phân tích cảm quan - Hướng dẫn chung đối với việc lựa chọn, huấn luyện và giám sát người thử- Phần 1: Người thử được lựa chọn)

ISO 8586-2 ^*), Sensory analysis - General guidance for the selection, training and monitoring of assessors - Part 2: Experts (Phân tích cảm quan - Hướng dẫn chung đối với việc lựa chọn, huấn luyện và giám sát người thử- Phần 2: Chuyên gia)

ISO 8589, Sensory analysis - General guidance for the design of test rooms (Phân tích cảm quan - Hướng dẫn chung đối với việc thiết kế phòng thử nghiệm)

ISO 11035, Sensory analysis - Identification and selection of descriptors for establishing a sensory profile by a multidimensional approach (Phân tích cảm quan - Xác định và lựa chọn các thuật ngữ mô tả đối với việc thiết lập đặc tính cảm quan theo cách tiếp cận đa chiều)

ISO 11036, Sensory analysis - Methodology - Texture profile (Phân tích cảm quan - Phương pháp luận - Đặc tính cấu trúc)

3 Thuật ngữ và định nghĩa

Trong tiêu chuẩn này, áp dụng các thuật ngữ và định nghĩa nêu trong TCVN 11182 (ISO 5492) và TCVN 8244-1 (ISO 3534-1).

4 Nguyên tắc

Người thử nhận đồng thời ba mẫu hoặc nhiều hơn theo thứ tự ngẫu nhiên.

CHÚ THÍCH: Đối với việc xếp hạng hai mẫu thì phương pháp so sánh cặp đôi theo mô tả trong TCVN 4831 (ISO 5495)^[1] thường được chọn hơn.

Người thử được yêu cầu xếp hạng các mẫu theo các tiêu chí cụ thể: tiêu chí một chiều (nghĩa là thuộc tính cụ thể hoặc đặc tính cụ thể của một thuộc tính) hoặc cường độ toàn phần (cảm giác tổng thể).

Xác định thứ tự tổng thể và thực hiện so sánh thống kê.

5 Điều kiện thử nghiệm chung

Khi có thể, tham chiếu các tiêu chuẩn (xem ISO 6658) mô tả phương pháp lấy mẫu, phòng thử nghiệm (xem ISO 8589) và thiết bị, dụng cụ.

Khi chuẩn bị mẫu thử, cần xem xét các điểm quan trọng sau đây:

a) việc chuẩn bị, mã hóa và trình bày mẫu thử;

b) số lượng các mẫu có thể so sánh được một cách đáng tin cậy [xác định dựa trên bản chất của sản phẩm (các hiệu ứng bão hòa cảm giác)] và thiết kế được chọn; số lượng mẫu phải được lấy dựa trên:

1) loại sản phẩm [ví dụ: người thử được lựa chọn (ISO 8586-1) hoặc chuyên gia (ISO 8586-2) có thể đánh giá đến 15 mẫu đơn giản, trong khi người tiêu dùng chỉ có thể đánh giá tối đa 03 mẫu sản phẩm hăng/chát, cay hoặc chứa hàm lượng chất béo cao], và

2) tiêu chí đánh giá (ví dụ: vị ngọt thì ít bão hòa hơn vị đắng);

c) độ chiếu sáng đối với các mẫu.

6 Người thử

6.1 Trình độ

Trình độ của người thử phụ thuộc vào mục tiêu của phép thử (xem Phụ lục A).

Tất cả người thử tốt nhất nên có cùng trình độ, mức này được chọn dựa theo mục đích của phép thử:

a) người thử được lựa chọn hoặc chuyên gia, để:

1) huấn luyện người thử,

2) đánh giá dựa trên tiêu chí mô tả, ví dụ xác định nhanh tác động của mức cường độ của một hoặc nhiều chỉ tiêu (ví dụ: thứ tự độ pha loãng, ảnh hưởng của nguyên liệu thô, của phương pháp sản xuất, đóng gói hoặc bảo quản),

3) xác định ngưỡng cảm nhận của các cá nhân hoặc của nhóm;

b) người thử chưa qua huấn luyện hoặc người tiêu dùng, đã được huấn luyện về phương pháp:

1) để thực hiện phép thử thị hiếu ưu tiên,

2) khi sắp xếp sơ bộ các mẫu (để lựa chọn một vài sản phẩm từ số lượng lớn sản phẩm, như là phép thử sơ bộ).

Các điều kiện mà người thử phải tuân thủ được nêu trong ISO 6658, ISO 8586-1 và ISO 8586-2. Người thử phải được huấn luyện về quy trình xếp hạng và các từ mô tả được chọn để sử dụng.

6.2 Số lượng người thử

Số lượng người thử phụ thuộc vào mục tiêu của phép thử (xem Phụ lục A).

Khi kiểm tra năng lực của người thử, huấn luyện người thử hoặc xác định ngưỡng cảm giác của các cá nhân hay các nhóm thì không yêu cầu số lượng tối thiểu hay tối đa.

Đối với đánh giá mô tả sản phẩm, số lượng ngưởi thử tối thiểu được xác định qua mức độ của rủi ro thống kê chấp nhận được và phải phù hợp với ISO 11035 hoặc ISO 11036, tốt nhất chọn lấy từ 12 đến 15 người thử.

Đối với xác định thứ tự ưu tiên trong phép thử thị hiếu, số lượng người thử tối thiểu được xác định qua mức độ rủi ro thống kê chấp nhận được, ví dụ tối thiểu 60 người thử cho mỗi nhóm người tiêu dùng.

Đối với phân tích thống kê các kết quả, khi các yếu tố khác là tương đương (ví dụ: các điều kiện thử nghiệm, trình độ của người thử), số lượng người thử càng lớn thì xác suất phát hiện các sai khác có tính hệ thống càng lớn khi xếp hạng các sản phẩm.

6.3 Thảo luận sơ bộ

Người thử phải được thông báo về mục đích của phép thử, nghĩa là việc xếp hạng các mẫu thử.

Nếu cần, có thể thực hiện một minh họa của quy trình xếp hạng. Trong phép thử này, điều quan trọng là đảm bảo tất cả người thử đều có nhận thức chung về các tiêu chí của phép thử. Việc thảo luận sơ bộ không được tác động đến kì vọng của những người thử.

7 Cách tiến hành

7.1 Trình bày mẫu

Các mẫu phải được trình bày sao cho người thử không thể đưa ra kết luận về mẫu.

Chuẩn bị mẫu ngoài tầm nhìn của người thử và theo cách thống nhất: cùng thiết bị, dụng cụ, cùng lượng sản phẩm, cùng nhiệt độ và cùng cách trình bày. Tất cả sự khác biệt không thích hợp giữa các mẫu phải được che giấu để tránh tác động đến việc xếp hạng. Nên trình bày mẫu ở nhiệt độ sử dụng sản phẩm.

Dụng cụ đựng mẫu được nhận dạng bởi tổ hợp 3 chữ số, các số này được chọn ngẫu nhiên và khác nhau giữa các mẫu trong một buổi đánh giá (và tốt nhất là khác nhau giữa những người thử).

Việc trình bày phải tính đến thiết kế đã chọn. Trong một thiết kế “khối hoàn chỉnh”, mỗi người thử xếp hạng tất cả các mẫu. Đây là quy trình thường được chọn. Nhưng nếu số lượng mẫu hoặc bản chất của mẫu dẫn đến việc không thể xếp hạng tất cả các mẫu thì có thể sử dụng thiết kế “khối không hoàn chỉnh đã cân bằng”. Trong trường hợp đó, cần đảm bảo rằng mọi người thử hoàn thành phần công việc nêu trong thiết kế và không bỏ qua bất kì đánh giá nào.

Đối với thiết kế khối không hoàn chỉnh đã cân bằng, mỗi người thử được giới thiệu một tập con các mẫu theo thứ tự ngẫu nhiên (xem ví dụ trong Phụ lục C).

CHÚ THÍCH: Việc sử dụng một khối không hoàn chỉnh đã cân bằng chỉ khả thi nếu trong thực tế tồn tại dao động khối. Vì vậy, cần tìm được tài liệu về khối xác định trước, ví dụ Tài liệu tham khảo [5] trong Thư mục tài liệu tham khảo.

Mỗi người thử được giới thiệu k trong số p mẫu (k < p). Tập con k mẫu được xác định sao cho khi một phần tử thuộc thiết kế khối không hoàn chỉnh đã cân bằng, mỗi mẫu được đánh giá bởi n trong số j người thử (n < j) và mỗi cặp mẫu được đánh giá bởi g người thử. Có thể cần lặp lại toàn bộ thiết kế khối không hoàn chỉnh đã cân bằng vài lần để đạt được mức trung bình về độ nhạy trong phép xác định. Số lần lặp lại được kí hiệu là r. Tổng cộng, mỗi mẫu được đánh giá bởi r x n người thử và mỗi cặp mẫu được đánh giá bởi r x g người thử.

7.2 Mẫu chuẩn

Có thể dùng mẫu chuẩn. Khi đó, các mẫu chuẩn được bố trí lẫn trong dãy mẫu thử.

7.3 Kỹ thuật thử nghiệm

Tất cả người thử phải thực hiện trong cùng điều kiện thử nghiệm.

Người thử sẽ đánh giá mẫu được trình bày theo thứ tự ngẫu nhiên và xếp chúng theo thứ tự với thuộc tính định sẵn.

Hướng dẫn người thử tránh đồng nhất các thứ hạng2). Nếu một người thử không thể phân biệt hai hoặc nhiều mẫu thì hướng dẫn người thử xếp các mẫu theo thứ tự và ghi lại các mẫu không thể phân biệt trong phần ghi chú của phiếu trả lời.

Việc bố trí mẫu không được gây nên hiện tượng thích nghi cảm giác và các sản phẩm đủ ổn định, có thể cần hướng dẫn mỗi người thử thực hiện xếp hạng sơ bộ, sau đó khẳng định lại thứ tự này bằng cách đánh giá lại các mẫu theo thứ tự xếp hạng.

Một thuộc tính đơn phải được đánh giá bởi một phép thử riêng. Nếu cần thông tin về việc xếp hạng nhiều thuộc tính thì mỗi thuộc tính phải được đánh giá bằng một phép thử riêng.

7.4 Phiếu trả lời

Ví dụ về phiếu trả lời được nêu trong Phụ lục D.

Mã số mẫu không nên thể hiện trong phiếu trả lời trắng trong trường hợp vị trí của chúng ảnh hưởng đến kỳ vọng của người thử về thứ tự xếp hạng. Các thứ tự được gán cho các mẫu đơn lẻ phải được người thử ghi lại vào phiếu trả lời.

Tùy theo mục đích của phép thử và tùy thuộc mẫu thử, có thể cần ghi lại các thông tin bổ sung vào phiếu trả lời cụ thể.

8 Biểu thị và diễn giải kết quả

8.1 Tổng hợp kết quả và tính thứ hạng chung

Bảng 1 minh họa cho việc xếp hạng một thuộc tính bởi bảy người thử trên bốn mẫu. Nếu thực hiện xếp hạng liên quan đến nhiều thuộc tính thì cần lập bảng riêng cho từng thuộc tính.

Nếu có thứ hạng đồng nhất thì ghi lại thứ hạng trung bình của mẫu bị đồng nhất. Trong Bảng 1, người thử số 2 đã gán cùng thứ hạng cho mẫu B và mẫu C. Người thử số 3 đã gán cùng thứ hạng cho mẫu B, mẫu C và mẫu D.

Nếu dữ liệu không bị sót và nếu thứ hạng bị đồng nhất được tính đúng thì các hàng sẽ có cùng tổng. Thứ hạng chung đối với mỗi mẫu thu được bằng cách bổ sung thứ hạng trong mỗi cột. Các tổng thứ hạng cho thấy tính đồng nhất của thứ hạng được gán bởi toàn bộ nhóm người thử. Nếu tương thích thì các tổng thứ hạng sẽ rất khác nhau, nhưng nếu không tương thích thì các tổng thứ hạng sẽ tương tự nhau.

8.2 Phân tích thống kê và diễn giải

Kiểm định thống kê được chọn phụ thuộc vào mục đích của phép thử (xem Phụ lục A).

8.2.1 Xác định năng lực cá nhân: hệ số tương quan Spearman

Để xác định sự thống nhất giữa hai thứ tự xếp hạng (ví dụ: việc xếp hạng giữa hai người thử hoặc thứ tự xếp hạng của một người thử và thứ tự dự đoán qua thông tin về mẫu), hệ số tương quan Spearman, r_s, có thể tính như sau:

trong đó:

p là số lượng sản phẩm được xếp hạng;

d_i là chênh lệch giữa hai thứ hạng của mẫu thử i.

Nếu giá trị của hệ số tương quan Spearman gần sát với 1 thì có sự thống nhất cao giữa hai thứ tự xếp hạng. Nếu giá trị này gần bằng 0 thì các thứ hạng đó không liên quan với nhau.

Nếu giá trị nêu trên gần sát với -1 thì các thứ tự xếp hạng rất không thống nhất. Cần xem xét khả năng một người thử hiểu sai hướng dẫn và xếp mẫu theo thứ tự ngược với chủ tâm của họ.

Giá trị tới hạn của r_s cần xác định nếu sự tương quan quan sát được là đáng kể, được nêu trong Bảng 2.

8.2.2 Xác định năng lực nhóm trong trường hợp thứ tự mẫu dự tính trước hoặc khẳng định thứ tự mẫu dự tính trước: Kiểm định Page ^[3]

Phép phân tích này có thể dùng để xác định liệu hội đồng đánh giá có thống nhất, hoặc có thể cảm nhận được, với thứ hạng theo một số tính chất mà tập hợp mẫu đã biết hoặc được dự báo sẽ có.

Nếu Γ₁ ..., Γ_p là tổng thứ hạng lý thuyết của p mẫu trong thứ tự dự tính trước, giả thuyết không về sự không khác biệt giữa các mẫu có thể được viết thành: H₀: Γ₁ =... = Γ_p

Giả thuyết thay thế là: H₁: Γ₁ ≤ ... ≤ Γ_p, trong đó ít nhất một bất đẳng thức là đúng.

Đối với mọi sản phẩm, tổng thứ hạng R₁, .... R_p được tính (trong đó R₁ là tổng thứ hạng của mẫu đầu tiên trong thứ tự xếp hạng đã biết, và tiếp tục đến R_p đối với mẫu cuối cùng của thứ tự đã biết).

Để kiểm tra giả thuyết không, H₀, tính hệ số Page L:

L = R₁ 2R₂ 3R₃ ... p·R_p

Hệ số này là cao nhất nếu xếp hạng lý thuyết của các sản phẩm là tái lập bởi những người thử.

Trong trường hợp các thiết kế khối hoàn chỉnh, so sánh L với các giá trị tới hạn trong Bảng 3, tương ứng với số lượng người thử, số lượng mẫu và rủi ro đã chọn, đối với α = 0,05 hoặc α = 0,01.

- Nếu L nhỏ hơn giá trị tra bảng thì tìm thấy sự khác biệt giữa các sản phẩm.

- Nếu L bằng hoặc lớn hơn giá trị tra bảng thì có sự khác biệt đáng kể giữa các tổng thứ hạng của các sản phẩm. H₀ không được chấp nhận và H₁ được chấp nhận. Kết luận rằng người thử có xu hướng xếp hạng mẫu theo thứ tự định trước.

Nếu số lượng người thử hoặc số lượng mẫu không tra được từ Bảng 3, tính:

trong đó:

p là số lượng sản phẩm được xếp hạng;

j là số lượng người thử.

Số lượng này xấp xỉ phân bố chuẩn.

H₀ không được chấp nhận nếu L’ ≥ 1,64 (ở mức rủi ro 0,05) hoặc L’ ≥ 2,33 (ở mức rủi ro 0,01) (xem Bảng 3).

Trong trường hợp các thiết kế khối không hoàn chỉnh cân bằng, tính:

trong đó:

p là tổng số lượng sản phẩm được xếp hạng;

k là số lượng sản phẩm được từng người thử xếp hạng;

j là số lượng người thử.

Số lượng này cũng xấp xỉ phân bố chuẩn.

H₀ không được chấp nhận nếu L’ ≥ 1,64 (ở mức rủi ro 0,05) hoặc L’ ≥ 2,33 (ở mức rủi ro 0,01) (xem Bảng 3).

Do trong giả thuyết H₀ các tổng thứ hạng lý thuyết là bằng nhau, kết quả đáng kể không cho biết tất cả sự khác biệt giữa các mẫu là nhận biết được, duy chỉ có sự khác biệt giữa ít nhất một cặp mẫu được nhận biết nhất quán trong thứ tự đã dự đoán.

8.2.3 So sánh các sản phẩm khi chưa có thứ tự giả định

Kiểm định Friedman (Phân tích phương sai bằng cách xếp hạng) ^[2] là phương tiện tốt nhất để minh chứng nhận thức của những người thử về sự khác biệt giữa các mẫu.

8.2.3.1 Kiểm định khi có sự khác biệt giữa ít nhất hai sản phẩm

Kiểm định này áp dụng khi j người thử cùng xếp hạng p sản phẩm.

Tính thứ hạng của các tổng R₁, R₂, …, R_p của p mẫu thông qua j người thử.

Nếu Γ₁, …,Γ_p là thứ tự lý thuyết của các tổng của p mẫu thì giả thuyết không về sự không khác biệt giữa các mẫu có thể biểu thị như sau:

H₀: Γ₁ = ... = Γ_p

Giả thuyết thay thế là không phải tất cả các tổng thứ hạng của tập hợp đều bằng nhau.

Đối với các thiết kế khối hoàn chỉnh, giá trị kiểm định Friedman là:

F_thử =

trong đó R_i là tổng thứ hạng của sản phẩm thứ i.

Nếu F_thử > F thì từ Bảng 4 xem xét số người thử, số sản phẩm và rủi ro được chọn, H₀ bị bác bỏ. Kết luận là có sự khác biệt giữa thứ tự xếp hạng của các sản phẩm.

Đối với các thiết kế khối không hoàn chỉnh đã cân bằng:

F_thử =

trong đó:

R_i là tổng thứ hạng của sản phẩm i;

r là số lần lặp lại của thiết kế khối không hoàn chỉnh đã cân bằng cơ bản;

k là số mẫu mà mỗi người thử xếp hạng;

n là số lần mà mỗi mẫu được đánh giá trong thiết kế khối không hoàn chỉnh đã cân bằng cơ bản;

g là số lần mỗi cặp mẫu được đánh giá cùng nhau trong thiết kế khối không hoàn chỉnh đã cân bằng cơ bản.

Nếu F_t_hử > F thì từ Bảng 4 xem xét số người thử, số sản phẩm và rủi ro lựa chọn, H₀ bị bác bỏ. Kết luận là có sự khác biệt giữa thứ tự xếp hạng của các sản phẩm.

Nếu số mẫu hoặc số người thử không tra được trong Bảng 4 thì tính các giá trị tới hạn bằng cách lấy xấp xỉ từ xử lý F_thử vì c² với p - 1 bậc tự do, trong đó p là số sản phẩm. Giá trị tới hạn của c² được tra từ Bảng 5.

8.2.3.2 Kiểm định đối với các sản phẩm có sự khác biệt đáng kể so với các sản phẩm khác

Nếu kiểm định Friedman cho phép kết luận rằng có sự khác biệt nhất quán giữa các thứ tự xếp hạng sản phẩm thì tính chỉ số khác biệt có ý nghĩa nhỏ nhất (LSD) ở mức rủi ro lựa chọn (α = 0,05 hoặc α = 0,01) để xác định những sản phẩm nào khác biệt có nghĩa.

Khi xem xét mức α (mức ý nghĩa, hoặc rủi ro của việc kết luận rằng không có sự khác biệt), phải chọn một trong hai cách tiếp cận sau đây:

a) Nếu mức rủi ro áp dụng đối với mỗi cặp riêng lẻ thì rủi ro liên quan đến α. Ví dụ: với rủi ro α = 0,05 (nghĩa là rủi ro 5 %) thì trong công thức tính LSD, giá trị của z (tương ứng với xác suất chuẩn hai phía của α) là 1,96. Trường hợp này là rủi ro riêng lẻ. Nếu rủi ro đối với mỗi cặp là α thì có một rủi ro đối với việc gán sai khác biệt đáng kể đối với một hoặc nhiều cặp trong thí nghiệm tổng thể, rủi ro này lớn hơn nhiều so với α.

b) Nếu rủi ro α áp dụng đối với thí nghiệm tổng thể thì rủi ro liên quan đến mỗi cặp sản phẩm là α’, trong đó α’ = 2 α/[p(p - 1)]. Ví dụ: khi p - 8, ở mức rủi ro α = 0,05 thì α’ = 0,001 8 và khi đó z (tương ứng với xác suất chuẩn hai phía của α’) là 2,91. Đây là thí nghiệm đúng hay là rủi ro tổng thể.

Trong hầu hết các trường hợp, điểm thứ hai nêu trên, tức là rủi ro thí nghiệm đúng, hầu như đều liên quan đến các quyết định thực tế về sản phẩm.

Đối với các thiết kế khối hoàn chỉnh:

Đối với các thiết kế khối không hoàn chỉnh đã cân bằng:

Nếu khác biệt quan sát được giữa các tổng thứ hạng của hai sản phẩm bằng hoặc lớn hơn LSD thì kết luận rằng hai sản phẩm có thứ hạng khác nhau đáng kể.

Nếu khác biệt quan sát được là nhỏ hơn LSD thì hai sản phẩm không có thứ hạng khác biệt đáng kể.

8.2.4 Xếp hạng đồng nhất

Nếu hai hoặc nhiều hơn hai thứ hạng là trùng nhau thì F trong các thiết kế khối hoàn chỉnh được thay bằng F’:

trong đó:

E là giá trị thu được như sau:

Đặt n₁, n₂,…, n_k là số thứ hạng trùng nhau trong mỗi nhóm thứ hạng đồng nhất:

Ví dụ: trong Bảng 1 có hai nhóm thứ hạng đồng nhất:

- nhóm thứ nhất bắt đầu từ người thử 2 (hai mẫu B và C là đồng nhất vì n₁ = 2);

- nhóm thứ hai bắt đầu từ người thử 3 (ba mẫu B, C và D là đồng nhất vì n₂ = 3).

Do đó:

E = (2³ - 2) (3³ - 3) = 6 24 = 30

Vì j = 7 và p = 4, thực hiện kiểm định, có F được tính, sử dụng giá trị:

Sau đó so sánh F với các giá trị tới hạn trong Bảng 4 và Bảng 5.

8.2.5 So sánh hai sản phẩm: Kiểm định dấu

Trong trường hợp đặc biệt chỉ xếp hạng hai sản phẩm, có thể sử dụng kiểm định dấu.

CHÚ THÍCH: Trong trường hợp này, phép thử so sánh cặp đôi [TCVN 4831 (ISO 5495)] là phép thử thích hợp hơn.

Khi có hai sản phẩm A và B, nếu k_A là số cách sắp xếp sản phẩm A ở thứ hạng đầu tiên và k_B là số cách sắp xếp sản phẩm B ở thứ hạng đầu tiên, đặt k nhỏ hơn k_A hoặc k_B.

Tất cả kết quả “không khác biệt” sẽ được bỏ qua.

Giả thuyết không là:

H₀: K_A = K_B

trong đó K_A và K_B là số lần lý thuyết mà các sản phẩm A và B được xếp ở vị trí đầu trong toàn bộ mẫu.

(“Giả thuyết không” phát biểu rằng A và B được xếp hạng như nhau trong toàn bộ mẫu.)

Giả thuyết thay thế là:

H₀: K_A ≠ K_B

(“Giả thuyết thay thế” phát biểu rằng A và B được xếp hạng khác nhau trong toàn bộ mẫu.)

Nêu k nhỏ hơn giá trị tới hạn trong Bảng 6 đối với lượng đánh giá thực tế, H₀ bị bác bỏ và có thể kết luận rằng A và B có thứ hạng khác nhau đáng kể.

9 Báo cáo thử nghiệm

Báo cáo thử nghiệm phải bao gồm các thông tin sau:

a) mục đích của phép thử;

b) mọi thông tin cần thiết để nhận diện đầy đủ về mẫu thử

1) số lượng mẫu,

2) mẫu chuẩn, nếu sử dụng;

c) các thông số thử đã được chấp nhận

1) số lượng người thử và năng lực của họ,

2) môi trường thử nghiệm,

3) các điều kiện vật liệu;

d) các kết quả thu được, cùng với phần diễn giải thống kê;

e) viện dẫn tiêu chuẩn này;

f) những sai lệch so với tiêu chuẩn này;

g) tên của người giám sát phép thử;

h) ngày và thời điểm thực hiện phép thử.

Bảng 1 - Tổng hợp kết quả và tính tổng thứ hạng

Người thử	Mẫu				Tổng thứ hạng
Người thử	A	B	C	D	Tổng thứ hạng
1 2 3 4 5 6 7	1 4 1 1 3 2 2	2 1,5 3 3 1 1 1	3 1,5 3 4 2 3 4	4 3 3 2 4 4 3	10 10 10 10 10 10 10
Tổng thứ hạng đối với mẫu	14	12,5	20,5	23	70
CHÚ THÍCH: Do mỗi người thử được ấn định cùng bộ thứ hạng nên tổng các hàng là như nhau và bằng 0,5 x p(p 1), trong đó p là số lượng mẫu.

Bảng 2 - Giá trị tới hạn đối với hệ số tương quan Spearman

Số lượng mẫu	Mức ý nghĩa (α)
Số lượng mẫu	α = 0,05	α = 0,01
6	0,886	—
7	0,786	0,929
8	0,738	0,881
9	0,700	0,833
10	0,648	0,794

11	0,618	0,755
12	0,587	0,727
13	0,560	0,703
14	0,538	0,675
15	0,521	0,654
16	0,503	0,635
17	0,485	0,615
18	0,472	0,600
19	0,460	0,584
20	0,447	0,570

21	0,435	0,556
22	0,425	0,544
23	0,415	0,532
24	0,406	0,521
25	0,398	0,511
26	0,390	0,501
27	0,382	0,491
28	0,375	0,483
29	0,368	0,475
30	0,362	0,467

Bảng 3 - Các giá trị tới hạn của kiểm định Page trong trường hợp thiết kế khối hoàn chỉnh

Số người thử	Số lượng mẫu (hoặc sản phẩm) p
	3	4	5	6	7	8	3	4	5	6	7	8
	Mức ý nghĩa α = 0,05						Mức ý nghĩa α = 0,01
7 8 9 10 11 12 13 14 15 16 17 18 19 20	91 104 116 128 141 153 165 178 190 202 215 227 239 251	189 214 240 266 292 317 343* 368* 394* 420* 445* 471* 496* 522*	338 384 431 477 523 570 615* 661* 707* 754* 800* 846* 891* 937*	550 625 701 777 852 928 1003* 1078* 1153* 1228* 1303* 1378* 1453* 1528*	835 950 1065 1180 1295 1410 1525* 1639* 1754* 1868* 1982* 2097* 2217* 2325*	1204 1371 1537 1703 1868 2035 2201* 2367* 2532* 2697* 2862* 3028* 3193* 3358*	93 106 119 131 144 156 169 181 194 206 218 231 243 256	193 220 246 272 298 324 350* 376* 402* 427* 453* 479* 505* 531*	346 393 441 487 534 584 628* 674* 721* 767* 814* 860* 906* 953*	563 640 717 793 869 946 1022* 1098* 1174* 1249* 1325* 1401* 1476* 1552*	855 972 1088 1205 1321 1437 1553* 1668* 1784* 1899* 2014* 2130* 2245* 2360*	1232 1401 1569 1736 1905 2072 2240* 2407* 2574* 2740* 2907* 3073* 3240* 3406*
CHÚ THÍCH: Các giá trị được đánh dấu sao (*) là các giá trị tới hạn, được tính bằng phương pháp xấp xỉ, sử dụng phân phối chuẩn.

Bảng 4 - Các giá trị tới hạn (F) đối với kiểm định Friedman (mức rủi ro 0,05 và 0,01)^[6]

Số người thử	Số lượng mẫu (hoặc sản phẩm) p
Số người thử	3	4	5	6	7	3	4	5	6	7
	Mức ý nghĩa α = 0,05					Mức ý nghĩa α = 0,01
7	7,143	7,8	9,11	10,62	12,07	8,857	10,371	11,97	13,69	15,35
8	6,250	7,65	9,19	10,68	12,14	9,000	10,35	12,14	13,87	15,53
9	6,222	7,66	9,22	10,73	12,19	9,667	10,44	12,27	14,01	15,68
10	6,200	7,67	9,25	10,76	12,23	9,600	10,53	12,38	14,12	15,79
11	6,545	7,68	9,27	10,79	12,27	9,455	10,60	12,46	14,21	15,89
12	6,167	7,70	9,29	10,81	12,29	9,500	10,68	12,53	14,28	15,96
13	6,000	7,70	9,30	10,83	12,37	9,385	10,72	12,58	14,34	16,03
14	6,143	7,71	9,32	10,85	12,34	9,000	10,76	12,64	14,40	16,09
15	6,400	7,72	9,33	10,87	12,35	8,933	10,80	12,68	14,44	16,14
16	5,99	7,73	9,34	10,88	12,37	8,79	10,84	12,72	14,48	16,18
17	5,99	7,73	9,34	10,89	12,38	8,81	10,87	12,74	14,52	16,22
18	5,99	7,73	9,36	10,90	12,39	8,84	10,90	12,78	14,56	16,25
19	5,99	7,74	9,36	10,91	12,40	8,86	10,92	12,81	14,58	16,27
20	5,99	7,74	9,37	10,92	12,41	8,87	10,94	12,83	14,60	16,30
¥	5,99	7,81	9,49	11,07	12,59	9,21	11,34	13,28	15,09	16,81
CHÚ THÍCH 1: Giá trị F có thể chỉ là các giá trị gián đoạn, tính gián đoạn sẽ rất rõ rệt đối với các giá trị j và p nhỏ. Do đó, không thể thu được các giá trị tới hạn tương ứng hoàn toàn với các rủi ro 0,05 và 0,01. CHÚ THÍCH 2: Các giá trị in nghiêng thu được bằng phương pháp xấp xỉ với phân phối c².

Bảng 5 - Các giá trị tới hạn của phân phối c² (mức rủi ro: 0,05 và 0,01)

Số lượng mẫu (hoặc sản phẩm) p	Số bậc tự do của X² (v = p -1)	Mức ý nghĩa α
Số lượng mẫu (hoặc sản phẩm) p	Số bậc tự do của X² (v = p -1)	α = 0,05	α = 0,01
3	2	5,99	9,21
4	3	7,81	11,34
5	4	9,49	13,28
6	5	11,07	15,09
7	6	12,59	16,81
8	7	14,07	18,47
9	8	15,51	20,09
10	9	16,92	21,67

11	10	18,31	23,21
12	11	19,67	24,72
13	12	21,03	26,22
14	13	22,36	27,69
15	14	23,68	29,14
16	15	25,00	30,58
17	16	26,30	32,00
18	17	27,59	33,41
19	18	28,87	34,80
20	19	30,14	36,19

21	20	31,4	37,6
22	21	32,7	38,9
23	22	33,9	40,3
24	23	35,2	41,6
25	24	36,4	43,0
26	25	37,7	44,3
27	26	38,9	45,6
28	27	40,1	47,0
29	28	41,3	48,3
30	29	42,6	49,6

Bảng 6 - Các giá trị tới hạn đối với kiểm định dấu (hai phía)

Số người thử (j)	Mức ý nghĩa		Số người thử (j)	Mức ý nghĩa
Số người thử (j)	α = 0,05	α = 0,01	Số người thử (j)	α = 0,05	α = 0,01
1			46	15	13
2			47	16	14
3			48	16	14
4			49	17	15
5			50	17	15

6	0		51	18	15
7	0		52	18	16
8	0	0	53	18	16
9	1	0	54	19	17
10	1	0	55	19	17

11	1	0	56	20	17
12	2	1	57	20	18
13	2	1	58	21	18
14	2	1	59	21	19
15	3	2	60	21	19

16	3	2	61	22	20
17	4	2	62	22	20
18	4	3	63	23	20
19	4	3	64	23	21
20	5	3	65	24	21

21	5	4	66	24	22
22	5	4	67	25	22
23	6	4	68	25	22
24	6	5	69	25	23
25	7	5	70	26	23

26	7	6	71	26	24
27	7	6	72	27	24
28	8	6	73	27	25
29	8	7	74	28	25
30	9	7	75	28	25

31	9	7	76	28	26
32	9	8	77	29	26
33	10	8	78	29	27
34	10	9	79	30	27
35	11	9	80	30	28

36	11	9	81	31	28
37	12	10	82	31	28
38	12	10	83	32	29
39	12	11	84	32	29
40	13	11	85	32	30

41	13	11	86	33	30
42	14	12	87	33	31
43	14	12	88	34	31
44	15	13	89	34	31
45	15	13	90	35	32
Đối với các giá trị j lớn hơn 90, có thể tính các giá trị tới hạn gần đúng bằng cách lấy số nguyên gần nhất nhỏ hơn , trong đó k bằng 0,980 0 đối với α = 0,05 và bằng 1,287 9 đối với α = 0,01.

Phụ lục A

(tham khảo)

Thiết lập các điều kiện thử nghiệm

Bảng A.1 - Lựa chọn các thông số của phép thử dựa trên mục đích sử dụng

Mục đích của phép thử	Năng lực của người thử	Số lượng người thử	Phương pháp thống kê
			So sánh với thứ tự đã biết (thử năng lực người thử)	Chưa biết thứ hạng của sản phẩm (so sánh các sản phẩm)
				2 sản phẩm	> 2 sản phẩm
Đánh giá năng lực cá nhân	Người thử được chọn hoặc chuyên gia thử cảm quan được chọn	Không giới hạn	Kiểm định Spearman	Kiểm định dấu	Kiểm định Friedman
Đánh giá năng lực của nhóm	Người thử được chọn hoặc chuyên gia thử cảm quan được chọn	Không giới hạn	Kiểm định Page
Đánh giá sản phẩm theo tiêu chí mô tả	Người thử được chọn hoặc chuyên gia thử cảm quan được chọn	Tốt nhất là từ 12 đến 15
Đánh giá sản phẩm theo xu hướng thị hiếu	Người tiêu dùng	Tối thiểu 60 mỗi nhóm đối tượng người tiêu dùng (ô và phần)

Phụ lục B

(tham khảo)

Ví dụ áp dụng thực tế - Thiết kế khối hoàn chỉnh

Các kết quả của mười bốn người thử thực hiện trên một dãy mẫu thử được tổng hợp trong Bảng B.1.

Bảng B.1 - Ví dụ về đánh giá

Người thử	Mẫu
Người thử	A	B	C	D	E
1	2	4	5	3	1
2	4	5	3	1	2
3	1	4	5	3	2
4	1	2	5	3	4
5	1	5	2	3	4
6	2	3	4	5	1
7	4	5	3	1	2
8	2	3	5	4	1
9	1	3	4	5	2
10	1	2	5	3	4
11	4	5	2	3	1
12	2	4	3	5	1
13	5	3	4	2	1
14	3	5	2	4	1
Tổng thứ hạng	33	53	52	45	27

Giá trị F_thử từ kiểm định Friedman được tính như sau.

Từ j = 14, p = 5, R₁ = 33, R₂ = 53, R₃ = 52, R₄ = 45, R₅ = 27:

F_thử =

Giá trị 15,31 lớn hơn giá trị nêu trong Bảng 4 đối với j = 14, p = 5 ở mức ý nghĩa 0,05 (bằng 9,32); do đó có thể kết luận rằng với rủi ro của sai số nhỏ hơn hoặc bằng 5 % thì năm mẫu được cảm nhận khác biệt.

Ngoài ra, cũng có thể kết luận rằng hai mẫu riêng lẻ là khác biệt nếu chênh lệch tuyệt đối giữa các tổng thứ hạng của chúng lớn hơn:

(ở mức rủi ro 0,05)

Ở mức rủi ro 0,05, chênh lệch giữa A và B, A và C, E và B, E và C, E và D là đáng kể, chênh lệch về tổng thứ hạng của chúng tương ứng là:

A - B: | 33 - 53 | = 20 E - B: | 27 - 53 | = 26

A - C: | 33 - 52 | = 19 E - C: | 27 - 52 | = 25

E - D: | 27 - 45 | = 18

Phép phân tích cuối cùng có thể cho kết quả được biểu thị như sau:

Ý nghĩa của phần gạch chân như sau:

- hai mẫu không kết nối bằng phần gạch chân liền là khác biệt đáng kể (ở mức rủi ro 0,05);

- hai mẫu kết nối bằng phần gạch chân liền là không có khác biệt đáng kể;

- A và E không phân biệt được, được xếp hạng trước đáng kể so với nhóm D, C và B, nhóm này cũng không phân biệt được. Có ba nhóm gồm nhóm chứa A và E, nhóm chứa A và D, nhóm chứa B, D và C.

Trong trường hợp có lý do chính đáng để giả định tiên nghiệm trước khi thử nghiệm rằng: thứ hạng của E ≤ thứ hạng của A ≤ thứ hạng của D ≤ thứ hạng của C ≤ thứ hạng của B

thì có thể dùng phép thử Page để kiểm tra giả thuyết một phía này.

Khi đó, giá trị L trong phép thử Page được tính như sau:

L = (1 x 27) (2 x 33) (3 x 45) (4 x 52) (5 x 53) = 701

Giá trị tới hạn từ kiểm định Page đối với p = 5, j = 14, α = 0,05 là 661 (xem Bảng 3).

Vì L lớn hơn 661 nên giả thuyết không đối với việc hoàn toàn không có khác biệt giữa các mẫu ở mức rủi ro α = 0,05 bị bác bỏ.

Để kết luận đối với ví dụ này:

a) dựa trên kiểm định Friedman

- ở mức rủi ro 0,05 , E không khác A; D không khác cả C lẫn B; A không khác D nhưng A khác biệt đáng kể so với C và B; E khác biệt đáng kể so với D, với C và với B;

b) xem xét đến kiểm định Page

- những người thử nhận diện sự khác biệt giữa các mẫu ở mức rủi ro α = 0,05; thứ hạng được giả định từ trước đã được xác nhận.

Phụ lục C

(tham khảo)

Ví dụ áp dụng thực tế - Thiết kế khối không hoàn chỉnh đã cân bằng

Các kết quả của mười người thử thực hiện trên ba trong số năm mẫu thử với thiết kế khối không hoàn chỉnh đã cân bằng được tổng hợp trong Bảng C.1.

Bảng C.1 - Ví dụ về đánh giá

Người thử	Mẫu
Người thử	A	B	C	D	E
1	1	2	3
2	1	2		3
3	2	3			1
4	1		2	3
5	2		3		1
6	1			3	2
7		1	3	2
8		2	3		1
9		3		2	1
10			1	3	2
Tổng thứ hạng	8	13	15	16	8

Giá trị F_t_hử từ kiểm định Friedman được tính như sau.

Từ j = 10, p = 5, k = 3, n = 6, g = 3, r = 1, R₁ = 8, R₂ = 13, R₃ = 15, R₄ = 16, R₅ = 8:

F_t_hử =

Giá trị 11,6 lớn hơn giá trị nêu trong Bảng 4 đối với p = 5 ở mức ý nghĩa 0,05 (bằng 9,25); do đó có thể kết luận rằng với rủi ro của sai lỗi ít hơn hoặc bằng 5 % thì năm mẫu có sự khác biệt.

Ngoài ra, cũng có thể kết luận rằng hai mẫu riêng lẻ là khác biệt nếu chênh lệch tuyệt đối giữa các tổng thứ hạng của chúng lớn hơn:

(ở mức rủi ro 0,05)

ở mức rủi ro 0,05, chênh lệch giữa A và C, A và D, C và E, E và C, D và E là đáng kể, chênh lệch về tổng thứ hạng của chúng tương ứng là:

A - C: | 8 - 15 | = 7 C - E: | 15 - 81 | = 7

A - D: | 8 - 16 | = 8 D - E: | 16 - 81 | = 8

Phép phân tích cuối cùng có thể cho kết quả được biểu thị như sau:

Trong trường hợp có lý do chính đáng để giả định tiên nghiệm trước khi thử nghiệm rằng:

thứ hạng của E ≤ thứ hạng của A ≤ thứ hạng của D ≤ thứ hạng của C ≤ thứ hạng của B

thì có thể dùng phép thử Page để kiểm tra giả thuyết một phía này.

Giá trị L trong phép thử Page được tính như sau:

L = (1 x 8) (2 x 8) (3 x 16) (4 x 15) (5 x 13) = 197

Vì p = 5, k = 3, j = 10 nên giá trị L’ trở thành:

Vì L lớn hơn 2,33 nên giả thuyết không về việc hoàn toàn không có khác biệt giữa các mẫu bị bác bỏ ở mức rủi ro α = 0,01.

Để kết luận đối với ví dụ này:

a) dựa trên kiểm định Friedman

- ở mức rủi ro 0,05 , tổng thứ hạng của A và E nhỏ hơn đáng kể so với C và D. B không có khác biệt đáng kể so với bốn mẫu còn lại;

b) dựa trên kiểm định Page

- những người thử nhận diện sự khác biệt giữa các mẫu ở mức rủi ro α = 0,01; thứ hạng được giả định trước đã được xác nhận.

Phụ lục D

(tham khảo)

Ví dụ về phiếu trả lời

Họ và tên: ............................... Ngày:..................................... - Phép thử số:.........................

Anh/chị hãy nếm các mẫu từ trải qua phải:

Ghi mã số theo thứ tự tăng dần về độ ngọt vào các ô dưới đây:

	Nhỏ nhất			Lớn nhất
Mã số

Ý kiến:

THƯ MỤC TÀI LIỆU THAM KHẢO

[1 ] TCVN 4831 (ISO 5495), Phân tích cảm quan - Phương pháp luận - Phép thử so sánh cặp đôi

[2] Friedman, M. The use of ranks to avoid the assumptions of normality implicit in the analysis of variance, Journal of the American Statistical Association, 32, 1937, pp. 675-701

[3] Page, E.B. Ordered hypotheses for multiple treatments: a significance test for linear ranks, Journal of the American Statistical Association, 58, 1963. pp. 216-230

[4] XP V09-500, Analyse sensorielle - Méthodologie - Directives générales pour la réalisation d’épreuves hédoniques en laboratoire d’évaluation sensorielle ou en salle en conditions contrôlées impliquant des consommateurs

[5] COCHRAN, W.G. and COX, G.M. Experimental Designs. John Wiley & Sons, Inc., Chapter 11, Balanced Incomplete Blocks, 1950, pp. 315-346

[6] LOTHAR, S. Applied Statistics, a Handbook of Techniques, Springer Series in Statistics, Springer- Verlag, 1982

1) Trong trường hợp này, mỗi thuộc tính được thử bởi một phép thử khác nhau trên cùng sản phẩm với mã khác nhau và được trình bày với thứ tự khác nhau đối với cùng một người thử cảm quan.

*) ISO 8566-1:1993 và ISO 8586-2:2008 đã được thay thế bởi ISO 8586:2012 Sensory analysis - General guidelines for the selection, training and monitoring of selected and expert assessors (Phân tích cảm quan - Hướng dẫn chung đối với việc lựa chọn, huấn luyện và giám sát người thử được chọn và chuyên gia đánh giá).

2) Cần tránh xếp hạng đồng nhất (xếp các mẫu với cùng một thứ hạng), chỉ xếp hạng đồng nhất khi người thử không thể phân biệt các mẫu.

Tiêu chuẩn liên quan cùng nội dung

HIỆU LỰC VĂN BẢN

Tiêu chuẩn quốc gia TCVN 11183:2015 (ISO 8587:2006 with amendment 1:2013) về Phân tích cảm quan - Phương pháp luận - Xếp hạng

Số hiệu: TCVN11183:2015
Loại văn bản: Tiêu chuẩn Việt Nam
Ngày ban hành: 01/01/2015
Nơi ban hành: ***
Người ký: ***
Ngày công báo:
Số công báo: Đang cập nhật
Ngày hiệu lực:
Tình trạng hiệu lực: Còn hiệu lực

Tải văn bản

Chính sách bảo mật Thỏa ước sử dụng Hướng dẫn sử dụng

Cơ quan chủ quản: Công ty cổ phần tư vấn đầu tư và ứng dụng công nghệ 4.0.
Chịu trách nhiệm chính: Bà Phạm Hoài Thương.
Giấy chứng nhận ĐKDN số: 0108234370, do Sở Kế hoạch và Đầu tư thành phố Hà Nội cấp ngày 18/04/2018.
Địa chỉ: Dương Hà, Gia Lâm, Hà Nội - VPGD: C2 Vincom, 119 Trần Duy Hưng, Trung Hòa, Cầu Giấy, Hà Nội.
Điện thoại: 024.6294.9155 - Hotline: 0984.988.691 - Email: info@hethongphapluat.com

Youtube Facebook Twitter

Click để cài đặt website trên màn hình máy tính

Tiêu chuẩn quốc gia TCVN 11183:2015 (ISO 8587:2006 with amendment 1:2013) về Phân tích cảm quan - Phương pháp luận - Xếp hạng

TRA CỨU THUẬT NGỮ PHÁP LÝ