Hệ thống pháp luật
Đang tải nội dung, vui lòng chờ giây lát...
Đang tải nội dung, vui lòng chờ giây lát...

TIÊU CHUẨN QUỐC GIA

TCVN 11183:2015

ISO 8587:2006 WITH AMENDMENT 1:2013

PHÂN TÍCH CẢM QUAN - PHƯƠNG PHÁP LUẬN - XẾP HẠNG

Sensory analysis -- Methodology -- Ranking

Lời nói đầu

TCVN 11183:2015 hoàn toàn tương đương với ISO 8587:2006 và bản sửa đổi 1:2013;

TCVN 11183:2015 do Ban kỹ thuật tiêu chuẩn quốc gia TCVN/TC/F13 Phương pháp phân tích và lấy mẫu biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.

 

PHÂN TÍCH CẢM QUAN - PHƯƠNG PHÁP LUẬN - XẾP HẠNG

Sensory analysis - Methodology - Ranking

1  Phạm vi áp dụng

Tiêu chuẩn này quy định phương pháp đánh giá cảm quan với mục tiêu sắp xếp dãy mẫu thử theo thứ tự.

Phương pháp này cho phép đánh giá sự khác biệt giữa một số mẫu dựa trên cường độ của một thuộc tính đơn lẻ, của một số thuộc tính 1) hoặc của một cảm giác tổng thể. Phương pháp này được dùng để xác định sự khác biệt nếu có, nhưng không thể xác định mức độ của sự khác biệt giữa các mẫu.

Phương pháp này thích hợp trong các trường hợp sau:

a) đánh giá năng lực của người thử cảm quan

1) huấn luyện người thử;

2) xác định ngưỡng cảm nhận của các cá nhân hay của cả nhóm;

b) đánh giá sản phẩm

1) sắp xếp sơ bộ mẫu

i) theo một tiêu chí mô tả,

ii) theo thị hiếu;

2) xác định ảnh hưởng đến các mức cường độ của một hoặc nhiều chỉ tiêu (ví dụ như thứ tự của độ pha loãng, ảnh hưởng của nguyên liệu thô, của phương thức sản xuất, đóng gói hoặc bảo quản)

i) theo một tiêu chí mô tả,

ii) theo thị hiếu;

3) xác định thứ tự ưu tiên trong phép thử thị hiếu toàn diện.

2  Tài liệu viện dẫn

Các tài liệu viện dẫn sau rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi, bổ sung (nếu có).

TCVN 8244-1 (ISO 3534-1), Thống kê học - Từ vựng và kí hiệu - Phần 1: Thuật ngữ chung về thống kê và thuật ngữ dùng trong xác sut

TCVN 11182 (ISO 5492), Phân tích cảm quan - Thuật ngữ và định nghĩa

ISO 6658, Sensory analysis - Methodology - General guidance (Phân tích cảm quan - Phương pháp luận - Hướng dẫn chung)

ISO 8586-1:1993 *), Sensory analysis - General guidance for the selection, training and monitoring of assessors - Part 1: Selected assessors (Phân tích cảm quan - Hướng dn chung đối với việc lựa chọn, hun luyện và giám sát người th- Phần 1: Người th được lựa chọn)

ISO 8586-2 *), Sensory analysis - General guidance for the selection, training and monitoring of assessors - Part 2: Experts (Phân tích cảm quan - Hướng dẫn chung đối với việc lựa chọn, huấn luyện và giám sát người thử- Phần 2: Chuyên gia)

ISO 8589, Sensory analysis - General guidance for the design of test rooms (Phân tích cảm quan - Hướng dẫn chung đối với việc thiết kế phòng thử nghiệm)

ISO 11035, Sensory analysis - Identification and selection of descriptors for establishing a sensory profile by a multidimensional approach (Phân tích cảm quan - Xác định và lựa chọn các thuật ngữ mô tả đối với việc thiết lập đặc tính cảm quan theo cách tiếp cận đa chiều)

ISO 11036, Sensory analysis - Methodology - Texture profile (Phân tích cảm quan - Phương pháp luận - Đặc tính cấu trúc)

3  Thuật ngữ và định nghĩa

Trong tiêu chuẩn này, áp dụng các thuật ngữ và định nghĩa nêu trong TCVN 11182 (ISO 5492) và TCVN 8244-1 (ISO 3534-1).

4  Nguyên tắc

Người thử nhận đồng thời ba mẫu hoặc nhiều hơn theo thứ tự ngẫu nhiên.

CHÚ THÍCH: Đối với việc xếp hạng hai mẫu thì phương pháp so sánh cặp đôi theo mô tả trong TCVN 4831 (ISO 5495)[1] thường được chọn hơn.

Người thử được yêu cầu xếp hạng các mẫu theo các tiêu chí cụ thể: tiêu chí một chiều (nghĩa là thuộc tính cụ thể hoặc đặc tính cụ thể của một thuộc tính) hoặc cường độ toàn phần (cảm giác tổng thể).

Xác định thứ tự tổng thể và thực hiện so sánh thống kê.

5  Điều kiện thử nghiệm chung

Khi có thể, tham chiếu các tiêu chuẩn (xem ISO 6658) mô tả phương pháp lấy mẫu, phòng thử nghiệm (xem ISO 8589) và thiết bị, dụng cụ.

Khi chuẩn bị mẫu thử, cần xem xét các điểm quan trọng sau đây:

a) việc chuẩn bị, mã hóa và trình bày mẫu thử;

b) số lượng các mẫu có thể so sánh được một cách đáng tin cậy [xác định dựa trên bản chất của sản phẩm (các hiệu ứng bão hòa cảm giác)] và thiết kế được chọn; số lượng mẫu phải được lấy dựa trên:

1) loại sản phẩm [ví dụ: người thử được lựa chọn (ISO 8586-1) hoặc chuyên gia (ISO 8586-2) có thể đánh giá đến 15 mẫu đơn giản, trong khi người tiêu dùng chỉ có thể đánh giá tối đa 03 mẫu sản phẩm hăng/chát, cay hoặc chứa hàm lượng chất béo cao], và

2) tiêu chí đánh giá (ví dụ: vị ngọt thì ít bão hòa hơn vị đắng);

c) độ chiếu sáng đối với các mẫu.

6  Người thử

6.1  Trình độ

Trình độ của người thử phụ thuộc vào mục tiêu của phép thử (xem Phụ lục A).

Tất cả người thử tốt nhất nên có cùng trình độ, mức này được chọn dựa theo mục đích của phép thử:

a) người thử được lựa chọn hoặc chuyên gia, để:

1) huấn luyện người thử,

2) đánh giá dựa trên tiêu chí mô tả, ví dụ xác định nhanh tác động của mức cường độ của một hoặc nhiều chỉ tiêu (ví dụ: thứ tự độ pha loãng, ảnh hưởng của nguyên liệu thô, của phương pháp sản xuất, đóng gói hoặc bảo quản),

3) xác định ngưỡng cảm nhận của các cá nhân hoặc của nhóm;

b) người thử chưa qua huấn luyện hoặc người tiêu dùng, đã được huấn luyện về phương pháp:

1) để thực hiện phép thử thị hiếu ưu tiên,

2) khi sắp xếp sơ bộ các mẫu (để lựa chọn một vài sản phẩm từ số lượng lớn sản phẩm, như là phép thử sơ bộ).

Các điều kiện mà người thử phải tuân thủ được nêu trong ISO 6658, ISO 8586-1 và ISO 8586-2. Người thử phải được huấn luyện về quy trình xếp hạng và các từ mô tả được chọn để sử dụng.

6.2  S lượng người thử

Số lượng người thử phụ thuộc vào mục tiêu của phép thử (xem Phụ lục A).

Khi kiểm tra năng lực của người thử, huấn luyện người thử hoặc xác định ngưỡng cảm giác của các cá nhân hay các nhóm thì không yêu cầu số lượng tối thiểu hay tối đa.

Đối với đánh giá mô tả sản phẩm, số lượng ngưởi thử tối thiểu được xác định qua mức độ của rủi ro thống kê chấp nhận được và phải phù hợp với ISO 11035 hoặc ISO 11036, tốt nhất chọn lấy từ 12 đến 15 người thử.

Đối với xác định thứ tự ưu tiên trong phép thử thị hiếu, số lượng người thử tối thiểu được xác định qua mức độ rủi ro thống kê chấp nhận được, ví dụ tối thiểu 60 người thử cho mỗi nhóm người tiêu dùng.

Đối với phân tích thống kê các kết quả, khi các yếu tố khác là tương đương (ví dụ: các điều kiện thử nghiệm, trình độ của người thử), số lượng người thử càng lớn thì xác suất phát hiện các sai khác có tính hệ thống càng lớn khi xếp hạng các sản phẩm.

6.3  Thảo luận sơ bộ

Người thử phải được thông báo về mục đích của phép thử, nghĩa là việc xếp hạng các mẫu thử.

Nếu cần, có thể thực hiện một minh họa của quy trình xếp hạng. Trong phép thử này, điều quan trọng là đảm bảo tất cả người thử đều có nhận thức chung về các tiêu chí của phép thử. Việc thảo luận sơ bộ không được tác động đến kì vọng của những người thử.

7  Cách tiến hành

7.1  Trình bày mu

Các mẫu phải được trình bày sao cho người thử không thể đưa ra kết luận về mẫu.

Chuẩn bị mẫu ngoài tầm nhìn của người thử và theo cách thống nhất: cùng thiết bị, dụng cụ, cùng lượng sản phẩm, cùng nhiệt độ và cùng cách trình bày. Tất cả sự khác biệt không thích hợp giữa các mẫu phải được che giấu để tránh tác động đến việc xếp hạng. Nên trình bày mẫu ở nhiệt độ sử dụng sản phẩm.

Dụng cụ đựng mẫu được nhận dạng bởi tổ hợp 3 chữ số, các số này được chọn ngẫu nhiên và khác nhau giữa các mẫu trong một buổi đánh giá (và tốt nhất là khác nhau giữa những người thử).

Việc trình bày phải tính đến thiết kế đã chọn. Trong một thiết kế “khối hoàn chỉnh”, mỗi người thử xếp hạng tất cả các mẫu. Đây là quy trình thường được chọn. Nhưng nếu số lượng mẫu hoặc bản chất của mẫu dẫn đến việc không thể xếp hạng tất cả các mẫu thì có thể sử dụng thiết kế “khối không hoàn chỉnh đã cân bằng”. Trong trường hợp đó, cần đảm bảo rằng mọi người thử hoàn thành phần công việc nêu trong thiết kế và không bỏ qua bất kì đánh giá nào.

Đối với thiết kế khối không hoàn chỉnh đã cân bằng, mỗi người thử được giới thiệu một tập con các mẫu theo thứ tự ngẫu nhiên (xem ví dụ trong Phụ lục C).

CHÚ THÍCH: Việc sử dụng một khối không hoàn chỉnh đã cân bằng chỉ khả thi nếu trong thực tế tồn tại dao động khối. Vì vậy, cần tìm được tài liệu về khối xác định trước, ví dụ Tài liệu tham khảo [5] trong Thư mục tài liệu tham khảo.

Mỗi người thử được giới thiệu k trong số p mẫu (k < p). Tập con k mẫu được xác định sao cho khi một phần tử thuộc thiết kế khối không hoàn chỉnh đã cân bằng, mỗi mẫu được đánh giá bởi n trong số j người thử (n < j) và mỗi cặp mẫu được đánh giá bởi g người thử. Có thể cần lặp lại toàn bộ thiết kế khối không hoàn chỉnh đã cân bằng vài lần để đạt được mức trung bình về độ nhạy trong phép xác định. Số lần lặp lại được kí hiệu là r. Tổng cộng, mỗi mẫu được đánh giá bởi r x n người thử và mỗi cặp mẫu được đánh giá bởi r x g người thử.

7.2  Mẫu chuẩn

Có thể dùng mẫu chuẩn. Khi đó, các mẫu chuẩn được bố trí lẫn trong dãy mẫu thử.

7.3  Kỹ thuật thử nghiệm

Tất cả người thử phải thực hiện trong cùng điều kiện thử nghiệm.

Người thử sẽ đánh giá mẫu được trình bày theo thứ tự ngẫu nhiên và xếp chúng theo thứ tự với thuộc tính định sẵn.

Hướng dẫn người thử tránh đồng nhất các thứ hạng2). Nếu một người thử không thể phân biệt hai hoặc nhiều mẫu thì hướng dẫn người thử xếp các mẫu theo thứ tự và ghi lại các mẫu không thể phân biệt trong phần ghi chú của phiếu trả lời.

Việc bố trí mẫu không được gây nên hiện tượng thích nghi cảm giác và các sản phẩm đủ ổn định, có thể cần hướng dẫn mỗi người thử thực hiện xếp hạng sơ bộ, sau đó khẳng định lại thứ tự này bằng cách đánh giá lại các mẫu theo thứ tự xếp hạng.

Một thuộc tính đơn phải được đánh giá bởi một phép thử riêng. Nếu cần thông tin về việc xếp hạng nhiều thuộc tính thì mỗi thuộc tính phải được đánh giá bằng một phép thử riêng.

7.4  Phiếu trả lời

Ví dụ về phiếu trả lời được nêu trong Phụ lục D.

Mã số mẫu không nên thể hiện trong phiếu trả lời trắng trong trường hợp vị trí của chúng ảnh hưởng đến kỳ vọng của người thử về thứ tự xếp hạng. Các thứ tự được gán cho các mẫu đơn lẻ phải được người thử ghi lại vào phiếu trả lời.

Tùy theo mục đích của phép thử và tùy thuộc mẫu thử, có thể cần ghi lại các thông tin bổ sung vào phiếu trả lời cụ thể.

8  Biểu thị và diễn giải kết quả

8.1  Tổng hợp kết qu và tính thứ hng chung

Bảng 1 minh họa cho việc xếp hạng một thuộc tính bởi bảy người thử trên bốn mẫu. Nếu thực hiện xếp hạng liên quan đến nhiều thuộc tính thì cần lập bảng riêng cho từng thuộc tính.

Nếu có thứ hạng đồng nhất thì ghi lại thứ hạng trung bình của mẫu bị đồng nhất. Trong Bảng 1, người thử số 2 đã gán cùng thứ hạng cho mẫu B và mẫu C. Người thử số 3 đã gán cùng thứ hạng cho mẫu B, mẫu C và mẫu D.

Nếu dữ liệu không bị sót và nếu thứ hạng bị đồng nhất được tính đúng thì các hàng sẽ có cùng tổng. Thứ hạng chung đối với mỗi mẫu thu được bằng cách bổ sung thứ hạng trong mỗi cột. Các tổng thứ hạng cho thấy tính đồng nhất của thứ hạng được gán bởi toàn bộ nhóm người thử. Nếu tương thích thì các tổng thứ hạng sẽ rất khác nhau, nhưng nếu không tương thích thì các tổng thứ hạng sẽ tương tự nhau.

8.2  Phân tích thng kê và diễn giải

Kiểm định thống kê được chọn phụ thuộc vào mục đích của phép thử (xem Phụ lục A).

8.2.1  Xác định năng lực cá nhân: hệ số tương quan Spearman

Để xác định sự thống nhất giữa hai thứ tự xếp hạng (ví dụ: việc xếp hạng giữa hai người thử hoặc thứ tự xếp hạng của một người thử và thứ tự dự đoán qua thông tin về mẫu), hệ số tương quan Spearman, rs, có thể tính như sau:

trong đó:

p là số lượng sản phẩm được xếp hạng;

di là chênh lệch giữa hai thứ hạng của mẫu thử i.

Nếu giá trị của hệ số tương quan Spearman gần sát với 1 thì có sự thống nhất cao giữa hai thứ tự xếp hạng. Nếu giá trị này gần bằng 0 thì các thứ hạng đó không liên quan với nhau.

Nếu giá trị nêu trên gần sát với -1 thì các thứ tự xếp hạng rất không thống nhất. Cần xem xét khả năng một người thử hiểu sai hướng dẫn và xếp mẫu theo thứ tự ngược với chủ tâm của họ.

Giá trị tới hạn của rs cần xác định nếu sự tương quan quan sát được là đáng kể, được nêu trong Bảng 2.

8.2.2  Xác định năng lực nhóm trong trường hợp th tự mẫu dự tính trước hoặc khẳng định thứ tự mẫu dự tính trước: Kim định Page [3]

Phép phân tích này có thể dùng để xác định liệu hội đồng đánh giá có thống nhất, hoặc có thể cảm nhận được, với thứ hạng theo một số tính chất mà tập hợp mẫu đã biết hoặc được dự báo sẽ có.

Nếu Γ1 ..., Γp là tổng thứ hạng lý thuyết của p mẫu trong thứ tự dự tính trước, giả thuyết không về sự không khác biệt giữa các mẫu có thể được viết thành: H0: Γ1 =... = Γp

Giả thuyết thay thế là: H1: Γ1 ≤ ... ≤ Γp, trong đó ít nhất một bất đẳng thức là đúng.

Đối với mọi sản phẩm, tổng thứ hạng R1, .... Rp được tính (trong đó R1 là tổng thứ hạng của mẫu đầu tiên trong thứ tự xếp hạng đã biết, và tiếp tục đến Rp đối với mẫu cuối cùng của thứ tự đã biết).

Để kiểm tra giả thuyết không, H0, tính hệ số Page L:

L = R1 2R2 3R3 ... p·Rp

Hệ số này là cao nhất nếu xếp hạng lý thuyết của các sản phẩm là tái lập bởi những người thử.

Trong trường hợp các thiết kế khối hoàn chỉnh, so sánh L với các giá trị tới hạn trong Bảng 3, tương ứng với số lượng người thử, số lượng mẫu và rủi ro đã chọn, đối với α = 0,05 hoặc α = 0,01.

- Nếu L nhỏ hơn giá trị tra bảng thì tìm thấy sự khác biệt giữa các sản phẩm.

- Nếu L bằng hoặc lớn hơn giá trị tra bảng thì có sự khác biệt đáng kể giữa các tổng thứ hạng của các sản phẩm. H0 không được chấp nhận và H1 được chấp nhận. Kết luận rằng người thử có xu hướng xếp hạng mẫu theo thứ tự định trước.

Nếu số lượng người thử hoặc số lượng mẫu không tra được từ Bảng 3, tính:

trong đó:

p là số lượng sản phẩm được xếp hạng;

j là số lượng người thử.

Số lượng này xấp xỉ phân bố chuẩn.

H0 không được chấp nhận nếu L’ ≥ 1,64 (ở mức rủi ro 0,05) hoặc L’ ≥ 2,33 (ở mức rủi ro 0,01) (xem Bảng 3).

Trong trường hợp các thiết kế khối không hoàn chỉnh cân bằng, tính:

trong đó:

p là tổng số lượng sản phẩm được xếp hạng;

k là số lượng sản phẩm được từng người thử xếp hạng;

j là số lượng người thử.

Số lượng này cũng xấp xỉ phân bố chuẩn.

H0 không được chấp nhận nếu L’ ≥ 1,64 (ở mức rủi ro 0,05) hoặc L’ ≥ 2,33 (ở mức rủi ro 0,01) (xem Bảng 3).

Do trong giả thuyết H0 các tổng thứ hạng lý thuyết là bằng nhau, kết quả đáng kể không cho biết tất cả sự khác biệt giữa các mẫu là nhận biết được, duy chỉ có sự khác biệt giữa ít nhất một cặp mẫu được nhận biết nhất quán trong thứ tự đã dự đoán.

8.2.3  So sánh các sản phẩm khi chưa có thứ tự giả đnh

Kiểm định Friedman (Phân tích phương sai bằng cách xếp hạng) [2] là phương tiện tốt nhất để minh chứng nhận thức của những người thử về sự khác biệt giữa các mẫu.

8.2.3.1  Kim định khi có sự khác biệt giữa ít nht hai sn phm

Kiểm định này áp dụng khi j người thử cùng xếp hạng p sản phẩm.

Tính thứ hạng của các tổng R1, R2, …, Rp của p mẫu thông qua j người thử.

Nếu Γ1, …,Γp là thứ tự lý thuyết của các tổng của p mẫu thì giả thuyết không về sự không khác biệt giữa các mẫu có thể biểu thị như sau:

H0: Γ1 = ... = Γp

Giả thuyết thay thế là không phải tất cả các tổng thứ hạng của tập hợp đều bằng nhau.

Đối với các thiết kế khối hoàn chỉnh, giá trị kiểm định Friedman là:

Fthử =

trong đó Ri là tổng thứ hạng của sản phẩm thứ i.

Nếu Fthử > F thì từ Bảng 4 xem xét số người thử, số sản phẩm và rủi ro được chọn, H0 bị bác bỏ. Kết luận là có sự khác biệt giữa thứ tự xếp hạng của các sản phẩm.

Đối với các thiết kế khối không hoàn chỉnh đã cân bằng:

Fthử =

trong đó:

Ri là tổng thứ hạng của sản phẩm i;

r là số lần lặp lại của thiết kế khối không hoàn chỉnh đã cân bằng cơ bản;

k là số mẫu mà mỗi người thử xếp hạng;

n là số lần mà mỗi mẫu được đánh giá trong thiết kế khối không hoàn chỉnh đã cân bằng cơ bản;

g là số lần mỗi cặp mẫu được đánh giá cùng nhau trong thiết kế khối không hoàn chỉnh đã cân bằng cơ bản.

Nếu Fthử > F thì từ Bảng 4 xem xét số người thử, số sản phẩm và rủi ro lựa chọn, H0 bị bác bỏ. Kết luận là có sự khác biệt giữa thứ tự xếp hạng của các sản phẩm.

Nếu số mẫu hoặc số người thử không tra được trong Bảng 4 thì tính các giá trị tới hạn bằng cách lấy xấp xỉ từ xử lý Fthử vì c2 với p - 1 bậc tự do, trong đó p là số sản phẩm. Giá trị tới hạn của c2 được tra từ Bảng 5.

8.2.3.2  Kim định đối với các sản phẩm có sự khác biệt đáng kể so vi các sản phẩm khác

Nếu kiểm định Friedman cho phép kết luận rằng có sự khác biệt nhất quán giữa các thứ tự xếp hạng sản phẩm thì tính chỉ số khác biệt có ý nghĩa nhỏ nhất (LSD) ở mức rủi ro lựa chọn (α = 0,05 hoặc α = 0,01) để xác định những sản phẩm nào khác biệt có nghĩa.

Khi xem xét mức α (mức ý nghĩa, hoặc rủi ro của việc kết luận rằng không có sự khác biệt), phải chọn một trong hai cách tiếp cận sau đây:

a) Nếu mức rủi ro áp dụng đối với mỗi cặp riêng lẻ thì rủi ro liên quan đến α. Ví dụ: với rủi ro α = 0,05 (nghĩa là rủi ro 5 %) thì trong công thức tính LSD, giá trị của z (tương ứng với xác suất chuẩn hai phía của α) là 1,96. Trường hợp này là rủi ro riêng lẻ. Nếu rủi ro đối với mỗi cặp là α thì có một rủi ro đối với việc gán sai khác biệt đáng kể đối với một hoặc nhiều cặp trong thí nghiệm tổng thể, rủi ro này lớn hơn nhiều so với α.

b) Nếu rủi ro α áp dụng đối với thí nghiệm tổng thể thì rủi ro liên quan đến mỗi cặp sản phẩm là α’, trong đó α’ = 2 α/[p(p - 1)]. Ví dụ: khi p - 8, ở mức rủi ro α = 0,05 thì α’ = 0,001 8 và khi đó z (tương ứng với xác suất chuẩn hai phía của α’) là 2,91. Đây là thí nghiệm đúng hay là rủi ro tổng thể.

Trong hầu hết các trường hợp, điểm thứ hai nêu trên, tức là rủi ro thí nghiệm đúng, hầu như đều liên quan đến các quyết định thực tế về sản phẩm.

Đối với các thiết kế khối hoàn chỉnh:

Đối với các thiết kế khối không hoàn chỉnh đã cân bằng:

Nếu khác biệt quan sát được giữa các tổng thứ hạng của hai sản phẩm bằng hoặc lớn hơn LSD thì kết luận rằng hai sản phẩm có thứ hạng khác nhau đáng kể.

Nếu khác biệt quan sát được là nhỏ hơn LSD thì hai sản phẩm không có thứ hạng khác biệt đáng kể.

8.2.4  Xếp hạng đng nht

Nếu hai hoặc nhiều hơn hai thứ hạng là trùng nhau thì F trong các thiết kế khối hoàn chỉnh được thay bằng F’:

trong đó:

E là giá trị thu được như sau:

Đặt n1, n2,…, nk là số thứ hạng trùng nhau trong mỗi nhóm thứ hạng đồng nhất:

Ví dụ: trong Bảng 1 có hai nhóm thứ hạng đồng nhất:

- nhóm thứ nhất bắt đầu từ người thử 2 (hai mẫu B và C là đồng nhất vì n1 = 2);

- nhóm thứ hai bắt đầu từ người thử 3 (ba mẫu B, C và D là đồng nhất vì n2 = 3).

Do đó:

E = (23 - 2) (33 - 3) = 6 24 = 30

j = 7 và p = 4, thực hiện kiểm định, có F được tính, sử dụng giá trị:

Sau đó so sánh F với các giá trị tới hạn trong Bảng 4 và Bảng 5.

8.2.5  So sánh hai sản phẩm: Kiểm định du

Trong trường hợp đặc biệt chỉ xếp hạng hai sản phẩm, có thể sử dụng kiểm định dấu.

CHÚ THÍCH: Trong trường hợp này, phép thử so sánh cặp đôi [TCVN 4831 (ISO 5495)] là phép thử thích hợp hơn.

Khi có hai sản phẩm A và B, nếu kA là số cách sắp xếp sản phẩm A ở thứ hạng đầu tiên và kB là số cách sắp xếp sản phẩm B ở thứ hạng đầu tiên, đặt k nhỏ hơn kA hoặc kB.

Tất cả kết quả “không khác biệt” sẽ được bỏ qua.

Giả thuyết không là:

H0: KA = KB

trong đó KAKB là số lần lý thuyết mà các sản phẩm A và B được xếp ở vị trí đầu trong toàn bộ mẫu.

(“Giả thuyết không” phát biểu rằng A và B được xếp hạng như nhau trong toàn bộ mẫu.)

Giả thuyết thay thế là:

H0: KAKB

(“Giả thuyết thay thế” phát biểu rằng A và B được xếp hạng khác nhau trong toàn bộ mẫu.)

Nêu k nhỏ hơn giá trị tới hạn trong Bảng 6 đối với lượng đánh giá thực tế, H0 bị bác bỏ và có thể kết luận rằng A và B có thứ hạng khác nhau đáng kể.

9  Báo cáo thử nghiệm

Báo cáo thử nghiệm phải bao gồm các thông tin sau:

a) mục đích của phép thử;

b) mọi thông tin cần thiết để nhận diện đầy đủ về mẫu thử

1) số lượng mẫu,

2) mẫu chuẩn, nếu sử dụng;

c) các thông số thử đã được chấp nhận

1) số lượng người thử và năng lực của họ,

2) môi trường thử nghiệm,

3) các điều kiện vật liệu;

d) các kết quả thu được, cùng với phần diễn giải thống kê;

e) viện dẫn tiêu chuẩn này;

f) những sai lệch so với tiêu chuẩn này;

g) tên của người giám sát phép thử;

h) ngày và thời điểm thực hiện phép thử.

Bng 1 - Tổng hợp kết quả và tính tổng thứ hạng

Người thử

Mẫu

Tng thứ hạng

A

B

C

D

1

2

3

4

5

6

7

1

4

1

1

3

2

2

2

1,5

3

3

1

1

1

3

1,5

3

4

2

3

4

4

3

3

2

4

4

3

10

10

10

10

10

10

10

Tổng thứ hạng đối với mẫu

14

12,5

20,5

23

70

CHÚ THÍCH: Do mỗi người thử được ấn định cùng bộ thứ hạng nên tổng các hàng là như nhau và bằng 0,5 x p(p 1), trong đó p là số lượng mẫu.

Bng 2 - Giá trị tới hạn đối với hệ s tương quan Spearman

Số lượng mẫu

Mức ý nghĩa (α)

α = 0,05

α = 0,01

6

0,886

7

0,786

0,929

8

0,738

0,881

9

0,700

0,833

10

0,648

0,794

 

 

 

11

0,618

0,755

12

0,587

0,727

13

0,560

0,703

14

0,538

0,675

15

0,521

0,654

16

0,503

0,635

17

0,485

0,615

18

0,472

0,600

19

0,460

0,584

20

0,447

0,570

 

 

 

21

0,435

0,556

22

0,425

0,544

23

0,415

0,532

24

0,406

0,521

25

0,398

0,511

26

0,390

0,501

27

0,382

0,491

28

0,375

0,483

29

0,368

0,475

30

0,362

0,467

Bng 3 - Các giá trị tới hạn của kiểm định Page trong trường hợp thiết kế khối hoàn chnh

Số người thử

Số lượng mẫu (hoặc sản phẩm) p

3

4

5

6

7

8

3

4

5

6

7

8

Mức ý nghĩa

α = 0,05

Mức ý nghĩa

α = 0,01

7

8

9

10

11

12

13

14

15

16

17

18

19

20

91

104

116

128

141

153

165

178

190

202

215

227

239

251

189

214

240

266

292

317

343*

368*

394*

420*

445*

471*

496*

522*

338

384

431

477

523

570

615*

661*

707*

754*

800*

846*

891*

937*

550

625

701

777

852

928

1003*

1078*

1153*

1228*

1303*

1378*

1453*

1528*

835

950

1065

1180

1295

1410

1525*

1639*

1754*

1868*

1982*

2097*

2217*

2325*

1204

1371

1537

1703

1868

2035

2201*

2367*

2532*

2697*

2862*

3028*

3193*

3358*

93

106

119

131

144

156

169

181

194

206

218

231

243

256

193

220

246

272

298

324

350*

376*

402*

427*

453*

479*

505*

531*

346

393

441

487

534

584

628*

674*

721*

767*

814*

860*

906*

953*

563

640

717

793

869

946

1022*

1098*

1174*

1249*

1325*

1401*

1476*

1552*

855

972

1088

1205

1321

1437

1553*

1668*

1784*

1899*

2014*

2130*

2245*

2360*

1232

1401

1569

1736

1905

2072

2240*

2407*

2574*

2740*

2907*

3073*

3240*

3406*

CHÚ THÍCH: Các giá trị được đánh dấu sao (*) là các giá trị tới hạn, được tính bằng phương pháp xấp xỉ, sử dụng phân phối chuẩn.

Bảng 4 - Các giá trị tới hạn (F) đối với kiểm định Friedman (mức rủi ro 0,05 và 0,01)[6]

Số người thử

Số lượng mẫu (hoặc sản phẩm) p

3

4

5

6

7

3

4

5

6

7

 

Mức ý nghĩa

α = 0,05

Mức ý nghĩa

α = 0,01

7

7,143

7,8

9,11

10,62

12,07

8,857

10,371

11,97

13,69

15,35

8

6,250

7,65

9,19

10,68

12,14

9,000

10,35

12,14

13,87

15,53

9

6,222

7,66

9,22

10,73

12,19

9,667

10,44

12,27

14,01

15,68

10

6,200

7,67

9,25

10,76

12,23

9,600

10,53

12,38

14,12

15,79

11

6,545

7,68

9,27

10,79

12,27

9,455

10,60

12,46

14,21

15,89

12

6,167

7,70

9,29

10,81

12,29

9,500

10,68

12,53

14,28

15,96

13

6,000

7,70

9,30

10,83

12,37

9,385

10,72

12,58

14,34

16,03

14

6,143

7,71

9,32

10,85

12,34

9,000

10,76

12,64

14,40

16,09

15

6,400

7,72

9,33

10,87

12,35

8,933

10,80

12,68

14,44

16,14

16

5,99

7,73

9,34

10,88

12,37

8,79

10,84

12,72

14,48

16,18

17

5,99

7,73

9,34

10,89

12,38

8,81

10,87

12,74

14,52

16,22

18

5,99

7,73

9,36

10,90

12,39

8,84

10,90

12,78

14,56

16,25

19

5,99

7,74

9,36

10,91

12,40

8,86

10,92

12,81

14,58

16,27

20

5,99

7,74

9,37

10,92

12,41

8,87

10,94

12,83

14,60

16,30

¥

5,99

7,81

9,49

11,07

12,59

9,21

11,34

13,28

15,09

16,81

CHÚ THÍCH 1: Giá trị F có thể chỉ là các giá trị gián đoạn, tính gián đoạn sẽ rất rõ rệt đối với các giá trị jp nhỏ. Do đó, không thể thu được các giá trị tới hạn tương ứng hoàn toàn với các rủi ro 0,05 và 0,01.

CHÚ THÍCH 2: Các giá trị in nghiêng thu được bằng phương pháp xấp xỉ với phân phối c2.

Bảng 5 - Các giá trị tới hạn của phân phối c2 (mức rủi ro: 0,05 và 0,01)

S lượng mẫu (hoặc sản phẩm)

p

S bậc tự do của X2

(v = p -1)

Mức ý nghĩa

α

α = 0,05

α = 0,01

3

2

5,99

9,21

4

3

7,81

11,34

5

4

9,49

13,28

6

5

11,07

15,09

7

6

12,59

16,81

8

7

14,07

18,47

9

8

15,51

20,09

10

9

16,92

21,67

 

 

 

 

11

10

18,31

23,21

12

11

19,67

24,72

13

12

21,03

26,22

14

13

22,36

27,69

15

14

23,68

29,14

16

15

25,00

30,58

17

16

26,30

32,00

18

17

27,59

33,41

19

18

28,87

34,80

20

19

30,14

36,19

 

 

 

 

21

20

31,4

37,6

22

21

32,7

38,9

23

22

33,9

40,3

24

23

35,2

41,6

25

24

36,4

43,0

26

25

37,7

44,3

27

26

38,9

45,6

28

27

40,1

47,0

29

28

41,3

48,3

30

29

42,6

49,6

Bảng 6 - Các giá trị tới hạn đi với kiểm định dấu (hai phía)

Số người thử

(j)

Mức ý nghĩa

Số ngưi thử

(j)

Mức ý nghĩa

α = 0,05

α = 0,01

α = 0,05

α = 0,01

1

 

 

46

15

13

2

 

 

47

16

14

3

 

 

48

16

14

4

 

 

49

17

15

5

 

 

50

17

15

 

 

 

 

 

 

6

0

 

51

18

15

7

0

 

52

18

16

8

0

0

53

18

16

9

1

0

54

19

17

10

1

0

55

19

17

 

 

 

 

 

 

11

1

0

56

20

17

12

2

1

57

20

18

13

2

1

58

21

18

14

2

1

59

21

19

15

3

2

60

21

19

 

 

 

 

 

 

16

3

2

61

22

20

17

4

2

62

22

20

18

4

3

63

23

20

19

4

3

64

23

21

20

5

3

65

24

21

 

 

 

 

 

 

21

5

4

66

24

22

22

5

4

67

25

22

23

6

4

68

25

22

24

6

5

69

25

23

25

7

5

70

26

23

 

 

 

 

 

 

26

7

6

71

26

24

27

7

6

72

27

24

28

8

6

73

27

25

29

8

7

74

28

25

30

9

7

75

28

25

 

 

 

 

 

 

31

9

7

76

28

26

32

9

8

77

29

26

33

10

8

78

29

27

34

10

9

79

30

27

35

11

9

80

30

28

 

 

 

 

 

 

36

11

9

81

31

28

37

12

10

82

31

28

38

12

10

83

32

29

39

12

11

84

32

29

40

13

11

85

32

30

 

 

 

 

 

 

41

13

11

86

33

30

42

14

12

87

33

31

43

14

12

88

34

31

44

15

13

89

34

31

45

15

13

90

35

32

Đối với các giá trị j lớn hơn 90, có thể tính các giá trị tới hạn gần đúng bằng cách lấy số nguyên gần nhất nhỏ hơn , trong đó k bằng 0,980 0 đối với α = 0,05 và bằng 1,287 9 đối với α = 0,01.

 

Phụ lục A

(tham khảo)

Thiết lập các điều kiện thử nghiệm

Bảng A.1 - Lựa chọn các thông s của phép thử dựa trên mục đích sử dụng

Mục đích của phép thử

Năng lực của người thử

Số lượng người thử

Phương pháp thng kê

So sánh với thứ tự đã biết (thử năng lực người thử)

Chưa biết thứ hạng của sản phẩm (so sánh các sản phẩm)

2 sản phm

> 2 sản phẩm

Đánh giá năng lực cá nhân

Người thử được chọn hoặc chuyên gia thử cảm quan được chọn

Không giới hạn

Kiểm định Spearman

Kiểm định dấu

Kiểm định Friedman

Đánh giá năng lực của nhóm

Người thử được chọn hoặc chuyên gia thử cảm quan được chọn

Không giới hạn

Kiểm định Page

Đánh giá sản phẩm theo tiêu chí mô tả

Người thử được chọn hoặc chuyên gia thử cảm quan được chọn

Tốt nhất là từ 12 đến 15

Đánh giá sản phẩm theo xu hướng thị hiếu

Người tiêu dùng

Tối thiểu 60 mỗi nhóm đối tượng người tiêu dùng (ô và phần)

 

 

Phụ lục B

(tham khảo)

Ví dụ áp dụng thực tế - Thiết kế khối hoàn chỉnh

Các kết quả của mười bốn người thử thực hiện trên một dãy mẫu thử được tổng hợp trong Bảng B.1.

Bảng B.1 - Ví dụ về đánh giá

Người thử

Mẫu

A

B

C

D

E

1

2

4

5

3

1

2

4

5

3

1

2

3

1

4

5

3

2

4

1

2

5

3

4

5

1

5

2

3

4

6

2

3

4

5

1

7

4

5

3

1

2

8

2

3

5

4

1

9

1

3

4

5

2

10

1

2

5

3

4

11

4

5

2

3

1

12

2

4

3

5

1

13

5

3

4

2

1

14

3

5

2

4

1

Tổng thứ hạng

33

53

52

45

27

Giá trị Fthử từ kiểm định Friedman được tính như sau.

Từ j = 14, p = 5, R1 = 33, R2 = 53, R3 = 52, R4 = 45, R5 = 27:

Fthử =

Giá trị 15,31 lớn hơn giá trị nêu trong Bảng 4 đối với j = 14, p = 5 ở mức ý nghĩa 0,05 (bằng 9,32); do đó có thể kết luận rằng với rủi ro của sai số nhỏ hơn hoặc bằng 5 % thì năm mẫu được cảm nhận khác biệt.

Ngoài ra, cũng có thể kết luận rằng hai mẫu riêng lẻ là khác biệt nếu chênh lệch tuyệt đối giữa các tổng thứ hạng của chúng lớn hơn:

 (ở mức rủi ro 0,05)

Ở mức rủi ro 0,05, chênh lệch giữa A và B, A và C, E và B, E và C, E và D là đáng kể, chênh lệch về tổng thứ hạng của chúng tương ứng là:

A - B: | 33 - 53 | = 20                              E - B: | 27 - 53 | = 26

A - C: | 33 - 52 | = 19                              E - C: | 27 - 52 | = 25

                                                            E - D: | 27 - 45 | = 18

Phép phân tích cuối cùng có thể cho kết quả được biểu thị như sau:

Ý nghĩa của phần gạch chân như sau:

- hai mẫu không kết nối bằng phần gạch chân liền là khác biệt đáng kể (ở mức rủi ro 0,05);

- hai mẫu kết nối bằng phần gạch chân liền là không có khác biệt đáng kể;

- A và E không phân biệt được, được xếp hạng trước đáng kể so với nhóm D, C và B, nhóm này cũng không phân biệt được. Có ba nhóm gồm nhóm chứa A và E, nhóm chứa A và D, nhóm chứa B, D và C.

Trong trường hợp có lý do chính đáng để giả định tiên nghiệm trước khi thử nghiệm rằng: thứ hạng của E ≤ thứ hạng của A ≤ thứ hạng của D ≤ thứ hạng của C ≤ thứ hạng của B

thì có thể dùng phép thử Page để kiểm tra giả thuyết một phía này.

Khi đó, giá trị L trong phép thử Page được tính như sau:

L = (1 x 27) (2 x 33) (3 x 45) (4 x 52) (5 x 53) = 701

Giá trị tới hạn từ kiểm định Page đối với p = 5, j = 14, α = 0,05 là 661 (xem Bảng 3).

L lớn hơn 661 nên giả thuyết không đối với việc hoàn toàn không có khác biệt giữa các mẫu ở mức rủi ro α = 0,05 bị bác bỏ.

Để kết luận đối với ví dụ này:

a) dựa trên kiểm định Friedman

- ở mức rủi ro 0,05 , E không khác A; D không khác cả C lẫn B; A không khác D nhưng A khác biệt đáng kể so với C và B; E khác biệt đáng kể so với D, với C và với B;

b) xem xét đến kiểm định Page

- những người thử nhận diện sự khác biệt giữa các mẫu ở mức rủi ro α = 0,05; thứ hạng được giả định từ trước đã được xác nhận.

 

Phụ lục C

(tham khảo)

Ví dụ áp dụng thực tế - Thiết kế khối không hoàn chỉnh đã cân bằng

Các kết quả của mười người thử thực hiện trên ba trong số năm mẫu thử với thiết kế khối không hoàn chỉnh đã cân bằng được tổng hợp trong Bảng C.1.

Bng C.1 - Ví dụ v đánh giá

Người thử

Mu

A

B

C

D

E

1

1

2

3

 

 

2

1

2

 

3

 

3

2

3

 

 

1

4

1

 

2

3

 

5

2

 

3

 

1

6

1

 

 

3

2

7

 

1

3

2

 

8

 

2

3

 

1

9

 

3

 

2

1

10

 

 

1

3

2

Tổng thứ hạng

8

13

15

16

8

Giá trị Fthử từ kiểm định Friedman được tính như sau.

Từ j = 10, p = 5, k = 3, n = 6, g = 3, r = 1, R1 = 8, R2 = 13, R3 = 15, R4 = 16, R5 = 8:

Fthử =

Giá trị 11,6 lớn hơn giá trị nêu trong Bảng 4 đối với p = 5 ở mức ý nghĩa 0,05 (bằng 9,25); do đó có thể kết luận rằng với rủi ro của sai lỗi ít hơn hoặc bằng 5 % thì năm mẫu có sự khác biệt.

Ngoài ra, cũng có thể kết luận rằng hai mẫu riêng lẻ là khác biệt nếu chênh lệch tuyệt đối giữa các tổng thứ hạng của chúng lớn hơn:

 (ở mức rủi ro 0,05)

ở mức rủi ro 0,05, chênh lệch giữa A và C, A và D, C và E, E và C, D và E là đáng kể, chênh lệch về tổng thứ hạng của chúng tương ứng là:

A - C: | 8 - 15 | = 7 C - E: | 15 - 81 | = 7

A - D: | 8 - 16 | = 8 D - E: | 16 - 81 | = 8

Phép phân tích cuối cùng có thể cho kết quả được biểu thị như sau:

Trong trường hợp có lý do chính đáng để giả định tiên nghiệm trước khi thử nghiệm rằng:

thứ hạng của E ≤ thứ hạng của A ≤ thứ hạng của D ≤ thứ hạng của C ≤ thứ hạng của B

thì có thể dùng phép thử Page để kiểm tra giả thuyết một phía này.

Giá trị L trong phép thử Page được tính như sau:

L = (1 x 8) (2 x 8) (3 x 16) (4 x 15) (5 x 13) = 197

p = 5, k = 3, j = 10 nên giá trị L’ trở thành:

L lớn hơn 2,33 nên giả thuyết không về việc hoàn toàn không có khác biệt giữa các mẫu bị bác bỏ ở mức rủi ro α = 0,01.

Để kết luận đối với ví dụ này:

a) dựa trên kiểm định Friedman

- ở mức rủi ro 0,05 , tổng thứ hạng của A và E nhỏ hơn đáng kể so với C và D. B không có khác biệt đáng kể so với bốn mẫu còn lại;

b) dựa trên kiểm định Page

- những người thử nhận diện sự khác biệt giữa các mẫu ở mức rủi ro α = 0,01; thứ hạng được giả định trước đã được xác nhận.

 

Phụ lục D

(tham khảo)

Ví dụ về phiếu trả lời

Họ và tên: ...............................  Ngày:..................................... - Phép thử số:.........................

Anh/chị hãy nếm các mẫu từ trải qua phải:

 

 

 

 

Ghi mã số theo thứ tự tăng dần về độ ngọt vào các ô dưới đây:

 

Nhỏ nhất

 

 

Lớn nhất

Mã số

 

 

 

 

Ý kiến:

 

THƯ MỤC TÀI LIỆU THAM KHẢO

[1 ] TCVN 4831 (ISO 5495), Phân tích cảm quan - Phương pháp luận - Phép thử so sánh cặp đôi

[2] Friedman, M. The use of ranks to avoid the assumptions of normality implicit in the analysis of variance, Journal of the American Statistical Association, 32, 1937, pp. 675-701

[3] Page, E.B. Ordered hypotheses for multiple treatments: a significance test for linear ranks, Journal of the American Statistical Association, 58, 1963. pp. 216-230

[4] XP V09-500, Analyse sensorielle - Méthodologie - Directives générales pour la réalisation dépreuves hédoniques en laboratoire dévaluation sensorielle ou en salle en conditions contrôlées impliquant des consommateurs

[5] COCHRAN, W.G. and COX, G.M. Experimental Designs. John Wiley & Sons, Inc., Chapter 11, Balanced Incomplete Blocks, 1950, pp. 315-346

[6] LOTHAR, S. Applied Statistics, a Handbook of Techniques, Springer Series in Statistics, Springer- Verlag, 1982



1) Trong trường hợp này, mỗi thuộc tính được thử bởi một phép thử khác nhau trên cùng sản phẩm với mã khác nhau và được trình bày với thứ tự khác nhau đối với cùng một người thử cảm quan.

*) ISO 8566-1:1993 và ISO 8586-2:2008 đã được thay thế bởi ISO 8586:2012 Sensory analysis - General guidelines for the selection, training and monitoring of selected and expert assessors (Phân tích cảm quan - Hướng dẫn chung đi với việc lựa chọn, hun luyện và giám sát ngưi thử được chọn và chuyên gia đánh giá).

2) Cần tránh xếp hạng đồng nhất (xếp các mẫu với cùng một thứ hạng), chỉ xếp hạng đồng nhất khi người thử không thể phân biệt các mẫu.