2011-12-14, Steve Kimbrough. Here are two reports generated by my M-script (MATLAB) files, groupAWorkbook.m and groupBWorkbook.m, from the data in the first experiment in Hua Lien. The two groups looked at different maps, similarly chosen (3 with high scores, 3 with middling scores, and 3 with low scores). What we find here is that the subjects’ scores agree broadly with the scores calculated by my program. These last scores are the maximum of the maximum internal distances within any district in the overall districting assignment. That is, there are ten districts, each composed of discrete wards. Each district has a maximum distance between two of its wards. The score for a full districting is the maximum of the maxima of its 10 districts. ----------------------------- Group A follows ----------------------------------------Here is the help information from groupAWorkbook.m: 2011-12-14. This M-script file records my analysis of the group A data for the redistricting experiment conducted earlier in Hua-Lien. The input file is groupA.txt, which is drawn from the Excel file XXX. First, let's see the data file's comments: % Column 1 is the ID number of the map. % Column 2 is the sum of the maximum internal distance score of the % districts in the map % Columns 3--21 are the rankings given by the various subjects. 7 341.62 3 4 3 2 3 3 2 2 1 4 3 3 3 3 3 1 3 21 372.51 1 1 1 1 1 1 1 1 3 3 2 2 2 1 1 2 2 31 371.47 2 2 2 3 2 2 3 3 2 2 1 1 1 2 2 3 1 35 372.51 6 5 6 5 5 5 5 4 6 6 5 6 5 6 5 6 5 62 334.6 5 6 4 6 6 6 6 5 5 5 6 5 6 8 6 4 6 71 357.35 4 3 5 4 4 4 4 6 4 1 4 4 4 9 4 5 4 88 399.34 8 9 7 9 8 8 7 8 8 7 7 8 7 5 8 7 8 89 399.34 7 7 8 7 7 9 8 7 7 8 9 7 8 4 7 8 7 90 399.34 9 8 9 8 9 7 9 9 9 9 8 9 9 7 9 9 9 2 3 1 1 3 2 6 5 4 4 5 8 8 9 7 6 9 7 Now, let's see what is in the file: rawData = Columns 1 through 7 7.0000 341.6200 3.0000 4.0000 3.0000 2.0000 3.0000 21.0000 372.5100 1.0000 1.0000 1.0000 1.0000 1.0000 31.0000 371.4700 2.0000 2.0000 2.0000 3.0000 2.0000 35.0000 372.5100 6.0000 5.0000 6.0000 5.0000 5.0000 62.0000 334.6000 5.0000 6.0000 4.0000 6.0000 6.0000 71.0000 357.3500 4.0000 3.0000 5.0000 4.0000 4.0000 88.0000 399.3400 8.0000 9.0000 7.0000 9.0000 8.0000 89.0000 399.3400 7.0000 7.0000 8.0000 7.0000 7.0000 90.0000 399.3400 9.0000 8.0000 9.0000 8.0000 9.0000 Columns 8 through 14 3.0000 2.0000 2.0000 2.0000 3.0000 1.0000 4.0000 1.0000 1.0000 1.0000 1.0000 1.0000 3.0000 3.0000 2.0000 3.0000 3.0000 3.0000 2.0000 2.0000 2.0000 5.0000 5.0000 4.0000 6.0000 5.0000 6.0000 6.0000 6.0000 6.0000 5.0000 4.0000 4.0000 5.0000 5.0000 4.0000 4.0000 6.0000 5.0000 8.0000 4.0000 1.0000 8.0000 7.0000 8.0000 8.0000 9.0000 8.0000 7.0000 9.0000 8.0000 7.0000 7.0000 6.0000 7.0000 8.0000 7.0000 9.0000 9.0000 9.0000 7.0000 9.0000 9.0000 Columns 15 through 21 3.0000 3.0000 3.0000 3.0000 3.0000 1.0000 3.0000 2.0000 2.0000 2.0000 1.0000 1.0000 2.0000 2.0000 1.0000 1.0000 1.0000 2.0000 2.0000 3.0000 1.0000 5.0000 6.0000 5.0000 6.0000 5.0000 6.0000 5.0000 6.0000 5.0000 6.0000 8.0000 6.0000 4.0000 6.0000 4.0000 4.0000 4.0000 9.0000 4.0000 5.0000 4.0000 7.0000 8.0000 7.0000 5.0000 8.0000 7.0000 8.0000 9.0000 7.0000 8.0000 4.0000 7.0000 8.0000 7.0000 8.0000 9.0000 9.0000 7.0000 9.0000 9.0000 9.0000 Since the information in column 1 is labeling, not data, remove it. daData = Columns 1 through 7 341.6200 3.0000 4.0000 3.0000 2.0000 3.0000 3.0000 372.5100 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 371.4700 2.0000 2.0000 2.0000 3.0000 2.0000 2.0000 372.5100 6.0000 5.0000 6.0000 5.0000 5.0000 5.0000 334.6000 5.0000 6.0000 4.0000 6.0000 6.0000 6.0000 357.3500 4.0000 3.0000 5.0000 4.0000 4.0000 4.0000 399.3400 8.0000 9.0000 7.0000 9.0000 8.0000 8.0000 399.3400 7.0000 7.0000 8.0000 7.0000 7.0000 9.0000 399.3400 9.0000 8.0000 9.0000 8.0000 9.0000 7.0000 Columns 8 through 14 2.0000 2.0000 2.0000 3.0000 1.0000 4.0000 3.0000 1.0000 1.0000 1.0000 1.0000 3.0000 3.0000 2.0000 3.0000 3.0000 3.0000 2.0000 2.0000 2.0000 1.0000 5.0000 4.0000 6.0000 5.0000 6.0000 6.0000 5.0000 6.0000 5.0000 4.0000 4.0000 5.0000 5.0000 6.0000 4.0000 6.0000 5.0000 8.0000 4.0000 1.0000 4.0000 7.0000 8.0000 8.0000 9.0000 8.0000 7.0000 7.0000 8.0000 7.0000 7.0000 6.0000 7.0000 8.0000 9.0000 9.0000 9.0000 9.0000 7.0000 9.0000 9.0000 8.0000 Columns 15 through 20 3.0000 3.0000 3.0000 3.0000 1.0000 3.0000 2.0000 2.0000 1.0000 1.0000 2.0000 2.0000 1.0000 1.0000 2.0000 2.0000 3.0000 1.0000 6.0000 5.0000 6.0000 5.0000 6.0000 5.0000 5.0000 6.0000 8.0000 6.0000 4.0000 6.0000 4.0000 4.0000 9.0000 4.0000 5.0000 4.0000 8.0000 7.0000 5.0000 8.0000 7.0000 8.0000 7.0000 8.0000 4.0000 7.0000 8.0000 7.0000 9.0000 9.0000 7.0000 9.0000 9.0000 9.0000 OK, now let's generate the correlation matrix, using spearman's rho (This will take a minute or two.) OK, now let's look at the first row of the p-values, transposed for convenient display with subject numbers indicated in the first column. Subject 0 covers the scores for the districts from the software. ans = 0 0.0001 1.0000 0.0826 2.0000 0.1481 3.0000 0.0632 4.0000 0.1092 5.0000 0.1339 6.0000 0.1339 7.0000 0.1092 8.0000 0.1156 9.0000 0.0474 10.0000 0.2322 11.0000 0.0286 12.0000 0.0474 13.0000 0.1156 14.0000 0.0673 15.0000 0.1156 16.0000 0.6794 17.0000 0.1339 18.0000 0.0260 19.0000 0.1156 Comment: subjects 16 and 10 seem quite different from the others. These are p-values, so low values mean significant statistically. However, this has to be qualified for present purposes, since each value is a random variable. Excepting 10 and 16, I'd say this is very good agreement. Now, let's look at the actual correlations of the subjects with the computer-calculated scores. 0 1.0000 1.0000 0.6214 2.0000 0.5278 3.0000 0.6555 4.0000 0.5789 5.0000 0.5448 6.0000 0.5448 7.0000 0.5789 8.0000 0.5703 9.0000 0.6895 10.0000 0.4427 11.0000 0.7406 12.0000 0.6895 13.0000 0.5703 14.0000 0.6470 15.0000 0.5703 16.0000 -0.1617 17.0000 0.5448 18.0000 0.7491 19.0000 0.5703 Perhaps subject 16 got it backwards? Neglecting subjects 10 and 16, I'd say that we find here a reasonably good fit between the subject's judgments and the scores calculated by the software. >> ----------------------------- Group B follows ----------------------------------------Here is the help information from groupAWorkbook.m: 2011-12-14. This M-script file records my analysis of the group B data for the redistricting experiment conducted earlier in Hua-Lien. The input file is groupB.txt, which is drawn from the Excel file FirstExperimentData.xlsx. First, let's see the data file's comments: 1 346.57 2 3 6 2 1 1 3 2 1 2 3 2 1 1 2 8 1 2 3 24 32 38 51 68 84 94 96 372.53 5 7 9 346.57 4 6 8 344.6 3 2 3 372.51 1 1 2 372.51 6 4 5 400.42 9 5 4 399.34 7 8 7 399.34 8 9 1 6 5 5 4 3 2 1 3 4 8 7 6 9 7 8 9 4 5 7 6 3 4 2 2 6 1 5 7 9 8 8 9 5 6 4 4 1 2 3 3 7 5 6 8 8 9 9 7 4 4 6 5 1 2 3 1 5 6 9 7 7 8 8 9 5 4 4 5 1 3 3 2 6 6 7 7 8 9 9 8 4 8 6 5 3 1 2 3 8 4 5 9 9 6 7 7 Now, let's see what is in the file: rawData = Columns 1 through 6 1.0000 346.5700 2.0000 2.0000 1.0000 2.0000 24.0000 372.5300 5.0000 6.0000 4.0000 5.0000 32.0000 346.5700 4.0000 5.0000 7.0000 4.0000 38.0000 344.6000 3.0000 3.0000 3.0000 1.0000 51.0000 372.5100 1.0000 1.0000 2.0000 3.0000 68.0000 372.5100 6.0000 4.0000 6.0000 7.0000 84.0000 400.4200 9.0000 7.0000 5.0000 6.0000 94.0000 399.3400 7.0000 9.0000 9.0000 8.0000 96.0000 399.3400 8.0000 8.0000 8.0000 9.0000 Columns 7 through 12 2.0000 2.0000 1.0000 8.0000 2.0000 3.0000 4.0000 5.0000 4.0000 6.0000 5.0000 6.0000 6.0000 4.0000 6.0000 5.0000 4.0000 5.0000 1.0000 1.0000 3.0000 9.0000 1.0000 2.0000 3.0000 3.0000 2.0000 7.0000 3.0000 1.0000 5.0000 6.0000 8.0000 2.0000 6.0000 4.0000 9.0000 7.0000 5.0000 1.0000 7.0000 7.0000 7.0000 8.0000 9.0000 3.0000 8.0000 8.0000 8.0000 9.0000 7.0000 4.0000 9.0000 9.0000 Columns 13 through 18 3.0000 6.0000 1.0000 3.0000 1.0000 3.0000 7.0000 9.0000 5.0000 5.0000 6.0000 4.0000 6.0000 8.0000 4.0000 6.0000 4.0000 5.0000 2.0000 3.0000 2.0000 4.0000 2.0000 2.0000 1.0000 2.0000 3.0000 2.0000 3.0000 1.0000 4.0000 5.0000 8.0000 1.0000 5.0000 6.0000 6 6 5 5 9 3 7 2 2 7 1 4 3 8 4 9 5 6 4 5 1 2 3 1 6 4 7 7 8 8 9 9 5.0000 4.0000 6.0000 7.0000 8.0000 7.0000 8.0000 7.0000 7.0000 8.0000 9.0000 8.0000 9.0000 1.0000 9.0000 9.0000 7.0000 9.0000 Columns 19 through 21 1.0000 2.0000 1.0000 4.0000 8.0000 6.0000 5.0000 5.0000 5.0000 3.0000 1.0000 3.0000 2.0000 3.0000 2.0000 6.0000 4.0000 7.0000 7.0000 9.0000 4.0000 9.0000 6.0000 8.0000 8.0000 7.0000 9.0000 Since the information in column 1 is labeling, not data, remove it. daData = Columns 1 through 7 346.5700 2.0000 2.0000 1.0000 2.0000 2.0000 2.0000 372.5300 5.0000 6.0000 4.0000 5.0000 4.0000 5.0000 346.5700 4.0000 5.0000 7.0000 4.0000 6.0000 4.0000 344.6000 3.0000 3.0000 3.0000 1.0000 1.0000 1.0000 372.5100 1.0000 1.0000 2.0000 3.0000 3.0000 3.0000 372.5100 6.0000 4.0000 6.0000 7.0000 5.0000 6.0000 400.4200 9.0000 7.0000 5.0000 6.0000 9.0000 7.0000 399.3400 7.0000 9.0000 9.0000 8.0000 7.0000 8.0000 399.3400 8.0000 8.0000 8.0000 9.0000 8.0000 9.0000 Columns 8 through 14 1.0000 8.0000 2.0000 3.0000 3.0000 6.0000 1.0000 4.0000 6.0000 5.0000 6.0000 7.0000 9.0000 5.0000 6.0000 5.0000 4.0000 5.0000 6.0000 8.0000 4.0000 3.0000 9.0000 1.0000 2.0000 2.0000 3.0000 2.0000 2.0000 7.0000 3.0000 1.0000 1.0000 2.0000 3.0000 8.0000 2.0000 6.0000 4.0000 4.0000 5.0000 8.0000 5.0000 1.0000 7.0000 7.0000 5.0000 4.0000 6.0000 9.0000 3.0000 8.0000 8.0000 8.0000 7.0000 7.0000 7.0000 4.0000 9.0000 9.0000 9.0000 1.0000 9.0000 Columns 15 through 20 3.0000 1.0000 3.0000 1.0000 2.0000 1.0000 5.0000 6.0000 4.0000 4.0000 8.0000 6.0000 6.0000 4.0000 5.0000 5.0000 5.0000 5.0000 4.0000 2.0000 2.0000 3.0000 1.0000 3.0000 2.0000 3.0000 1.0000 2.0000 3.0000 2.0000 1.0000 5.0000 6.0000 6.0000 4.0000 7.0000 7.0000 8.0000 7.0000 7.0000 9.0000 4.0000 8.0000 9.0000 8.0000 9.0000 6.0000 8.0000 9.0000 7.0000 9.0000 8.0000 7.0000 9.0000 OK, now let's generate the correlation matrix, using spearman's rho (This will take a minute or two.) OK, now let's look at the first row of the p-values, transposed for convenient display with subject numbers indicated in the first column. Subject 0 covers the scores for the districts from the software. ans = 0 0.0000 1.0000 0.0116 2.0000 0.0246 3.0000 0.1595 4.0000 0.0127 5.0000 0.0077 6.0000 0.0033 7.0000 0.1753 8.0000 0.0199 9.0000 0.0033 10.0000 0.0182 11.0000 0.0838 12.0000 0.8171 13.0000 0.0323 14.0000 0.0946 15.0000 0.0018 16.0000 0.0323 17.0000 0.0299 18.0000 0.0037 19.0000 0.1246 Comment: subjects 12 seems quite different from the others. These are p-values, so low values mean significant statistically. However, this has to be qualified for present purposes, since each value is a random variable. Excepting 12, I'd say this is very good agreement. Now, let's look at the actual correlations of the subjects with the computer-calculated scores. 0 1.0000 1.0000 0.8102 2.0000 0.7511 3.0000 0.5148 4.0000 0.8018 5.0000 0.8355 6.0000 0.8777 7.0000 0.4979 8.0000 -0.7680 9.0000 0.8777 10.0000 0.7764 11.0000 0.6161 12.0000 -0.0928 13.0000 0.7258 14.0000 0.5992 15.0000 0.9030 16.0000 0.7258 17.0000 0.7342 18.0000 0.8693 19.0000 0.5570 Perhaps subjects 8 and 12 got it backwards? Neglecting subjects 8 and 12, I'd say that we find here a reasonably good fit between the subject's judgments and the scores calculated by the software. >>
© Copyright 2026 Paperzz