2011-12-14, Steve Kimbrough. Here are two reports generated by

2011-12-14, Steve Kimbrough.
Here are two reports generated by my M-script (MATLAB) files,
groupAWorkbook.m and groupBWorkbook.m, from the data in the first experiment
in Hua Lien.
The two groups looked at different maps, similarly chosen (3 with high scores, 3
with middling scores, and 3 with low scores). What we find here is that the subjects’
scores agree broadly with the scores calculated by my program. These last scores
are the maximum of the maximum internal distances within any district in the
overall districting assignment. That is, there are ten districts, each composed of
discrete wards. Each district has a maximum distance between two of its wards. The
score for a full districting is the maximum of the maxima of its 10 districts.
----------------------------- Group A follows ----------------------------------------Here is the help information from groupAWorkbook.m:
2011-12-14. This M-script file records my analysis of the group A
data for the redistricting experiment conducted earlier in Hua-Lien.
The input file is groupA.txt, which is drawn from the Excel file XXX.
First, let's see the data file's comments:
% Column 1 is the ID number of the map.
% Column 2 is the sum of the maximum internal distance score of the
% districts in the map
% Columns 3--21 are the rankings given by the various subjects.
7
341.62 3
4
3
2
3
3
2
2
1
4
3
3
3
3
3
1
3
21
372.51 1
1
1
1
1
1
1
1
3
3
2
2
2
1
1
2
2
31
371.47 2
2
2
3
2
2
3
3
2
2
1
1
1
2
2
3
1
35
372.51 6
5
6
5
5
5
5
4
6
6
5
6
5
6
5
6
5
62
334.6 5
6
4
6
6
6
6
5
5
5
6
5
6
8
6
4
6
71
357.35 4
3
5
4
4
4
4
6
4
1
4
4
4
9
4
5
4
88
399.34 8
9
7
9
8
8
7
8
8
7
7
8
7
5
8
7
8
89
399.34 7
7
8
7
7
9
8
7
7
8
9
7
8
4
7
8
7
90
399.34 9
8
9
8
9
7
9
9
9
9
8
9
9
7
9
9
9
2
3
1
1
3
2
6
5
4
4
5
8
8
9
7
6
9
7
Now, let's see what is in the file:
rawData =
Columns 1 through 7
7.0000 341.6200 3.0000 4.0000 3.0000 2.0000 3.0000
21.0000 372.5100 1.0000 1.0000 1.0000 1.0000 1.0000
31.0000 371.4700 2.0000 2.0000 2.0000 3.0000 2.0000
35.0000 372.5100 6.0000 5.0000 6.0000 5.0000 5.0000
62.0000 334.6000 5.0000 6.0000 4.0000 6.0000 6.0000
71.0000 357.3500 4.0000 3.0000 5.0000 4.0000 4.0000
88.0000 399.3400 8.0000 9.0000 7.0000 9.0000 8.0000
89.0000 399.3400 7.0000 7.0000 8.0000 7.0000 7.0000
90.0000 399.3400 9.0000 8.0000 9.0000 8.0000 9.0000
Columns 8 through 14
3.0000 2.0000 2.0000 2.0000 3.0000 1.0000 4.0000
1.0000 1.0000 1.0000 1.0000 1.0000 3.0000 3.0000
2.0000 3.0000 3.0000 3.0000 2.0000 2.0000 2.0000
5.0000 5.0000 4.0000 6.0000 5.0000 6.0000 6.0000
6.0000 6.0000 5.0000 4.0000 4.0000 5.0000 5.0000
4.0000 4.0000 6.0000 5.0000 8.0000 4.0000 1.0000
8.0000 7.0000 8.0000 8.0000 9.0000 8.0000 7.0000
9.0000 8.0000 7.0000 7.0000 6.0000 7.0000 8.0000
7.0000 9.0000 9.0000 9.0000 7.0000 9.0000 9.0000
Columns 15 through 21
3.0000 3.0000 3.0000 3.0000 3.0000 1.0000 3.0000
2.0000 2.0000 2.0000 1.0000 1.0000 2.0000 2.0000
1.0000 1.0000 1.0000 2.0000 2.0000 3.0000 1.0000
5.0000 6.0000 5.0000 6.0000 5.0000 6.0000 5.0000
6.0000 5.0000 6.0000 8.0000 6.0000 4.0000 6.0000
4.0000 4.0000 4.0000 9.0000 4.0000 5.0000 4.0000
7.0000 8.0000 7.0000 5.0000 8.0000 7.0000 8.0000
9.0000 7.0000 8.0000 4.0000 7.0000 8.0000 7.0000
8.0000 9.0000 9.0000 7.0000 9.0000 9.0000 9.0000
Since the information in column 1 is labeling, not data, remove it.
daData =
Columns 1 through 7
341.6200 3.0000 4.0000 3.0000 2.0000 3.0000 3.0000
372.5100 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
371.4700 2.0000 2.0000 2.0000 3.0000 2.0000 2.0000
372.5100 6.0000 5.0000 6.0000 5.0000 5.0000 5.0000
334.6000 5.0000 6.0000 4.0000 6.0000 6.0000 6.0000
357.3500 4.0000 3.0000 5.0000 4.0000 4.0000 4.0000
399.3400 8.0000 9.0000 7.0000 9.0000 8.0000 8.0000
399.3400 7.0000 7.0000 8.0000 7.0000 7.0000 9.0000
399.3400 9.0000 8.0000 9.0000 8.0000 9.0000 7.0000
Columns 8 through 14
2.0000 2.0000 2.0000 3.0000 1.0000 4.0000 3.0000
1.0000 1.0000 1.0000 1.0000 3.0000 3.0000 2.0000
3.0000 3.0000 3.0000 2.0000 2.0000 2.0000 1.0000
5.0000 4.0000 6.0000 5.0000 6.0000 6.0000 5.0000
6.0000 5.0000 4.0000 4.0000 5.0000 5.0000 6.0000
4.0000 6.0000 5.0000 8.0000 4.0000 1.0000 4.0000
7.0000 8.0000 8.0000 9.0000 8.0000 7.0000 7.0000
8.0000 7.0000 7.0000 6.0000 7.0000 8.0000 9.0000
9.0000 9.0000 9.0000 7.0000 9.0000 9.0000 8.0000
Columns 15 through 20
3.0000 3.0000 3.0000 3.0000 1.0000 3.0000
2.0000 2.0000 1.0000 1.0000 2.0000 2.0000
1.0000 1.0000 2.0000 2.0000 3.0000 1.0000
6.0000 5.0000 6.0000 5.0000 6.0000 5.0000
5.0000 6.0000 8.0000 6.0000 4.0000 6.0000
4.0000 4.0000 9.0000 4.0000 5.0000 4.0000
8.0000 7.0000 5.0000 8.0000 7.0000 8.0000
7.0000 8.0000 4.0000 7.0000 8.0000 7.0000
9.0000 9.0000 7.0000 9.0000 9.0000 9.0000
OK, now let's generate the correlation matrix, using spearman's rho
(This will take a minute or two.)
OK, now let's look at the first row of the p-values,
transposed for convenient display
with subject numbers indicated in the first column.
Subject 0 covers the scores for the districts from the software.
ans =
0 0.0001
1.0000 0.0826
2.0000 0.1481
3.0000 0.0632
4.0000 0.1092
5.0000 0.1339
6.0000 0.1339
7.0000 0.1092
8.0000 0.1156
9.0000 0.0474
10.0000 0.2322
11.0000 0.0286
12.0000 0.0474
13.0000 0.1156
14.0000 0.0673
15.0000 0.1156
16.0000 0.6794
17.0000 0.1339
18.0000 0.0260
19.0000 0.1156
Comment: subjects 16 and 10 seem quite different from the others.
These are p-values, so low values mean significant statistically.
However, this has to be qualified for present purposes, since
each value is a random variable. Excepting 10 and 16, I'd say
this is very good agreement.
Now, let's look at the actual correlations of the subjects
with the computer-calculated scores.
0 1.0000
1.0000 0.6214
2.0000 0.5278
3.0000 0.6555
4.0000 0.5789
5.0000 0.5448
6.0000 0.5448
7.0000 0.5789
8.0000 0.5703
9.0000 0.6895
10.0000 0.4427
11.0000 0.7406
12.0000 0.6895
13.0000 0.5703
14.0000 0.6470
15.0000 0.5703
16.0000 -0.1617
17.0000 0.5448
18.0000 0.7491
19.0000 0.5703
Perhaps subject 16 got it backwards?
Neglecting subjects 10 and 16, I'd say that we find here
a reasonably good fit between the subject's judgments and
the scores calculated by the software.
>>
----------------------------- Group B follows ----------------------------------------Here is the help information from groupAWorkbook.m:
2011-12-14. This M-script file records my analysis of the group B
data for the redistricting experiment conducted earlier in Hua-Lien.
The input file is groupB.txt, which is drawn from the Excel file
FirstExperimentData.xlsx.
First, let's see the data file's comments:
1
346.57 2
3
6
2
1
1
3
2
1
2
3
2
1
1
2
8
1
2
3
24
32
38
51
68
84
94
96
372.53 5
7
9
346.57 4
6
8
344.6 3
2
3
372.51 1
1
2
372.51 6
4
5
400.42 9
5
4
399.34 7
8
7
399.34 8
9
1
6
5
5
4
3
2
1
3
4
8
7
6
9
7
8
9
4
5
7
6
3
4
2
2
6
1
5
7
9
8
8
9
5
6
4
4
1
2
3
3
7
5
6
8
8
9
9
7
4
4
6
5
1
2
3
1
5
6
9
7
7
8
8
9
5
4
4
5
1
3
3
2
6
6
7
7
8
9
9
8
4
8
6
5
3
1
2
3
8
4
5
9
9
6
7
7
Now, let's see what is in the file:
rawData =
Columns 1 through 6
1.0000 346.5700 2.0000 2.0000 1.0000 2.0000
24.0000 372.5300 5.0000 6.0000 4.0000 5.0000
32.0000 346.5700 4.0000 5.0000 7.0000 4.0000
38.0000 344.6000 3.0000 3.0000 3.0000 1.0000
51.0000 372.5100 1.0000 1.0000 2.0000 3.0000
68.0000 372.5100 6.0000 4.0000 6.0000 7.0000
84.0000 400.4200 9.0000 7.0000 5.0000 6.0000
94.0000 399.3400 7.0000 9.0000 9.0000 8.0000
96.0000 399.3400 8.0000 8.0000 8.0000 9.0000
Columns 7 through 12
2.0000 2.0000 1.0000 8.0000 2.0000 3.0000
4.0000 5.0000 4.0000 6.0000 5.0000 6.0000
6.0000 4.0000 6.0000 5.0000 4.0000 5.0000
1.0000 1.0000 3.0000 9.0000 1.0000 2.0000
3.0000 3.0000 2.0000 7.0000 3.0000 1.0000
5.0000 6.0000 8.0000 2.0000 6.0000 4.0000
9.0000 7.0000 5.0000 1.0000 7.0000 7.0000
7.0000 8.0000 9.0000 3.0000 8.0000 8.0000
8.0000 9.0000 7.0000 4.0000 9.0000 9.0000
Columns 13 through 18
3.0000 6.0000 1.0000 3.0000 1.0000 3.0000
7.0000 9.0000 5.0000 5.0000 6.0000 4.0000
6.0000 8.0000 4.0000 6.0000 4.0000 5.0000
2.0000 3.0000 2.0000 4.0000 2.0000 2.0000
1.0000 2.0000 3.0000 2.0000 3.0000 1.0000
4.0000 5.0000 8.0000 1.0000 5.0000 6.0000
6
6
5
5
9
3
7
2
2
7
1
4
3
8
4
9
5
6
4
5
1
2
3
1
6
4
7
7
8
8
9
9
5.0000 4.0000 6.0000 7.0000 8.0000 7.0000
8.0000 7.0000 7.0000 8.0000 9.0000 8.0000
9.0000 1.0000 9.0000 9.0000 7.0000 9.0000
Columns 19 through 21
1.0000 2.0000 1.0000
4.0000 8.0000 6.0000
5.0000 5.0000 5.0000
3.0000 1.0000 3.0000
2.0000 3.0000 2.0000
6.0000 4.0000 7.0000
7.0000 9.0000 4.0000
9.0000 6.0000 8.0000
8.0000 7.0000 9.0000
Since the information in column 1 is labeling, not data, remove it.
daData =
Columns 1 through 7
346.5700 2.0000 2.0000 1.0000 2.0000 2.0000 2.0000
372.5300 5.0000 6.0000 4.0000 5.0000 4.0000 5.0000
346.5700 4.0000 5.0000 7.0000 4.0000 6.0000 4.0000
344.6000 3.0000 3.0000 3.0000 1.0000 1.0000 1.0000
372.5100 1.0000 1.0000 2.0000 3.0000 3.0000 3.0000
372.5100 6.0000 4.0000 6.0000 7.0000 5.0000 6.0000
400.4200 9.0000 7.0000 5.0000 6.0000 9.0000 7.0000
399.3400 7.0000 9.0000 9.0000 8.0000 7.0000 8.0000
399.3400 8.0000 8.0000 8.0000 9.0000 8.0000 9.0000
Columns 8 through 14
1.0000 8.0000 2.0000 3.0000 3.0000 6.0000 1.0000
4.0000 6.0000 5.0000 6.0000 7.0000 9.0000 5.0000
6.0000 5.0000 4.0000 5.0000 6.0000 8.0000 4.0000
3.0000 9.0000 1.0000 2.0000 2.0000 3.0000 2.0000
2.0000 7.0000 3.0000 1.0000 1.0000 2.0000 3.0000
8.0000 2.0000 6.0000 4.0000 4.0000 5.0000 8.0000
5.0000 1.0000 7.0000 7.0000 5.0000 4.0000 6.0000
9.0000 3.0000 8.0000 8.0000 8.0000 7.0000 7.0000
7.0000 4.0000 9.0000 9.0000 9.0000 1.0000 9.0000
Columns 15 through 20
3.0000 1.0000 3.0000 1.0000 2.0000 1.0000
5.0000 6.0000 4.0000 4.0000 8.0000 6.0000
6.0000 4.0000 5.0000 5.0000 5.0000 5.0000
4.0000 2.0000 2.0000 3.0000 1.0000 3.0000
2.0000 3.0000 1.0000 2.0000 3.0000 2.0000
1.0000 5.0000 6.0000 6.0000 4.0000 7.0000
7.0000 8.0000 7.0000 7.0000 9.0000 4.0000
8.0000 9.0000 8.0000 9.0000 6.0000 8.0000
9.0000 7.0000 9.0000 8.0000 7.0000 9.0000
OK, now let's generate the correlation matrix, using spearman's rho
(This will take a minute or two.)
OK, now let's look at the first row of the p-values,
transposed for convenient display
with subject numbers indicated in the first column.
Subject 0 covers the scores for the districts from the software.
ans =
0 0.0000
1.0000 0.0116
2.0000 0.0246
3.0000 0.1595
4.0000 0.0127
5.0000 0.0077
6.0000 0.0033
7.0000 0.1753
8.0000 0.0199
9.0000 0.0033
10.0000 0.0182
11.0000 0.0838
12.0000 0.8171
13.0000 0.0323
14.0000 0.0946
15.0000 0.0018
16.0000 0.0323
17.0000 0.0299
18.0000 0.0037
19.0000 0.1246
Comment: subjects 12 seems quite different from the others.
These are p-values, so low values mean significant statistically.
However, this has to be qualified for present purposes, since
each value is a random variable. Excepting 12, I'd say
this is very good agreement.
Now, let's look at the actual correlations of the subjects
with the computer-calculated scores.
0 1.0000
1.0000 0.8102
2.0000 0.7511
3.0000 0.5148
4.0000 0.8018
5.0000 0.8355
6.0000 0.8777
7.0000 0.4979
8.0000 -0.7680
9.0000 0.8777
10.0000 0.7764
11.0000 0.6161
12.0000 -0.0928
13.0000 0.7258
14.0000 0.5992
15.0000 0.9030
16.0000 0.7258
17.0000 0.7342
18.0000 0.8693
19.0000 0.5570
Perhaps subjects 8 and 12 got it backwards?
Neglecting subjects 8 and 12, I'd say that we find here
a reasonably good fit between the subject's judgments and
the scores calculated by the software.
>>