0.01= , 0.002= , N=3

Advanced Topics in Search
Theory
3: Concurrent Search
Theme Paper
• The Economics of Information – George
Stigler, 1961
‫שונות מחירים‬
‫• מדוע מוכרים שונים קובעים מחירים שונים לאותו‬
‫מוצר הומוגני?‬
‫• שונות המחירים כמדד לחוסר המידע בשוק‬
‫• כאשר יש שונות גדולה במחירים‪ ,‬כדאי לדגום‬
‫מספר מוכרים‬
‫דוגמה‬
‫• המוכרים מתחלקים (באופן שווה) בין כאלה‬
‫המבקשים ‪ $2‬עבור המוצר וכאלה המבקשים ‪$3‬‬
‫• מהי התפלגות המחיר המינימלי אם דוגמים מספר‬
‫מוכרים?‬
‫‪0.75*2+0.25*3‬‬
‫‪0.875*2+0.125*3‬‬
Distribution of the Minimum Price
FN x   Pmin x1 ,, xN   x  
1  1  F x   1    f ( y)dy 
 y  x

N
f N x  
fN(x)
fN(x)

N
dFN x 
N 1
 Nf x 1  F x 
dx
‫תוחלת מינימום המחיר‬
dFN  x 
N 1
f N x  
 Nf  x 1  F  x 
dx

EN x  
 yf  y dy
N
y  
uniform distribution – ‫• דוגמה‬
f(x)
f x   1
1
F x   x
FN  x   1  1  F  x   1  1  x 
N
0
N
f N  x   N 1  x 
E N x  
 yf N  y dy 
y  
1
 yN 1  y 
y 0
1
F(x)
1
N 1

P=1
N 1
dy
0
1
)‫תוחלת מינימום המחיר (המשך‬
EN x  

 yf N  y dy 
y  
1
 yN 1  y
N 1
dy
y 0
u  y, v  1  y 
N
du  1, dv  N 1  y 
N 1

E N  x    y1  y 

1
N 1

N 1
0
 1  y  
   1  y  dy  0  
 
y 0
 N 1 0
N 1 1
1
N
• You can easily check this with Excel…
• Can you guess what is EN(x) for the maximum of a
sample?
‫התועלת שבדגימה נוספת‬
f N x  
EN x  
dFN x 
N 1
 Nf  x 1  F x 
dx


y  
y  
 yf N  y dy 
dE N x 
?
dN
 yNf x 1  F x 
N 1
)Robert Solow ‫ידי‬-‫• יורד בקצב קטן (הוכחה על‬
‫עלות החיפוש‬
‫• בד"כ פרופורציונאלית למספר המוכרים שנדגום‬
‫• כמות החיפוש האופטימלית תתקבל על‪-‬ידי‬
‫השוואת הרווח השולי מחיפוש נוסף ועלות החיפוש‬
‫‪cost of search‬‬
‫‪marginal benefit‬‬
‫‪N‬‬
Sequential Search
• Expected benefit when using sequential
search with reservation value: V ( x)c  yf (y)dy F( x)V ( x)

c
V ( x)

 yf (y)dy
y x
1F( x)
y x

• And when searching for minimal price:
x

V ( x )  c 
 yf ( y)dy  (1  F ( x))V ( x)
y 0
x
c
V ( x) 
 yf ( y )dy
y 0
F ( x)
Sequential Search
searching for maximum
searching for minimum

c
 1  F ( y) dy
yx
• We also know that V(x*)=x*
x
c
 F ( y)dy
y 0
?‫איזו שיטה עדיפה‬
• Take the uniform distribution as an example:
– One-sample strategy:
1
1
1
c  EN 1 x   EN x   

N N  1 N N  1
cN 2  cN  1  0
 c  c 2  4c
N
2c
expected cost: EN ( x)  cN
overall
– Sequential search:
x 
c   F ( y )dy   
2
x
2
y 0
x
2c  V ( x)
x
x 0
Comparison
1
0.9
0.8
expected cost
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
c
• Sequential search is always better (why?)
• Unless what?
‫דוגמה‬
‫• מחירים מתפלגים בצורה אחידה בין ‪ 50‬ל‪100 -‬‬
‫(רציף)‬
‫• עלות כל מחיר נוסף – ‪ 1‬דולר‬
‫‪50‬‬
‫‪N 1‬‬
‫‪E N x   50 ‬‬
‫‪50‬‬
‫‪50‬‬
‫‪50‬‬
‫‪c  EN 1 x   EN x   50   50 ‬‬
‫‪‬‬
‫‪N‬‬
‫‪N  1 N N  1‬‬
‫)‪f(x‬‬
‫‪N  6.6‬‬
‫‪0.02‬‬
‫‪N=5: E_5+5=63.33‬‬
‫‪N=6: E_6+6=63.14‬‬
‫‪N=7: E_7+7=63.25‬‬
‫‪100‬‬
‫‪50‬‬
EN+N
N
‫מתי נעדיף לדגום ‪ N‬בו‪-‬זמנית?‬
‫• מועמד השולח בקשות למספר מוסדות‬
‫• חברה הפונה למספר ספקים לקבל הצעות‬
‫• תהליך הבודק מספר שרתים בו זמנית‬
‫תוחלת של מקסימום‬
FN x  Pmax x1 ,, xN   x   F x
N
dFN x 
N 1
f N x  
 Nf x F x 
dx
‫תוחלת של מקסימום (המשך)‬
‫‪‬‬
‫‪ yf  y dy‬‬
‫‪N‬‬
‫‪EN x  ‬‬
‫‪y  ‬‬
‫‪N‬‬
‫‪EN x  ‬‬
‫• עבור התפלגות אחידה בין ‪ 0‬ל‪:1 -‬‬
‫‪N 1‬‬
‫‪EN x ‬‬
‫‪N‬‬
Problem 1
• You are about to purchase an iPod
touch over the internet
• You estimate the price distribution of the product
over the different sellers to be uniform between 200300 dollars
• You can search by yourself, by visiting different websites – the cost of time for obtaining a price quote is
$1
• How will you search? What will be your expected
cost? What’s the mean of the number of merchants
you’ll visit?
Problem 1 (cont.)
• Alternatively, you can access one of the
comparison-shopping web-sites over the
internet
– Web-site “A” offers you searching 100 web-sites
for a total of $10 (average of 10 cent per searched
site).
– Web-site “B” offers you searching 20 web-sites for
a total of $2 (average of 10 cent per searched site)
Solution
• The minimum of a sample of size 100 can be
calculated using:
dFN  x 
N 1
f N x  
 Nf  x 1  F  x 
dx
EN x  

 yf  y dy
N
y  
200  x  300
0.01*  x  200 

F ( x)  0
x  200
1
x  300

0.01 200  x  300
f(x)  
otherwise
0
FN x  1  1  F x
N
dFN  x 
N 1
 Nf  x 1  F  x  
dx
99
100 * 0.011  0.01x  2  
f N x  
3  0.01x99
Solution (cont.)
• Calculating the expected minimum:
f N x   3  0.01x
99
EN x  

 yf N  y dy 
y  
Integration by parts:
300
 y3  0.01y  dy
99
y  200
u  y, du  1
v  3  0.01y  , dv  3  0.01y 
100
EN x  
300
99

 y3  0.01y  dy   y3  0.01y 
99

100 300
y  200
y  200
300

  3  0.01y  dy 
100
y  200
 3  0.01y 101 
1
 [0  (200)]  

200

 200.99

1.01
1.01

 y  200
300
Solution (cont.)
• 214.14>200.99+10
• So we better take this offer…
• and here is a simpler way to come up with
that:
– The minimum of 100 quotes is very close to the
200 lower bound
– In fact, we know for the uniform distribution that:
f(x)
EN x  
0.01
200
300
1
1

N 1 N
In the 201 vicinity
It can become even simpler…
• In our problem:
E N x   200 
f(x)
0.01
1
*100
N 1
200
300
0
1
f(x)
1
Solution for web-site B
1
E N x   200 
*100  204.76
N 1
204.76  2  200.99 10
• Conclusion: it’s better to use web-site B
Problem 1 (cont.)
• What would be the break-even cost of search
c, for which we’ll prefer to search by
ourselves?
Solution
x
c
 F ( y)dy
y 0
206.76
c
 0.01x  2
y  200
206.76
2




0
.
01
x

2

0
.
005
x

2
x
 0.2285
200

206.76
c
y  200
‫מודל משולב‬
‫•‬
‫•‬
‫•‬
‫•‬
‫עלות דגימה של ‪ N‬הזדמנויות היא‪α+βN :‬‬
‫ערך דגימה מגיע מהתפלגות )‪ g(x‬ו‪0  x   G(x) -‬‬
‫מינימום המדגם הוא‪YN  min x1 ,, xN  :‬‬
‫פונקציית התפלגות המינימום‪ fN(y) :‬ו‪FN(y) -‬‬
‫‪FN ( y)  1  1  G( y)‬‬
‫‪N‬‬
‫‪ N  EYN ‬‬
‫• תוחלת המינימום‪:‬‬
‫• ה‪ horizon -‬אינסופי‬
‫‪f N ( y)  Ng ( y)1  G( y)‬‬
‫‪N 1‬‬
‫אסטרטגיה אופטימלית‬
‫• לאחר קבלת מדגם בגודל ‪ ,N‬ניתן‪:‬‬
‫– לסיים החיפוש ולשלם ‪YN‬‬
‫– לבקש מדגם נוסף בגודל ‪ ,N‬ולשלם שוב ‪α+βN‬‬
‫• האסטרטגיה האופטימלית מאופיינת על‪-‬ידי הצמד‬
‫)*‪:(N*,x‬‬
‫– *‪ - N‬גודל המדגם האופטימלי שיש לעבוד לפיו‬
‫– *‪ - x‬ה‪ reservation value -‬בו יש להשתמש‬
‫• שאלה‪ :‬מדוע *‪ N‬ו‪ x* -‬אינם תלויים באיטרציית‬
‫החיפוש בה אנו מצויים (כלומר בזמן)?‬
Analysis
• For fixed (arbitrary) N, VN(x) is the expected
search cost (until the search is terminated)
using the rule:
– Terminate search if YN≤x
– Resume search otherwise
• Notice that:
Analysis
• The expected cost is thus:
• Notice that:
(this is very intuitive)
Analysis
• Also notice:
  N 
V ( x) 
Bernoulli trial is an experiment whose
outcome is random and can be either
of two possible outcomes, "success"
and "failure".
x
yf
(
y
)
dy
N

y 0
FN ( x)
32
Analysis
Analysis
• Proof:
  N 
V ( x) 
x
 yf
y 0
FN ( x)
N
( y )dy
The Quasi-Convex Function
Strictly Decreasing Cost Function
• If VN‘(x)=0 does not exist over [0,A] then
either:
– VN(x) is strictly increasing
– VN(x) is strictly decreasing
• From
determined by
, the sign of VN‘(x) is
, and from
the sign is negative
Strictly Decreasing Cost Function
Strictly Decreasing Cost Function
Proof:
For any value x≥A,
(why?)
Therefore, VN(x) strictly decreases in x if and
only if A-VN(A) < 0 which is equivalent to
Example – uniform distribution
)N=3 ,=0.002 ,=0.01( •
VN  x 
0.350
n =1
n =2
0.250
n =4
n =6
α+βN
0.150
n =10
0.050
CLT
0.117
0.109
VN  x 
n =6
n =10
0.101
n =12
n =14
0.093
n =18
0.085
CLT
Solution Algorithm
V ( x*)  x *
V (x )
‫התחום בו מצוי‬
‫הפתרון‬
  N   N
  N
V x   x
V x   x
x*
2001 ‫ אפריל‬30
  N   N
x( RV )
Finding x*
• What if α, β, N increase?
Finding N*
• The trivial way:
– Set N = 1 and calculate V1(x)=x Then set N = 2 and
calculate V2(x)=x and so on. Then choose a sample
size N* for which the value of the cost function is
minimal
– How long should we continue with this?
1
1
–We know that
and
Also, clearly:
1
N  1

*
and therefore:
Algorithmic approach for N*
Proof:
Therefore:
• Similarly:
• Now, let’s assume
• According to the
assumption:
and show that:
• If
(i.e., otherwise):
• Therefore:
≤
however notice that: Fk 1  y   Fk  y   1  G  y G  y 
non-negative, strictly decreasing in k
Hence:
k
Which leads to a contradiction!
Implication: just check for increasing N values until
you see an increase
Special cases
• What is the optimal sample size for α=0? β=0?
Calculating the variance


LN ( x)    N   2  N  EYN  1YN  x   VN ( x) F N ( x) 
2
E Y   1(Y
2
N
N

 x)  LN x   F N ( x)
LN ( x)    N   2  N VN ( x) FN ( x)    N  
2


E YN   1(YN  x)  LN x   F N ( x)
2
x
L N ( x) 
  N 2V N x     N    y
0
FN ( x )
2
f N  y dy
Finite Decision Horizon
• What would be the solution in the “regular”
sequential search?
• For the multi-sample case, the solution via
backward induction:
– For k=1 (one period remaining) – it’s the one
sample problem
– For k=2: the decision maker will follow the rule:
• If
then stop; otherwise take an additional
sample of N1*
Finite Decision Horizon