A Study of Random Forests Learning Mechanism with
Application to the Identification of Informative Gene
Interactions in Microarray Data
Outline
„
„
„
„
„
„
„
Human Genetics Basics
̌
̌
̌
̌
X
X
X
X
X
Î
The central dogma of molecular biology
̌
̌
̌
Weak marginal / Strong bivariate genetic
interactions
̌
RF learning mechanism
̌
̌
̌
̌
RF table of variable importance
̌
̌
̌
The oob error rate degradation in high
dimensional settings
̌
̌
̌
̌
Search procedure. Sequential stage
̌
̌
Search procedure. Hunting stage
̌
̌
Drawback with the oob error rate
̌
̌
!
"
#
$
"
%
&
'
(
&
'
)
!
"
#
$
"
%
&
'
(
=
'
)
;
̌
;
8
:
8
:
9
9
9
9
6
6
9
9
9
9
7
7
8
6
8
6
6
6
<
<
*
+
,
-
.
/
0
1
2
3
4
5
*
+
,
-
.
/
0
1
2
3
>
?
Data augmentation
̌
̌
̌
̌
̌
̌
The perturbed oob measure
c
d
e
f
g
h
c
i
j
h
c
k
l
m
n
l
m
o
Y
Q
R
z
{
X
Q
R
z
{
W
Q
R
`
~
z
{
b
V
̌
a
b
Q
R
\
`
]
}
^
_
]
z
{
\
U
[
Q
R
|
z
{
T
Q
R
S
p
q
r
s
q
t
u
v
t
s
w
x
y
u
Q
R
Q
Q
R
@
A
B
C
D
E
F
G
H
I
J
K
@
L
M
N
A
B
C
D
E
F
G
H
I
J
K
J
O
M
L
A
B
C
D
E
F
G
H
I
J
K
J
L
M
O
A
B
C
D
E
F
G
H
I
J
K
J
L
M
P
A
B
C
D
E
F
G
H
I
J
K
J
N
M
Z
÷
ø
ù
ú
û
ü
÷
ý
þ
ü
÷
ÿ
í
å
°
±
²
³
´
µ
°
¶
·
µ
°
¸
¹
º
»
¼
º
æ
½
ì
ª
å
æ
«
ª
¯
ë
«
ª
å
æ
ª
ô
¯
«
ª
Ï
ÌÎ
ö
ê
Í
õ
ö
Í
å
æ
ð
Ê
Í
ô
Í
®
ñ
«
ª
Ë
Ì
ò
ó
ñ
Ê
ð
Ê
é
ï
ª
å
æ
®
ª
«
è
¬
ª
«
å
æ
ª
¬
ª
«
ç
å
¡
¢
£
¾
¿
À
Á
Â
Ã
Ä
Å
Æ
Ç
È
¡
¤
¥
¦
¤
£
§
¨
©
æ
¥
É
å
å
æ
Ð
Ñ
Ò
Ó
Ô
Õ
Ö
×
Ø
Ù
Ú
Û
Ü
Ý
Þ
Ü
Ñ
Ò
Ó
Ô
Õ
Ö
×
Ø
Ù
Ú
Û
ß
à
Þ
Ý
Ñ
Ò
Ó
Ô
Õ
Ö
×
Ø
Ù
Ú
Û
î
Ð
á
Þ
â
Ñ
Ò
Ó
Ô
Õ
Ö
×
Ø
Ù
Ú
Û
Ð
ã
Þ
ä
Ñ
Ò
Ó
Ô
Õ
Ö
×
Ø
Ù
Ú
Û
Ð
à
Þ
Summary of the algorithm
̌
Application to the colon cancer data
̌
̌
Data pre-processing
̌
̌
A first selection. Sequential search
Results
̌
̌
Summary and conclusions
̌
̌
̌
̌
̌
Future research
̌
̌
È
̌
̌
Thank you for your attention
© Copyright 2026 Paperzz