角色显著性RS:反映了一个事件元素区分同一事件类型下不同事件实例的能力
R
S
i
j
=
Count
(
A
i
,
E
T
j
)
Count
(
E
T
j
)
RS_{ij} = \frac {\operatorname{Count}(A_i , ET_j)}{\operatorname{Count}(ET_j)}
RSij=Count(ETj)Count(Ai,ETj)
事件相关性ER:反映了一个事件元素区分不同类型的事件的能力
E
R
i
=
log
Sum
(
E
T
)
1
+
Count
(
E
T
C
i
)
ER_i = \log \frac {\operatorname{Sum}(ET)} {1 + \operatorname{Count}(ETC_i)}
ERi=log1+Count(ETCi)Sum(ET)
核心率KR:反映了一个事件元素在一个事件中的重要程度
K
R
i
j
−
R
S
i
j
⋅
E
R
i
KR_{ij} - RS_{ij} \cdot ER_i
KRij−RSij⋅ERi
事件触发词检测
利用所有核心元素去Wikipedia中回标
触发率TR:
T
R
i
j
=
T
C
F
i
j
⋅
T
E
T
F
i
TR_{ij} = TCF_{ij} \cdot TETF_i
TRij=TCFij⋅TETFi
触发词频率TCF:
T
C
F
i
j
=
Count
(
V
i
,
E
T
S
j
)
Count
(
E
T
S
j
)
TCF_{ij} = \frac {\operatorname{Count}(V_i, ETS_j)}{\operatorname{Count}(ETS_j)}
TCFij=Count(ETSj)Count(Vi,ETSj)
触发词时间频率TETF:
T
E
T
F
i
=
log
Sum
(
E
T
)
1
+
Count
(
E
T
I
i
)
TETF_i = \log \frac {\operatorname{Sum}(ET)} {1 + \operatorname{Count}(ETI_i)}
TETFi=log1+Count(ETIi)Sum(ET)
事件触发词过滤和扩展
去除噪声——FrameNet过滤噪声并扩展
frame
(
i
)
=
arg
max
j
(
similarity
(
e
i
,
e
j
,
k
)
)
\operatorname{frame}(i) = \arg \max_j (\operatorname{similarity}(e_i, e_{j, k}))
frame(i)=argmaxj(similarity(ei,ej,k))