ERR¶

What It Measures¶

ERR means Expected Reciprocal Rank.

It answers:

"How satisfied will users be, assuming they examine results sequentially and stop when satisfied?"

ERR uses a cascade model with graded relevance:

Satisfaction probability:

\[ R(i) = \frac{2^{\operatorname{grade}(i)} - 1}{2^{\max\_grade}} \]

Expected Reciprocal Rank:

\[ \operatorname{ERR@}k = \sum_{i=1}^{k} \frac{1}{i} \times R(i) \times \prod_{j=1}^{i-1} (1 - R(j)) \]

Across all queries:

\[ \operatorname{Mean ERR@}k = \frac{1}{|Q|} \sum_{i=1}^{|Q|} \operatorname{ERR@}k_i \]

\(R(i)\): probability user is satisfied at rank \(i\)
\(\operatorname{grade}(i)\): relevance grade at rank \(i\) (0 to max_grade)
\(\max\_grade\): maximum relevance grade (default: 4)
\(\frac{1}{i}\): reciprocal rank weight
\(\prod_{j=1}^{i-1} (1 - R(j))\): cascade probability (user wasn't satisfied before rank \(i\))

If there are no relevant documents, Evret returns 0.0 for that query.

Given:

Position 1:

\[ \frac{1}{1} \times 0.4375 \times 1 = 0.4375 \]

Position 2:

\[ \frac{1}{2} \times 0.9375 \times (1 - 0.4375) = 0.5 \times 0.9375 \times 0.5625 = 0.2637 \]

Position 3:

\[ \frac{1}{3} \times 0.0625 \times (1 - 0.4375) \times (1 - 0.9375) = 0.3333 \times 0.0625 \times 0.5625 \times 0.0625 = 0.0007 \]

\[ \operatorname{ERR@}3 = 0.4375 + 0.2637 + 0.0007 = 0.7019 \]