feat(eval-viewer): add per-criterion verdict filters by kirang89 · Pull Request #47 · nilenso/ask-forge

kirang89 · 2026-03-18T16:54:19Z

Summary

Adds granular verdict filtering to the eval viewer, allowing filtering by specific failure criteria instead of just pass/fail.

New filter options

Filter	Matches
Verdict: pass	All criteria pass
Verdict: fail (any)	Any criterion fails
Fail: incomplete	`isAnswerComplete` is "no"
Fail: not evidenced	`isEvidenceSupported` is "no"
Fail: not linked	`isEvidenceLinked` is "no"
Fail: bad reasoning	`isReasoningSound` is "no"
Verdict: none	No verdicts present

Changes

Expanded the Verdict dropdown with per-criterion fail options
Added FAIL_FIELD_MAP and matchesVerdictFilter() to centralize verdict matching logic
Simplified filtering in getFilteredItems() for both single-run and comparison modes
Widened filter select min-width (130px → 160px) to fit longer labels

Add granular filtering options to the Verdict dropdown: - fail: incomplete, not evidenced, not linked, bad reasoning - Centralize verdict matching in matchesVerdictFilter() - Widen filter select min-width for longer labels

kirang89 added 2 commits March 18, 2026 22:23

feat(eval-viewer): add per-criterion verdict filters

7eba3e1

Add granular filtering options to the Verdict dropdown: - fail: incomplete, not evidenced, not linked, bad reasoning - Centralize verdict matching in matchesVerdictFilter() - Widen filter select min-width for longer labels

Merge branch 'main' into feat/eval-viewer-granular-verdict-filter

de30cb2

kirang89 merged commit 209971b into main Mar 18, 2026
2 checks passed

kirang89 deleted the feat/eval-viewer-granular-verdict-filter branch March 18, 2026 17:01

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat(eval-viewer): add per-criterion verdict filters#47

feat(eval-viewer): add per-criterion verdict filters#47
kirang89 merged 2 commits intomainfrom
feat/eval-viewer-granular-verdict-filter

kirang89 commented Mar 18, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

kirang89 commented Mar 18, 2026

Summary

New filter options

Changes

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant