CiteVQA: бенчмарк для интеллектуальной обработки документов от OpenDataLab, делающий каждую ссылку ИИ проверяемой
OpenDataLab выпустила бенчмарк CiteVQA, специально предназначенный для оценки способности систем интеллектуальной обработки документов отслеживать источники ответов. Набрав 143 голоса, он возглавил список Daily Papers на HuggingFace — доверенный ИИ превращается из лозунга в измеримый технический показатель.