DeathMath Benchmark

DeathMath - это бенчмарк для оценки способности моделей решать сложные математические и физические задачи на русском языке.

Что оценивает бенчмарк?

  • RussianMath Score: Оценка способности решать математические задачи на русском языке
  • RussianPhysics Score: Оценка способности решать задачи по физике на русском языке
  • Combined Score: Общая оценка (среднее математики и физики)

Таблица результатов моделей DeathMath