LLM Coding Test - Результаты

Описание

Результаты тестирования различных LLM моделей. Каждый файл содержит реализацию игры Тетрис, созданной соответствующей языковой моделью.

Реализации от различных LLM моделей:

Anthropic Claude Opus 4.5

Открыть игру →

Anthropic Claude Sonnet 4.5

Открыть игру →

Anthropic Claude Opus 4.6

Открыть игру →

Google Gemini 3 Flash Preview

Открыть игру →

Google Gemini 3 Pro Preview

Открыть игру →

OpenAI GPT-5.1 Codex Max

Открыть игру →

OpenAI GPT-5.2 Codex

Открыть игру →

Perplexity Sonar

Открыть игру →

Qwen Qwen3 Coder Plus

Открыть игру →

X.AI Grok 4.1 Fast

Открыть игру →

Xiaomi Mimo V2 Flash

Открыть игру →

MiniMax: MiniMax M2.1

Открыть игру →

MiniMax M2.1 Free

Открыть игру →

Mistral: Devstral 2 2512 (free)

Открыть игру →

OpenCode Big Pickle

Открыть игру →

OpenAI GPT-5 Nano

Открыть игру →

Claude Sonnet 4.5 Sub

Открыть игру →

Данные активности

CSV файл с данными активности тестирования за 2026-01-25

Скачать CSV →

Сводная таблица результатов

Модель Цена, USD Цена, рубли РФ Время генерации, сек Субъективная оценка
anthropic/claude-4.5-opus-20251124 $0.179690 13.66₽ 71.75
anthropic/claude-4.5-sonnet-20250929 $0.076974 5.85₽ 38.63
google/gemini-3-flash-preview-20251217 $0.009900 0.75₽ 16.59
google/gemini-3-pro-preview-20251117 $0.079632 6.05₽ 63.26
minimax/minimax-m2.1 $0.004912 0.37₽ 122.50
mistralai/devstral-2512 $0.000000 0.00₽ 48.38
openai/gpt-5.1-codex-max-20251204 $0.047017 3.57₽ 36.50
openai/gpt-5.2-20251211 $0.171832 13.06₽ 142.49
openai/gpt-5.2-codex-20260114 $0.042262 3.21₽ 48.85
perplexity/sonar $0.009308 0.71₽ 21.38
qwen/qwen3-coder-plus $0.021526 1.64₽ 48.04
qwen/qwen3-max $0.027391 2.08₽ 91.84
x-ai/grok-4-07-09 $0.054276 4.12₽ 49.62
x-ai/grok-4.1-fast $0.002680 0.20₽ 27.65
xiaomi/mimo-v2-flash-20251210 $0.001682 0.13₽ 36.33
z-ai/glm-4.6 $0.009690 0.74₽ 130.36
z-ai/glm-4.7-20251222 $0.017941 1.36₽ 97.22
openai/gpt-5-nano 0 0 0
z-ai/glm-5 $0.0195 1.521₽ 119.745