Баттл ИИ — январь 2025, сравниваем с новым DeepSeek R1
Наверное, у каждого есть свои критерии крутости ИИ-помощников, выраженные в тех задачах, которые мы часто решаем. Такие критерии есть и у меня. По этим критериям выработал свой начальный тест — «тест генерации трассы» для гоночной 2д игры (можно назвать сокращенно как-нибудь ТГТ-тест). Стало интересно, как его проходят основные ИИ-чаты, присутствующие на рынке.

Сам тест представляет собой простой промпт:
Давай с помощью pygame создадим такую игру.
Сначала пусть при открытии создается в рамках окна случайная траектория закольцованная — это будет трасса. Она должна полностью помещаться в границы экрана игры.
По формулировке даем понять, что это только начальный этап разработки. ИИ придется для себя определить, что пользователь хочет увидеть под понятием «закольцованная трасса». Размышляющие ИИ (которые входят в моду сейчас) могут придти к выводу, что трасса для игры подразумевает плавные повороты, отсутствие пересечений и т.д.
(More …)
Reply