Модел GPT-4.1, o3-pro, o4-mini-high, Claude Sonnet 4, Claude Opus 4 виконують схожі завдання – аналізують запити людини та генерують текстові відповіді – кожна з них має власні сильні й …
Дослідження свідчать, що o4-mini має найкращі здібності до програмування, за ним іде GPT-4.1, потім o3-mini, o1 та GPT-4o з найгіршими результатами. Ранжування базується на бенчмарку SWE-bench Verified, який оцінює реальні завдання програмування.
Використання будь-яких матеріалів, розміщених на сайті, дозволяється за умови посилання на Reporter.zp.ua. Редакція не несе відповідальності за матеріали, розміщені користувачами та які помічені "реклама".
Останні коментарі