Хора победиха AI в престижен математически конкурс

Около 10% от човешките участници спечелиха златни медали, а 5 получиха перфектен резултат от 42 точки.

Хората победиха генеративни AI модели, създадени от Google и OpenAI, в престижен международен математически конкурс, въпреки че програмите за първи път постигнаха резултати на ниво „злато”.

Нито един от моделите не получи максимален брой точки – за разлика от пет младежи на Международната математическа олимпиада (IMO), престижен ежегоден конкурс, в който участниците трябва да са на възраст под 20 години.

Google съобщи, че усъвършенствана версия на чатбота Gemini е решила пет от шестте математически задачи, зададени на IMO, която се проведе този месец в Куинсланд, Австралия.

„Можем да потвърдим, че Google DeepMind достигна дългоочаквания успех, като спечели 35 от възможните 42 точки – резултат, който му носи златен медал“, заяви президентът на IMO Грегор Долинар, цитиран от АФП.

„Решенията им бяха удивителни в много отношения. Оценителите на IMO ги намериха за ясни, прецизни и повечето от тях лесни за следване“, добави той.

Около 10% от човешките участници спечелиха златни медали, а 5 получиха перфектен резултат от 42 точки.

Американският производител на ChatGPT OpenAI заяви, че експерименталният му модел за разсъждение е постигнал златен резултат от 35 точки на теста.

Резултатът „постигна дългогодишна голяма цел в областта на изкуствения интелект“ на „най-престижното математическо състезание в света“, написа в социалните медии изследователят от OpenAI Александър Уей.

„Оценихме нашите модели по задачите на IMO за 2025 г. по същите правила, както човешките участници. За всяка задача трима бивши медалисти от IMO независимо оцениха представеното доказателство на модела“, добави той.

Google спечели сребърен медал на миналогодишното IMO в британския град Бат, като реши четири от шестте задачи.

Това отнело два до три дни изчисления – много повече отколкото тази година, когато моделът Gemini решил задачите в рамките на 4,5-часовия лимит, заявиха от компанията.

IMO заяви, че технологичните компании са „тествали на частно затворени AI модели върху задачите от тази година“, същите, с които се сблъскаха 641 състезатели от 112 страни.

„Много е вълнуващо да видим напредъка в математическите способности на AI моделите“, каза президентът на IMO Долинар.

Организаторите на състезанието не са могли да проверят колко изчислителна мощност са използвали AI моделите и дали е имало човешка намеса, предупреди той. | БГНЕС

Последвайте ни и в google news бутон