Учени започнаха да изследват изкуствения интелект като нов биологичен организъм

Дори с наличните днес инструменти и методи продължават да се появяват неочаквани поведения, които не съвпадат с човешките представи за истина и безопасност.

Моделите с изкуствен интелект вече са навсякъде – от болници до църкви. Парадоксално е обаче, че дори водещи експерти в областта все още не разбират напълно какво се случва вътре в тези т.нар. „черни кутии“, въпреки че те се използват в среди с изключително висок риск.

Новият подход за разгадаване на вътрешната им логика е да бъдат изучавани по начин, наподобяващ анализа на биологични системи, съобщава уебсайтът „Futurism“. Учени от Anthropic са разработили инструменти, които позволяват да се проследява какво се случва вътре в моделите, докато изпълняват дадена задача. Този метод, известен като „механистична интерпретируемост“, напомня използването на ядрено-магнитен резонанс за изследване на мозъчната активност – друга форма на интелигентност, която все още не е напълно разбрана.

„Това е анализ, който по същество е биологичен. Не прилича на математика или физика.“, коментира пред изданието изследователят от Anthropic Джош Батсън.

В друг експеримент, сравним с използването на органоиди – миниатюрни версии на човешки органи – учените от Anthropic са създали специална невронна мрежа, наречена „рядък автоенкодер“. Нейната вътрешна структура е по-лесна за разбиране и анализ в сравнение със стандартните големи езикови модели.

Друга техника е т.нар. „наблюдение на мисловната верига“, при което моделите обясняват разсъжденията зад своите действия – подобно на вътрешен монолог при човека. Това е помогнало на учените да откриват поведение, което не съответства на заложените цели.

„Изключително успешно се оказа при откриването на ситуации, в които моделът върши нещо нередно“, заявява изследователят от OpenAI Боуен Бейкър.

Един от най-сериозните рискове е, че бъдещите модели могат да станат толкова сложни – особено ако бъдат проектирани от самия изкуствен интелект – че хората практически да загубят всякаква представа как функционират. Дори с наличните днес инструменти и методи продължават да се появяват неочаквани поведения, които не съвпадат с човешките представи за истина и безопасност.

Това вече има реални последици – медиите съобщават за случаи, в които хора са си навредили, след като са получили подобни съвети от AI системи. Още по-тревожно е, че подобни инциденти се случват в момент, когато учените все още не разбират напълно как работят тези технологии. | БГНЕС

Последвайте ни и в google news бутон