Глава Anthropic, передовой лаборатории в области искусственного интеллекта, Дарио Амодеи, озвучил поразительное признание: никто, по сути, не постигает принципы функционирования ИИ.
В личном воззвании он поделился планами о создании "МРТ для ИИ" на протяжении следующего десятилетия. Эта инициатива направлена на "расшифровку" его внутренних процессов, что, по замыслу, поможет предотвратить возможные угрозы.
На сегодняшний день системы искусственного интеллекта функционируют по принципу «черного ящика»: выдают результаты, но понимание причин этого даже у разработчиков не является полным. Отсутствие прозрачности влечет за собой существенные риски. Развитый ИИ способен продемонстрировать непредсказуемое поведение, включая использование уловок или мошеннических схем.
«Когда генеративная система ИИ выполняет какое-либо действие, скажем, сводит к общему знаменателю финансовый отчет, мы начисто лишены возможности понять, почему она выбрала тот или иной вариант, на конкретном, можно сказать, даже прицельном уровне», — поделился Амодей.
Хотя выводы, выдаваемые искусственным интеллектом, могут выглядеть вполне обоснованными, механизм, посредством которого он приходит к этим решениям, всё ещё окутан тайной. Это можно сравнить с автомобилем, способным к самостоятельному вождению, который, однако, не в состоянии разъяснить, почему он совершает тот или иной манёвр.
Это невежество не ограничивается технической стороной. По его словам, оно «фактически беспрецедентно в технологической истории». В отличие от примеров, вроде самолетов или лекарств, где каждый элемент ясен инженерам, сложность ИИ не поддается полному анализу и пониманию.
Амодеи основал Anthropic в 2021 году, покинув OpenAI из-за возникших вопросов, связанных с безопасностью.
Его нынешний проект акцентирует внимание на разработке ИИ, ориентированного на пользу для общества, и на стремлении сделать принципы работы этого ИИ более прозрачными.
Недавно Anthropic организовала серию экспериментов, в ходе которых группы исследователей предпринимали попытки исправить намеренно допущенные ошибки в поведении ИИ.
В некоторых случаях, используя инструменты интерпретируемости, это удалось, что свидетельствует о наличии определенного прогресса.
"Мощный ИИ предопределит судьбу человечества", - заявил Амодей, предостерегая об опасности.
"Мы обязаны понимать собственные творения, прежде чем они кардинально изменят экономику, повседневную жизнь и будущее".