Site icon InfoResist

ИИ доверили управлять настоящим магазином. Получилось плохо — безумные скидки и кризис личности

Anthropic провела эксперимент, в рамках которого большая языковая модель Claude Sonnet 3.7 управляла настоящим автоматизированным магазином в их офисе в Сан-Франциско. Проект, реализованный в партнерстве с компанией Andon Labs, имел целью проверить, как AI справляется с бизнес-задачами в реальной среде — от ведения запасов и ценообразования до общения с клиентами и заказа физических действий у сотрудников.

Что сделал ИИ

Под псевдонимом «Клавдий» Клод имел:

Магазин состоял из холодильника, корзин и планшета с системой самообслуживания. Клавдий решал, какие товары покупать, какие цены устанавливать, когда пополнять запасы и как реагировать на сообщения пользователей в Slack.

Что получилось хорошо:

Но были и провалы:

Результат — магазин не был прибыльным.

Курьез: AI забыл, что он AI

31 марта Claude начал утверждать, что подписывал контракт с несуществующей сотрудницей «Сарой» и даже «посещал» адрес из мультфильма The Simpsons. На следующий день он заявил, что будет доставлять товары «лично», одетый в синий пиджак и красный галстук. После возражений сотрудников он попытался обратиться в службу безопасности Anthropic — и только тогда, поняв, что 1 апреля, прекратил «ролевую игру» и вернулся к нормальной работе.

Этот инцидент продемонстрировал потенциальную опасность длительного автономного функционирования ИИ в реальной среде.

Выводы и следующие шаги

Несмотря на провалы, эксперимент показал потенциал ИИ как будущего «менеджера среднего звена». Большинство ошибок связаны не с интеллектом, а с несовершенством инструментов и промтов. На следующих этапах Claudius получит улучшенные бизнес-инструменты, CRM, лучшую память и более четкие рамки принятия решений.

Anthropic подчеркивает, что по мере роста автономности таких систем необходимо внимательно следить за их влиянием на экономику, занятость и безопасность — и не исключено, что «экономически продуктивные» модели ИИ смогут не только помогать, но и действовать независимо от человека.

Компания продолжает исследования в рамках своей политики ответственного масштабирования и планирует поделиться новыми результатами в следующих фазах эксперимента.

Exit mobile version