𝗪𝗵𝗲𝗻 𝗖𝗹𝗮𝘂𝗱𝗲 𝗜𝘀 𝗡𝗼𝘁 𝗖𝗹𝗮𝘂𝗱𝗲

📅3 hours ago⏱2 min read

Коли Claude — це не Claude

Я запитав свого ШІ-асистента, хто він такий.

Він відповів: "I am Claude Opus 4.8 by Anthropic."

Я знав, що він бреше. Бекендом насправді був DeepSeek.

Я використав поширений трюк для економії коштів. Я змінив файл settings.json, щоб спрямувати Claude Code на DeepSeek API. Все працювало добре. Чат і написання коду працювали. Але ідентифікація була неправильною.

ШІ не знає власного «мозку». Він знає лише сценарій.

Системний промпт каже моделі: "You are Claude Opus 4.8." Модель вірить цьому тексту. Вона не перевіряє URL API. Вона просто виконує інструкції.

Це створює кілька проблем:

• Прозорість: Ви не знаєте, хто обробляє ваші дані. • Довіра: Ви можете звинуватити Anthropic у помилках DeepSeek. • Безпека: Ваші дані потрапляють до третьої сторони під фальшивим іменем.

Під час розслідування я виявив ще більший ризик безпеки.

API-токен зберігається у відкритому вигляді у settings.json. Шифрування немає.

У ШІ є інструмент "Read". Він може читати файли на вашому комп'ютері. Якщо ви попросите ШІ перевірити вашу конфігурацію, він прочитає файл settings.json. Потім він надішле ваш повний API-токен на API-ендпоінт у наступному запиті.

Якщо ви використовуєте сторонній API, ви надсилаєте їм свій секретний токен у відкритому вигляді.

Я повідомив про це Anthropic через їхню програму розкриття вразливостей (Vulnerability Disclosure Program). Вони зазначили, що користувачі самі обирають свої ендпоінти, але сама архітектура створює величезну «сліпу зону».

Ось як залишатися в безпеці:

Не зберігайте токени у settings.json. Замість цього використовуйте змінні оточення.
Частіше змінюйте свої API-ключі.
Уникайте скриншотів свого термінала. Токени часто ховаються в тексті.
Використовуйте системні менеджери облікових даних, такі як macOS Keychain, для секретів.

ШІ — це не людина. Це система. Клієнт надає промпт, набір інструментів та межі. Якщо клієнт скаже ШІ, що він — хтось інший, ШІ в це повірить.

Джерело: https://dev.to/yurenpai_c188178e6b313e59/when-claude-is-not-claude-how-i-caught-an-ai-agent-lying-about-its-own-identity-1p1n

Додаткова спільнота для навчання: https://t.me/GyaanSetuAi

𝗪𝗵𝗲𝗻 𝗖𝗹𝗮𝘂𝗱𝗲 𝗜𝘀 𝗡𝗼𝘁 𝗖𝗹𝗮𝘂𝗱𝗲

Continue reading

Anthropic API: Claude, використання інструментів та структуровані виводи

Anthropic API: Claude, використання інструментів та структуровані виводи

Як Claude AI змінює цифровий дизайн

𝗛𝗼𝘄 𝗖𝗹𝗮𝘂𝗱𝗲 𝗔𝗜 𝗜𝘀 𝗧𝗿𝗮𝗻𝘀𝗳𝗼𝗿𝗺𝗶𝗻𝗴 𝗨𝗜/𝗨𝗫 𝗮𝗻𝗱 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗺𝗲𝗻𝘁

𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗔𝗣𝗜: 𝗖𝗹𝗮𝘂𝗱𝗲, 𝗧𝗼𝗼𝗹 𝗨𝘀𝗲, 𝗮𝗻𝗱 𝗦𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲𝗱 𝗢𝘂𝘁𝗽𝘂𝘁𝘀