четвер, 17 липня 2025 р.

Особиста AI-фабрика: як інженери автоматизують написання та перевірку коду.

AI-фабрика — це система з кількох вікон Claude Code, кожне у своєму git worktree. Моделі o3 і Sonnet 4 створюють плани, Sonnet 3.7 або 4 їх реалізують, а o3 перевіряє відповідність початковому завданню. Помилки додаються в шаблон плану, й ітерація повторюється. Система навчається на кожному циклі.

Мета — створити екосистему агентів, які самі генерують, тестують і вдосконалюють код.

Ключовий принцип: виправляти вхідні, а не вихідні

Замість ручного редагування коду змінюється план, промпт або склад агентів. Це дозволяє автоматично отримати кращий результат у наступному прогоні. Як у Factorio: система сама себе вдосконалює.

Агенти — мов машини на конвеєрі, що працюють безперервно.

Робочий процес

Основний інтерфейс — Claude Code, з локальним MCP, який запускає Goose і o3 (налаштований на моделі Azure OpenAI).

1. Планування
Claude Code передає завдання o3, який уточнює деталі й створює файл <task>-plan.md з реалізацією.

2. Виконання
Sonnet 4 аналізує план і формує список підзадач. Далі Claude Code виконує їх за допомогою Sonnet 3.7 або 4. Для Clojure ефективним є Sonnet 4.

3. Перевірка
Спершу перевіряє Sonnet 4, потім — o3, який суворо дотримується вимог. Проблеми не виправляються в коді, а вносяться у шаблон плану для наступного запуску.

Паралельна робота через Git worktrees

Завдяки git worktree одночасно відкриваються кілька інстансів Claude Code. Це дозволяє працювати над кількома функціями без "прив'язки" до одного агента. Злиття — вручну.

Чому вхідні дані — критичні

Код — тимчасовий. А от плани, інструкції й промпти накопичуються і вдосконалюються. Налагодження на цьому рівні перетворює агентів на ефективних напарників.

Наприклад, колись агент завантажував весь CSV у пам’ять. Було додано вимогу на стрімінг у план, і тепер це відбувається автоматично.

Масштабування

У фабрику додано спеціалізованих агентів. Один перевіряє стиль Clojure-коду. Інший замінює повтори й Thread/sleep на власну бібліотеку повторних спроб.

Збирається колекція агентів, здатних взаємодіяти у складних воркфловах. Наприклад, вони можуть автоматично генерувати інтеграції, тести та документацію на основі API й бізнес-кейсів.

Ітерації як основа

Запуск кількох ітерацій паралельно — недорогий і ефективний підхід. Якщо агент помиляється, висновки лягають у план. Виправлення результату — зайві. Виправлення вхідних — дає системний ефект.

Подальші кроки

  • Автоматизувати керування агентами та їхніми залежностями.

  • Працювати з бізнес-інформацією на вищому рівні абстракції.

  • Розширити складність воркфлоу та кооперацію між агентами.

  • Оптимізувати використання токенів — перемикатись між Claude Max і Bedrock.

Висновок

Фабрика вже здатна генерувати код самостійно, але не повністю автономна. Її сила — в інструкціях і планах, які з кожним циклом стають кращими. Принцип залишається незмінним: код — тимчасовий, інструкції — цінність.

Авторка: Дар’я Бровченко


Джерело


Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.