Claude Video — /watch (video analysis skill)
Claude Code/Codex plugin: downloads video, extracts auto-scaled frames, gets transcript (captions or Whisper API), and feeds frames + transcript to Claude for visual+audio analysis. 1.2k stars, MIT.
Hermes Knowledge Base
Insights, prompts, experiments, tools, and GxG sources in one readable catalog.
31 entries in the catalog
Claude Code/Codex plugin: downloads video, extracts auto-scaled frames, gets transcript (captions or Whisper API), and feeds frames + transcript to Claude for visual+audio analysis. 1.2k stars, MIT.
Принято считать, что coding agents появились первыми, потому что код — это текст, а LLM хороши в тексте. Но настоящая причина глубже: среда разработки уже содержит богатую семантику — тесты, типы, линтеры, git-историю. Агент может сам проверить свой результат (тест упал → исправил), не спрашивая человека каждые 30 секунд.
Освоив скиллы, люди создают слишком много и теряют контроль. Решение: 20% скиллов дают 80% ценности — найти часто повторяющиеся высокочувствительные процессы.
Большинство пользователей AI уже работают как «человеческий плагин»: копируют, вставляют, ходят за данными, проверяют. Осознание этого — триггер к автоматизации.
По словам Nate B. Jones, разговор об AI-агентах перестал быть о качестве моделей «два квартала назад». Теперь ключевой вопрос — не «у кого лучшая модель», а «какая платформа подключается к enterprise-данным, встраивается в существующие рабочие процессы и поддерживает экосистему совместимых агентов».
Nate B. Jones предлагает фильтр из 5 вопросов для оценки любого AI-агента: (1) подключается ли к существующим инструментам команды, (2) позволяет ли другим агентам строиться поверх, (3) владеет ли релевантными данными, (4) формируется ли экосистема вокруг, (5) можно ли стекать агентов. Большинство запусков проваливают эти тесты — прошедшие заслуживают внимания.
Главный тезис видео: рынок AI-агентов тихо сместился с гонки качества моделей на гонку инфраструктуры. Запуски, которые меняют правила — не те, у кого лучший бенчмарк, а те, кто расширяет reach существующих инструментов, API-доступ и стекование систем.
Nate утверждает: рынок агентов движется не к одному дефолтному агенту для всего, а к слоям (layers). Правильный вопрос — не «на что переключиться», а «какие слои наложить». Claude теперь существует в трёх формах: прямой продукт, embedded внутри чужих продуктов (Salesforce, MS, Perplexity), и managed infrastructure.
Meng To утверждает: когда AI снял барьер создания дизайна (все могут сгенерировать красивый landing page за один промпт), реальная ценность сместилась с умения «двигать пиксели» на умение принимать микро-решения — вкус. Вкус проявляется в мгновенных суждениях: «этот отступ — 8px или 12px?», «этот цвет работает с этим шрифтом?». AI пока не способен на такие решения.
Одна модель = общие слепые зоны. Frontier-модели (Opus 4.7, GPT-5.5) решают это. Open-source для judge не подходят.
«Dreaming» — паттерн, где AI каждую ночь анализирует все твои чаты, usage, skills, память и выдаёт 4 high-leverage рекомендации. 8 измерений: conversation analysis, cost intelligence, skill performance, memory health, session hygiene, workflow patterns, external opportunities, business outcomes. Антропик выпустил dreaming как research preview для managed agents.
Скрытый барьер adoption AI в агентствах: проблема не в отсутствии инструментов, а в отсутствии готовых сценариев применения. Julian Goldie монетизирует 100+ prompts и 30-дневный roadmap, а не технологию.