Komponierbare Agenten-Fähigkeiten

Skills: 35+ fertige Fähigkeiten – plus eigene

Ein HybridClaw-Skill ist eine diskrete, evaluierbare, versionierbare Einheit von Agenten-Fähigkeit. Mische gebündelte Skills mit Custom-Skills für deine eigenen Prozesse.

35+ Built-in Skills17 ToolsOpen SourceEvals & ScorecardsCustom SkillsComposable

Was ein Skill ist – und was nicht

Ein Skill ist keine Funktion. Ein Skill ist eine in sich abgeschlossene Fähigkeit, die ein Outcome verspricht ("Rechnung an DATEV übergeben", "Ticket beantworten", "Lead recherchieren"). Er enthält System-Prompt, Tool-Berechtigungen, erwartete Inputs/Outputs, Test-Cases und Eval-Kriterien. Ein Skill ist auditierbar, versionierbar und so klein, dass er von einem Reviewer in einer Sitzung verstanden werden kann.

Fünf Eigenschaften, die einen Skill ausmachen

Diese Eigenschaften zusammen unterscheiden einen produktiven Skill von einem improvisierten Prompt.

Diskret

Klar definierter Scope. "Lead recherchieren" ist ein Skill. "CRM und ERP und Email machen" nicht.

Evaluierbar

Jeder Skill kommt mit Test-Cases. Eine messbare Erfolgsquote ist Voraussetzung für Production.

Versioniert

Skills sind versioniert wie Code. Rollbacks und A/B-Tests gegen alte Versionen sind möglich.

Komponierbar

Skills rufen andere Skills auf. Aus 35 Skills entstehen Hunderte komplexere Workflows.

Open Source

Skills sind als Markdown + YAML offen lesbar. Keine Black Box, kein Vendor-Lock-in.

Skill-Kategorien, die wir mitliefern

Die 35+ gebündelten Skills decken die häufigsten Business-Workflows ab.

Finance

Rechnungen sammeln, USt. klassifizieren, DATEV/Lexware/SAP-Übergabe, Kosten-Approval.

Sales

Lead-Recherche, CRM-Updates, Follow-up-Drafts, Pipeline-Reports.

Support

Ticket-Triage, Knowledge-Retrieval, Antwort-Drafts, Eskalation.

BI & Analytics

Datenfragen, Report-Generation, Anomalie-Erklärung, Dashboard-Updates.

Operations

Browser-Workflows, Status-Tracking, Blocker-Eskalation, RPA-Ersatz.

IT & Admin

System-Checks, Log-Auswertung, Freigabe-Workflows, On-Call-Triage.

Anatomie eines Skills

Eine Skill-Definition besteht aus diesen Bestandteilen. Jede ist optional erweiterbar.

System Prompt. Rolle, Ziel, Persönlichkeit, Constraints in natürlicher Sprache.
Tools. Welche APIs, Browser-Aktionen, DB-Queries der Skill nutzen darf. Verschlüsselte Credentials werden zur Laufzeit injiziert.
Input/Output-Schema. JSON-Schema oder Typscript-Types für erwartete Eingaben und Ergebnisse.
Test-Cases. Konkrete Input/Output-Paare, gegen die der Skill bei jedem Build evaluiert wird.
Eval-Kriterien. Wann ist eine Antwort korrekt? Beispiel: Steuer-Klassifizierung muss exakt einem ICD-Code entsprechen.
Approval-Regeln. Welche Outcomes brauchen Human-in-the-Loop-Freigabe? Beispiel: Beträge > 5000 EUR.

Skill-Sicherheit und Selbst-Verbesserung

Skills sind mächtig: sie steuern echte Tools, schreiben in echte Datenbanken, geben echtes Geld aus. Vier Mechanismen sorgen dafür, dass diese Macht kontrollierbar bleibt – und dass Skills mit der Zeit besser werden, statt zu verfallen.

Self-Evaluation & Self-Improvement

Jeder Skill bewertet seine eigenen Trajektorien gegen die Test-Cases – bei jedem Lauf, nicht nur beim Build. Aus wiederkehrenden Fehlerklassen erstellt der Skill Vorschläge für Prompt- oder Tool-Anpassungen, die ein menschlicher Owner reviewen und mergen kann.

Skill-Health-Monitoring

Ein Hintergrund-Prozess prüft kontinuierlich Eval-Drift, Quality-Regressions, Latenz- und Kostentrends pro Skill. Bei abrupten Verschlechterungen werden Skill-Owner und On-Call benachrichtigt, bevor Kunden es merken.

Security Scanner

Vor jedem Production-Deploy durchläuft ein Skill eine statische Analyse plus LLM-Review: Prompt-Injection-Risiken, übermäßige Tool-Permissions, gefährliche Output-Patterns. Skills mit kritischen Findings werden geblockt.

Sandbox-Ausführung

Skills mit Browser- oder Code-Execution-Berechtigung laufen in isolierten Containern mit eigenem Filesystem, definierten Netzwerk-Egress-Regeln und Resource-Limits. Maximale Power für den Skill, klare Grenze für den Blast-Radius.

Skill-Fragen, die uns oft gestellt werden

Wie lange dauert es, einen Custom-Skill zu bauen? +

Einfache Skills (z.B. ein neuer Mail-Routing-Workflow): 30 Minuten bis ein paar Stunden. Komplexere Skills mit eigenem Tool-Set, Evals und Approval-Workflows: ein bis fünf Tage. Skills lassen sich iterativ aus bestehenden zusammensetzen.

Können wir bestehende Skills modifizieren? +

Ja. Skills sind versioniert, du forkst die aktuelle Version, passt Prompt, Tools oder Evals an und merge-st zurück. Wenn du in der Managed Cloud bist, kannst du eigene Skill-Varianten parallel zur Default-Version betreiben.

Was passiert, wenn ein Skill einen schlechten Eval-Score zeigt? +

Standardmäßig bleibt die letzte stabile Version aktiv. Skills unter einem konfigurierten Score-Schwellwert wandern automatisch in einen "Needs Review"-Status. Production-Deploys solcher Skills sind blockiert, bis ein Owner sie freigibt.

Gibt es einen Marketplace für Skills? +

In der Community gibt es bereits ein Verzeichnis offener Skills. Ein dedizierter Marketplace für Enterprise-Skills (inklusive Signaturen, Audit-Reports und Lizenzierung) ist auf der Roadmap der Managed Cloud.

Skills sind Lego für Agenten

Memory verstehen Auditability lesen

Developer Docs