Einen KI-Agenten bauen, der Flipbooks erstellt

Baue einen KI-Agenten für Dokumente, der einen Monatsbericht automatisch mit dem FlipLink-MCP-Server und Claude in ein veröffentlichtes Flipbook verwandelt.

Sumit Ghugharwal
Sumit Ghugharwal

Veröffentlicht am 21. Juni 2026 · 8 min read

Beitrag teilen:

Was wäre, wenn „Veröffentliche den Bericht dieses Monats als Flipbook“ etwas wäre, das dein Computer ganz von allein erledigt — ohne Dashboard, ohne Upload, ohne einen Freigabelink in eine E-Mail zu kopieren? Genau das verspricht ein KI-Agent für Dokumente: Du beschreibst das Ergebnis, und der Agent ruft die richtigen Tools in der richtigen Reihenfolge auf, damit es passiert.

Dieses Tutorial zeigt dir, wie du einen solchen Agenten mit dem FlipLink-MCP-Server und Claude baust. Der Agent nimmt einen frisch erstellten PDF-Bericht, erstellt daraus ein Flipbook, veröffentlicht es und gibt einen Freigabelink zurück — genau die Art von Aufgabe, die du nach einem Zeitplan laufen lassen und dann vergessen kannst. Wir sind dabei auch ehrlich, wo ein vollständig unbeaufsichtigter Agent an echte Grenzen stößt und wann ein einfaches Skript (die CLI) das bessere Werkzeug ist.

Das Szenario: ein automatisch veröffentlichter Monatsbericht

Stell dir eine wiederkehrende Aufgabe vor. Am Ersten jedes Monats erzeugt irgendeine Pipeline report.pdf — Verkaufszahlen, einen Newsletter, ein Vorstandsdeck. Heute lädt ein Mensch die Datei ins Dashboard hoch, veröffentlicht sie, kopiert den Link und fügt ihn irgendwo ein. Wir wollen das mit einem Agenten automatisieren, der über die Schritte nachdenken kann, statt dass wir jeden einzelnen fest verdrahten.

Der Agent muss Folgendes können: aus der Datei ein Flipbook erstellen, es veröffentlichen und den Freigabelink abrufen. Mit verbundenem FlipLink-MCP-Server entsprechen diese echten Tools, die das Modell direkt aufrufen kann.

Schritt 1 — Den MCP-Server einrichten

Das Model Context Protocol ist die Art und Weise, wie ein KI-Client (Claude, Cursor und andere) externe Tools entdeckt und aufruft. Der FlipLink-MCP-Server stellt die FlipLink-API als eine Reihe von Tools bereit, die das Modell in einer Konversation nutzen kann.

Die vollständige Anleitung findest du unter FlipLink mit Claude über den MCP-Server verbinden. Die Kurzfassung — nichts von Hand zu installieren, dein Client startet ihn mit npx:

claude mcp add fliplink -e FLIPLINK_API_KEY=YOUR_API_KEY -- npx -y fliplink-mcp

Oder als mcpServers-Konfigurationsblock (Claude Desktop, Cursor, Codex):

{
  "mcpServers": {
    "fliplink": {
      "command": "npx",
      "args": ["-y", "fliplink-mcp"],
      "env": { "FLIPLINK_API_KEY": "YOUR_API_KEY", "FLIPLINK_MCP_MODE": "safe" }
    }
  }
}

Die Tools werden aus der FlipLink-Spezifikation generiert und nach dem Muster <noun>_<verb> benannt — der Agent sieht also unter anderem flipbook_create_by_file, flipbook_publish, flipbook_get_share_link und einen whoami-Health-Check auf oberster Ebene. Deinen Schlüssel bekommst du, indem du dich bei go.fliplink.me anmeldest.

Schritt 2 — Den Agenten-Prompt schreiben

Ein Agent ist eigentlich nur ein Modell plus eine Schleife: Er liest das Ziel, entscheidet, welches Tool er aufruft, liest das Ergebnis und entscheidet, was als Nächstes zu tun ist, bis das Ziel erreicht ist. Die Qualität dieser Schleife kommt fast vollständig aus einem klaren Prompt, der die Tools, die Reihenfolge und die Erfolgsbedingung benennt.

Hier ist ein realistischer System-/Task-Prompt für den Monatsbericht-Agenten:

SYSTEM:
You are a publishing agent for FlipLink. Your job is to turn a PDF report
into a published flipbook and return its share link. You have FlipLink MCP
tools available (names follow the pattern noun_verb).

Operating rules:
1. Start by calling `whoami` to confirm the API key works and check the
   remaining flipbook quota. If `whoami` fails, STOP and report the error.
2. Create the flipbook from the file with `flipbook_create_by_file`
   (field File = the PDF path; set Name and Title from the task).
3. Read the result. Every FlipLink response has a top-level `Result` field
   that is "OK" or "ERROR". If `Result` is "ERROR", STOP and report the
   `Message` &mdash; do NOT retry blindly or proceed.
4. On success, capture the returned flipbook ID.
5. Publish it with `flipbook_publish` using that ID. Check `Result` again.
6. Fetch the share link with `flipbook_get_share_link`.
7. Report back: the flipbook ID, the published share URL, and the quota left.

Never invent tool names or IDs. If a step has no clear next action,
stop and explain rather than guessing.

TASK:
Publish this month's report. File: ./reports/2026-06-report.pdf
Title: "June 2026 Report". Name: "june-2026-report".

Zwei Dinge sorgen dafür, dass dieser Prompt funktioniert. Erstens weist er den Agenten an, auf das Result-Feld zu verzweigen — FlipLink gibt Anwendungsfehler als HTTP 200 mit Result: "ERROR" zurück, sodass eine naive „Hat der Aufruf 200 zurückgegeben?“-Prüfung Fehler stillschweigend als Erfolge behandeln würde. Zweitens gibt er für jeden Fehlerpfad eine explizite Stoppbedingung vor, was einen unbeaufsichtigten Lauf davon abhält, in Wiederholungen abzudriften.

Schritt 3 — Schutzmechanismen für unbeaufsichtigte Läufe

Hier musst du klaren Blick bewahren. Der Standard-MCP-Modus ist safe (79 Tools): Lesevorgänge plus umkehrbare Schreibvorgänge, ohne Löschen und ohne Commerce-Tools. Unser Monatsbericht-Agent erstellt, veröffentlicht und liest nur — was alles in den safe-Modus passt —, sodass du für diese Aufgabe die Standardeinstellung belassen kannst und der Agent reibungslos von Anfang bis Ende läuft.

Destruktive Aktionen sind eine andere Geschichte. Wenn dein Agent jemals ein Flipbook löschen oder Preise/Verkäufe anfassen muss, muss er im full-Modus (87 Tools) laufen. Im full-Modus laufen Lösch- und Geld-Tools niemals beim ersten Aufruf: Der Server gibt eine einzeilige Vorschau plus ein kurzlebiges confirm_token zurück (an die genauen Argumente gebunden, läuft in 5 Minuten ab), und der Assistent muss erneut mit diesem Token aufrufen. Dieser Schutzmechanismus sitzt im Server — die FlipLink-API selbst bleibt unverändert.

Sei ehrlich, was das für „vollständig autonom“ bedeutet:

  • Ein Lese-Erstell-und-Veröffentlich-Agent im safe-Modus kann sauber unbeaufsichtigt laufen. Nichts, was er tut, ist abgesichert.
  • Ein Agent, der Dinge löscht, kann nicht gleichzeitig reibungslos und unbeaufsichtigt sein. Der Confirm-Token-Schutz ist absichtlich da. Entweder genehmigt ein Mensch den destruktiven Schritt, oder dein Harness läuft im full-Modus und behandelt den Ablauf Vorschau → Confirm-Token → Zweitaufruf-Handshake explizit im Code. Entwirf keine Pipeline, die davon ausgeht, dass sich ein Flipbook stillschweigend ohne Bestätigung selbst löscht — das tut es nicht, und genau das ist der Sinn der Sache.

Die vollständige Aufschlüsselung der Modi und des Confirm-Token-Ablaufs findest du unter Sicherheit und Schutzmechanismen des MCP-Servers. Die Tools tragen außerdem MCP-Annotationen (readOnlyHint, destructiveHint, idempotentHint), damit ein sorgfältiges Harness das Risiko abwägen kann, bevor es irgendetwas aufruft.

🚀

FlipLink kostenlos testen

Wandle dein PDF in Sekunden um. Keine Anmeldung, keine Kreditkarte — einfach hochladen und loslegen.

Drop your PDF here or click to browse

Max. 40 MB

Bezahlte Tarife ab $39 erhöhen das auf 150 MB.

Schritt 4 — Es planen

Sobald der Agent zuverlässig von Hand läuft, stell ihn auf einen Timer. Wie du das machst, hängt von deinem Client ab — ein Cron-Job, der Claude headless mit dem Task-Prompt aufruft, ein geplanter Workflow oder deine eigene Orchestrierung. Die Mechanik ist hier außerhalb des Themas; der wichtige Punkt ist, dass der Prompt und der Modus einen geplanten Lauf sicher machen, nicht der Scheduler selbst. Halte den Agenten für Erstellen-/Veröffentlichen-Aufgaben im safe-Modus, und der Lauf bleibt unbeaufsichtigt, ohne gegen eine Bestätigungswand zu stoßen.

Schritt 5 — Die Ausgabe überprüfen

Vertrau nicht auf „Der Agent hat gesagt, es hat funktioniert.“ Überprüfe das echte Artefakt:

  • Der Abschlussbericht des Agenten sollte eine Flipbook-ID und eine Freigabe-URL enthalten. Öffne die URL — sie sollte das veröffentlichte Flipbook laden.
  • Prüfe stichprobenartig das whoami-Kontingent vor und nach dem Lauf, damit du weißt, dass das Erstellen tatsächlich einen Slot verbraucht hat, statt stillschweigend fehlzuschlagen.
  • Da jedes Tool-Ergebnis ein Result-Feld trägt, legt ein gut gebauter Agent bei einem Fehler die genaue Message offen. Wenn der Lauf Result: "ERROR" meldet, lies die Nachricht, statt erneut auszuführen — ein Kontingentlimit oder eine zu große Datei behebt sich bei einer Wiederholung nicht von selbst.

Wann die CLI das bessere Werkzeug ist

Hier ist der ehrliche Gegenpunkt zu allem Bisherigen: Für eine headless laufende, deterministische Aufgabe in der CI willst du normalerweise gar keinen LLM-Agenten.

Ein KI-Agent glänzt, wenn die Aufgabe Urteilsvermögen erfordert — zu entscheiden, wie man etwas betiteln soll, auf mehrdeutige Eingaben zu reagieren oder Schritte zu verketten, die du nicht vollständig ausbuchstabiert hast. Aber „Nimm genau diese Datei, erstelle ein Flipbook, veröffentliche es, gib den Link aus“ hat keinerlei Mehrdeutigkeit. Dafür ein LLM laufen zu lassen, bringt Kosten, Latenz und Nichtdeterminismus ohne jeden Nutzen, und du musst trotzdem dieselbe Result-Verzweigung handhaben.

Greif dafür zur FlipLink-CLI. Sie wird aus derselben Spezifikation generiert wie der MCP-Server und die API, kann also nicht abdriften, und sie gibt saubere Exit-Codes zurück (0 Erfolg, 1 Anfragefehler, 2 Anwendungsfehler), auf die die CI verzweigen kann, ganz ohne Parsing:

fliplink config set-key "$FLIPLINK_API_KEY"
ID=$(fliplink flipbook create ./reports/2026-06-report.pdf \
  --title "June 2026 Report" --name june-2026-report --json | jq -r '.ID')
fliplink flipbook publish "$ID"
fliplink flipbook share-link "$ID"

Das ist die ganze monatliche Aufgabe, kein Modell erforderlich. Für eine vollständige Pipeline — einschließlich der Ausführung innerhalb der Continuous Integration — siehe Flipbook-Veröffentlichung in CI/CD automatisieren.

Faustregel: Nutze einen KI-Agenten, wenn die Aufgabe Urteilsvermögen braucht; nutze die CLI, wenn sie jedes Mal gleich sein muss. Viele Teams setzen beides ein — den Agenten für spontane „Veröffentliche das mal für mich“-Anfragen, die CLI für die geplanten, mechanischen Läufe.

Jetzt loslegen

Ein KI-Agent für Dokumente nimmt die manuelle Mitte aus dem Veröffentlichen heraus: Du nennst das Ergebnis, er ruft die Tools auf. Mit FlipLink MCP im safe-Modus läuft ein Erstell-und-Veröffentlich-Agent reibungslos von Anfang bis Ende — und wo destruktive Aktionen ins Spiel kommen, hält der Confirm-Token-Schutz unbeaufsichtigte Läufe ehrlich statt gefährlich.

Bereit? Verbinde den MCP-Server, richte einen Agenten auf einen Bericht und sieh ihm beim Veröffentlichen zu. Für den deterministischen CI-Weg haben dich die CLI-Docs abgedeckt. Der vollständige Endpunkt-Katalog findet sich in der API-Referenz.

Weiterführende Lektüre

Bereit, dein erstes Flipbook zu erstellen?

Verwandle deine PDFs in interaktive Flipbooks und Dokumente. Starte mit dem Lifetime Deal von FlipLink – lebenslanger Zugang ab nur 39 $.

#ki-agent#mcp#automatisierung#claude#dokumente
Lifetime Deal

Einmal zahlen, für immer nutzen

10, 50 oder 100 Flipbooks · Alle 35 Funktionen · Unbegrenzte Domains

$39
10 Flipbooks
$89
50 Flipbooks
Am beliebtesten
$129
100 Flipbooks

Keine Stufen. Keine Funktionsbeschränkungen. Jeder LTD-Code schaltet alles frei.

  • Jede Funktion freigeschaltet — keine Schranken
  • Stapelbar — kaufe jederzeit weitere Codes
  • Austauschbar — tausche alte gegen neue
  • Unbegrenzte eigene Domains (CNAME)
  • Keine wiederkehrenden Gebühren, niemals

Weiterführende Artikel

Tutorials5 min read

FlipLink mit dem MCP-Server an Claude anbinden

Richte den FlipLink-MCP-Server für Claude in wenigen Minuten ein, damit Claude Flipbooks für dich in einfacher Sprache erstellt, veröffentlicht und verwaltet.

Sumit Ghugharwal