Einen KI-Agenten bauen, der Flipbooks erstellt
Baue einen KI-Agenten für Dokumente, der einen Monatsbericht automatisch mit dem FlipLink-MCP-Server und Claude in ein veröffentlichtes Flipbook verwandelt.
Veröffentlicht am 21. Juni 2026 · 8 min read
Was wäre, wenn „Veröffentliche den Bericht dieses Monats als Flipbook“ etwas wäre, das dein Computer ganz von allein erledigt — ohne Dashboard, ohne Upload, ohne einen Freigabelink in eine E-Mail zu kopieren? Genau das verspricht ein KI-Agent für Dokumente: Du beschreibst das Ergebnis, und der Agent ruft die richtigen Tools in der richtigen Reihenfolge auf, damit es passiert.
Dieses Tutorial zeigt dir, wie du einen solchen Agenten mit dem FlipLink-MCP-Server und Claude baust. Der Agent nimmt einen frisch erstellten PDF-Bericht, erstellt daraus ein Flipbook, veröffentlicht es und gibt einen Freigabelink zurück — genau die Art von Aufgabe, die du nach einem Zeitplan laufen lassen und dann vergessen kannst. Wir sind dabei auch ehrlich, wo ein vollständig unbeaufsichtigter Agent an echte Grenzen stößt und wann ein einfaches Skript (die CLI) das bessere Werkzeug ist.
Das Szenario: ein automatisch veröffentlichter Monatsbericht
Stell dir eine wiederkehrende Aufgabe vor. Am Ersten jedes Monats erzeugt irgendeine Pipeline report.pdf — Verkaufszahlen, einen Newsletter, ein Vorstandsdeck. Heute lädt ein Mensch die Datei ins Dashboard hoch, veröffentlicht sie, kopiert den Link und fügt ihn irgendwo ein. Wir wollen das mit einem Agenten automatisieren, der über die Schritte nachdenken kann, statt dass wir jeden einzelnen fest verdrahten.
Der Agent muss Folgendes können: aus der Datei ein Flipbook erstellen, es veröffentlichen und den Freigabelink abrufen. Mit verbundenem FlipLink-MCP-Server entsprechen diese echten Tools, die das Modell direkt aufrufen kann.
Schritt 1 — Den MCP-Server einrichten
Das Model Context Protocol ist die Art und Weise, wie ein KI-Client (Claude, Cursor und andere) externe Tools entdeckt und aufruft. Der FlipLink-MCP-Server stellt die FlipLink-API als eine Reihe von Tools bereit, die das Modell in einer Konversation nutzen kann.
Die vollständige Anleitung findest du unter FlipLink mit Claude über den MCP-Server verbinden. Die Kurzfassung — nichts von Hand zu installieren, dein Client startet ihn mit npx:
claude mcp add fliplink -e FLIPLINK_API_KEY=YOUR_API_KEY -- npx -y fliplink-mcp
Oder als mcpServers-Konfigurationsblock (Claude Desktop, Cursor, Codex):
{
"mcpServers": {
"fliplink": {
"command": "npx",
"args": ["-y", "fliplink-mcp"],
"env": { "FLIPLINK_API_KEY": "YOUR_API_KEY", "FLIPLINK_MCP_MODE": "safe" }
}
}
}
Die Tools werden aus der FlipLink-Spezifikation generiert und nach dem Muster <noun>_<verb> benannt — der Agent sieht also unter anderem flipbook_create_by_file, flipbook_publish, flipbook_get_share_link und einen whoami-Health-Check auf oberster Ebene. Deinen Schlüssel bekommst du, indem du dich bei go.fliplink.me anmeldest.
Schritt 2 — Den Agenten-Prompt schreiben
Ein Agent ist eigentlich nur ein Modell plus eine Schleife: Er liest das Ziel, entscheidet, welches Tool er aufruft, liest das Ergebnis und entscheidet, was als Nächstes zu tun ist, bis das Ziel erreicht ist. Die Qualität dieser Schleife kommt fast vollständig aus einem klaren Prompt, der die Tools, die Reihenfolge und die Erfolgsbedingung benennt.
Hier ist ein realistischer System-/Task-Prompt für den Monatsbericht-Agenten:
SYSTEM:
You are a publishing agent for FlipLink. Your job is to turn a PDF report
into a published flipbook and return its share link. You have FlipLink MCP
tools available (names follow the pattern noun_verb).
Operating rules:
1. Start by calling `whoami` to confirm the API key works and check the
remaining flipbook quota. If `whoami` fails, STOP and report the error.
2. Create the flipbook from the file with `flipbook_create_by_file`
(field File = the PDF path; set Name and Title from the task).
3. Read the result. Every FlipLink response has a top-level `Result` field
that is "OK" or "ERROR". If `Result` is "ERROR", STOP and report the
`Message` — do NOT retry blindly or proceed.
4. On success, capture the returned flipbook ID.
5. Publish it with `flipbook_publish` using that ID. Check `Result` again.
6. Fetch the share link with `flipbook_get_share_link`.
7. Report back: the flipbook ID, the published share URL, and the quota left.
Never invent tool names or IDs. If a step has no clear next action,
stop and explain rather than guessing.
TASK:
Publish this month's report. File: ./reports/2026-06-report.pdf
Title: "June 2026 Report". Name: "june-2026-report".
Zwei Dinge sorgen dafür, dass dieser Prompt funktioniert. Erstens weist er den Agenten an, auf das Result-Feld zu verzweigen — FlipLink gibt Anwendungsfehler als HTTP 200 mit Result: "ERROR" zurück, sodass eine naive „Hat der Aufruf 200 zurückgegeben?“-Prüfung Fehler stillschweigend als Erfolge behandeln würde. Zweitens gibt er für jeden Fehlerpfad eine explizite Stoppbedingung vor, was einen unbeaufsichtigten Lauf davon abhält, in Wiederholungen abzudriften.
Schritt 3 — Schutzmechanismen für unbeaufsichtigte Läufe
Hier musst du klaren Blick bewahren. Der Standard-MCP-Modus ist safe (79 Tools): Lesevorgänge plus umkehrbare Schreibvorgänge, ohne Löschen und ohne Commerce-Tools. Unser Monatsbericht-Agent erstellt, veröffentlicht und liest nur — was alles in den safe-Modus passt —, sodass du für diese Aufgabe die Standardeinstellung belassen kannst und der Agent reibungslos von Anfang bis Ende läuft.
Destruktive Aktionen sind eine andere Geschichte. Wenn dein Agent jemals ein Flipbook löschen oder Preise/Verkäufe anfassen muss, muss er im full-Modus (87 Tools) laufen. Im full-Modus laufen Lösch- und Geld-Tools niemals beim ersten Aufruf: Der Server gibt eine einzeilige Vorschau plus ein kurzlebiges confirm_token zurück (an die genauen Argumente gebunden, läuft in 5 Minuten ab), und der Assistent muss erneut mit diesem Token aufrufen. Dieser Schutzmechanismus sitzt im Server — die FlipLink-API selbst bleibt unverändert.
Sei ehrlich, was das für „vollständig autonom“ bedeutet:
- Ein Lese-Erstell-und-Veröffentlich-Agent im
safe-Modus kann sauber unbeaufsichtigt laufen. Nichts, was er tut, ist abgesichert. - Ein Agent, der Dinge löscht, kann nicht gleichzeitig reibungslos und unbeaufsichtigt sein. Der Confirm-Token-Schutz ist absichtlich da. Entweder genehmigt ein Mensch den destruktiven Schritt, oder dein Harness läuft im
full-Modus und behandelt den Ablauf Vorschau → Confirm-Token → Zweitaufruf-Handshake explizit im Code. Entwirf keine Pipeline, die davon ausgeht, dass sich ein Flipbook stillschweigend ohne Bestätigung selbst löscht — das tut es nicht, und genau das ist der Sinn der Sache.
Die vollständige Aufschlüsselung der Modi und des Confirm-Token-Ablaufs findest du unter Sicherheit und Schutzmechanismen des MCP-Servers. Die Tools tragen außerdem MCP-Annotationen (readOnlyHint, destructiveHint, idempotentHint), damit ein sorgfältiges Harness das Risiko abwägen kann, bevor es irgendetwas aufruft.
FlipLink kostenlos testen
Wandle dein PDF in Sekunden um. Keine Anmeldung, keine Kreditkarte — einfach hochladen und loslegen.
Drop your PDF here or click to browse
Max. 40 MB
Bezahlte Tarife ab $39 erhöhen das auf 150 MB.
Schritt 4 — Es planen
Sobald der Agent zuverlässig von Hand läuft, stell ihn auf einen Timer. Wie du das machst, hängt von deinem Client ab — ein Cron-Job, der Claude headless mit dem Task-Prompt aufruft, ein geplanter Workflow oder deine eigene Orchestrierung. Die Mechanik ist hier außerhalb des Themas; der wichtige Punkt ist, dass der Prompt und der Modus einen geplanten Lauf sicher machen, nicht der Scheduler selbst. Halte den Agenten für Erstellen-/Veröffentlichen-Aufgaben im safe-Modus, und der Lauf bleibt unbeaufsichtigt, ohne gegen eine Bestätigungswand zu stoßen.
Schritt 5 — Die Ausgabe überprüfen
Vertrau nicht auf „Der Agent hat gesagt, es hat funktioniert.“ Überprüfe das echte Artefakt:
- Der Abschlussbericht des Agenten sollte eine Flipbook-ID und eine Freigabe-URL enthalten. Öffne die URL — sie sollte das veröffentlichte Flipbook laden.
- Prüfe stichprobenartig das
whoami-Kontingent vor und nach dem Lauf, damit du weißt, dass das Erstellen tatsächlich einen Slot verbraucht hat, statt stillschweigend fehlzuschlagen. - Da jedes Tool-Ergebnis ein
Result-Feld trägt, legt ein gut gebauter Agent bei einem Fehler die genaueMessageoffen. Wenn der LaufResult: "ERROR"meldet, lies die Nachricht, statt erneut auszuführen — ein Kontingentlimit oder eine zu große Datei behebt sich bei einer Wiederholung nicht von selbst.
Wann die CLI das bessere Werkzeug ist
Hier ist der ehrliche Gegenpunkt zu allem Bisherigen: Für eine headless laufende, deterministische Aufgabe in der CI willst du normalerweise gar keinen LLM-Agenten.
Ein KI-Agent glänzt, wenn die Aufgabe Urteilsvermögen erfordert — zu entscheiden, wie man etwas betiteln soll, auf mehrdeutige Eingaben zu reagieren oder Schritte zu verketten, die du nicht vollständig ausbuchstabiert hast. Aber „Nimm genau diese Datei, erstelle ein Flipbook, veröffentliche es, gib den Link aus“ hat keinerlei Mehrdeutigkeit. Dafür ein LLM laufen zu lassen, bringt Kosten, Latenz und Nichtdeterminismus ohne jeden Nutzen, und du musst trotzdem dieselbe Result-Verzweigung handhaben.
Greif dafür zur FlipLink-CLI. Sie wird aus derselben Spezifikation generiert wie der MCP-Server und die API, kann also nicht abdriften, und sie gibt saubere Exit-Codes zurück (0 Erfolg, 1 Anfragefehler, 2 Anwendungsfehler), auf die die CI verzweigen kann, ganz ohne Parsing:
fliplink config set-key "$FLIPLINK_API_KEY"
ID=$(fliplink flipbook create ./reports/2026-06-report.pdf \
--title "June 2026 Report" --name june-2026-report --json | jq -r '.ID')
fliplink flipbook publish "$ID"
fliplink flipbook share-link "$ID"
Das ist die ganze monatliche Aufgabe, kein Modell erforderlich. Für eine vollständige Pipeline — einschließlich der Ausführung innerhalb der Continuous Integration — siehe Flipbook-Veröffentlichung in CI/CD automatisieren.
Faustregel: Nutze einen KI-Agenten, wenn die Aufgabe Urteilsvermögen braucht; nutze die CLI, wenn sie jedes Mal gleich sein muss. Viele Teams setzen beides ein — den Agenten für spontane „Veröffentliche das mal für mich“-Anfragen, die CLI für die geplanten, mechanischen Läufe.
Jetzt loslegen
Ein KI-Agent für Dokumente nimmt die manuelle Mitte aus dem Veröffentlichen heraus: Du nennst das Ergebnis, er ruft die Tools auf. Mit FlipLink MCP im safe-Modus läuft ein Erstell-und-Veröffentlich-Agent reibungslos von Anfang bis Ende — und wo destruktive Aktionen ins Spiel kommen, hält der Confirm-Token-Schutz unbeaufsichtigte Läufe ehrlich statt gefährlich.
Bereit? Verbinde den MCP-Server, richte einen Agenten auf einen Bericht und sieh ihm beim Veröffentlichen zu. Für den deterministischen CI-Weg haben dich die CLI-Docs abgedeckt. Der vollständige Endpunkt-Katalog findet sich in der API-Referenz.
Weiterführende Lektüre
Bereit, dein erstes Flipbook zu erstellen?
Verwandle deine PDFs in interaktive Flipbooks und Dokumente. Starte mit dem Lifetime Deal von FlipLink – lebenslanger Zugang ab nur 39 $.
Einmal zahlen, für immer nutzen
10, 50 oder 100 Flipbooks · Alle 35 Funktionen · Unbegrenzte Domains
Keine Stufen. Keine Funktionsbeschränkungen. Jeder LTD-Code schaltet alles frei.
- Jede Funktion freigeschaltet — keine Schranken
- Stapelbar — kaufe jederzeit weitere Codes
- Austauschbar — tausche alte gegen neue
- Unbegrenzte eigene Domains (CNAME)
- Keine wiederkehrenden Gebühren, niemals
Weiterführende Artikel
FlipLink mit dem MCP-Server an Claude anbinden
Richte den FlipLink-MCP-Server für Claude in wenigen Minuten ein, damit Claude Flipbooks für dich in einfacher Sprache erstellt, veröffentlicht und verwaltet.
FlipLink CLI vs. API vs. MCP: Welche Integration solltest du nutzen?
CLI vs. API vs. MCP für FlipLink: Vergleiche Aufwand, Zielgruppe und Einsatzzweck und sieh dasselbe Flipbook auf drei Wegen. Wähle die richtige Integration.
MCP-Sicherheit: Wie FlipLink destruktive Aktionen absichert
MCP-Server-Sicherheit verständlich erklärt: Wie FlipLink mit drei Modi und einem Confirm-Token verhindert, dass eine KI ohne deine Freigabe löscht oder verkauft.