· 4 Min Lesezeit · 868 Wörter

☕ Claude Cowork — drei Tage Selbsttest

Ausgabe 002 · aban news

Tool-Test LLM-News Tools Prompts

Status: Tag 2 Launch-Woche. Format: Tool-Tiefen-Test mit eigener Erfahrung. Topic-Mix-Slot 2 von 5. Quellen-Stand: RSS-Sweep 26./27.05.2026 + eigene Tool-Tests Mai 2026.


Einstieg

Dienstag, der erste echte Arbeitstag der Woche. Ich hab das Wochenende genutzt, um Claude Cowork ernsthaft auszuprobieren — drei Tage, echte Tasks, kein Demo-Theater. Heute kriegst du das ehrliche Fazit: wo’s was bringt, wo’s nervt, und wofür du’s nicht brauchst.

📰 Was heute zählt

Claude Cowork: aus dem Chat wird ein Kollege (3 Min)

t3n hat heute eine Übersicht zu Claude Cowork — der Funktion, mit der Claude eigenständig Dokumente bearbeitet, PDFs analysiert und Präsentationen baut. Nicht mehr nur „antworten auf deine Frage”, sondern „erledigt die Aufgabe in eigener Sandbox”.

Für dich heißt das: Wenn du regelmäßig Reports, Slide-Decks oder Excel-Analysen baust, ist das näher an einem Junior-Mitarbeiter als an einem Chatbot. Drei Tage Selbsttest weiter unten — kurz gesagt: brauchbar für 40 % meiner üblichen Tasks, frustrierend bei 20 %, kein Mehrwert bei den restlichen 40 %.

Quelle: Vom Chat zum Kollegen: Wie du mit Claude Cowork den Sprung schaffst (t3n)

KI-Abos im Direktvergleich: was Codex, Cowork und Spark kosten (2 Min)

t3n liefert eine aktuelle Übersicht: ChatGPT Plus 23 € / Monat, Claude Pro 20 €, Gemini Advanced 22 €. Die Premium-Tiers (Pro+ / Max / Ultra) liegen alle zwischen 200 und 250 € — und sind der Gateway zu Agenten-Funktionen wie Codex (OpenAI), Cowork (Anthropic) und Spark (Google).

Für dich heißt das: Wenn du noch auf Standard-Tier bist und mit Agenten experimentieren willst, sind das mindestens 200 € / Monat zusätzlich. Meine Einschätzung: einen Monat Premium bei einem Anbieter testen, dann entscheiden — nicht parallel auf drei.

Quelle: KI-Abos bei ChatGPT, Claude und Gemini im Überblick (t3n)

Wenn KI den Laden leitet — Skurriles aus San Francisco (2 Min)

Ein San-Francisco-Startup hat KI-Agenten einen kompletten Laden autonom führen lassen. Resultate: gemischt bis bizarr. Die Agenten bestellten überflüssige Vorräte, gaben Rabatte ohne Sinn, eskalierten Konflikte zwischen Kunden. Lesenswert als Reality-Check, was Agenten heute können — und vor allem, was nicht.

Für dich heißt das: Voll-autonome Agenten für Business-Prozesse sind 2026 nicht ready. Aber: gezielte Teil-Aufgaben (Recherche, Drafting, Klassifizierung) funktionieren. Die Frage ist immer „welche Entscheidung erlaubst du dem Agenten” — nicht „kann er das prinzipiell”.

Quelle: Wenn die KI zum Chef wird: Startup lässt Agenten Laden leiten (t3n)

Claude im Höhlenmensch-Modus — der virale Spar-Trick (1 Min)

Ein Entwickler hat auf Reddit gepostet, wie er Claude in einem absichtlich primitiven Sprachmodus benutzt — kürzere Sätze, weniger Tokens, gleicher Output-Wert für bestimmte Tasks. Ging viral, weil es die These „mehr Kontext = besser” angreift.

Für dich heißt das: Bei Klassifizierungs- oder Routine-Tasks lohnt sich der Test, ob ein „minimal prompt” denselben Job erledigt wie dein aktueller Drei-Paragraphen-System-Prompt. Kann 30-50 % Token sparen.

Quelle: Claude im Höhlenmensch-Modus: viral auf Reddit (t3n)

🛠 Tool des Tages

Claude Cowork (Anthropic) — Pricing: enthalten in Claude Max (ab ca. 100 € / Monat) und Claude Pro+ (höhere Tier).

Was es macht: Claude bekommt eine eigene Arbeits-Sandbox. Du sagst „bau mir aus diesem PDF eine 10-Slide-Präsentation”, er baut die Slides in einem File-System, das du danach siehst. Keine Antwort im Chat — eine Datei im Workspace.

Use Case nach drei Tagen Selbsttest: PDF-Auswertungen mit Tabellen-Extraktion (top), erste Drafts von Slide-Decks aus Briefings (gut, brauchen Politur), Excel-Pivots aus Roh-Daten (überraschend solide für strukturierte Inputs). Frustrierend wird’s bei Tasks, die viele Iterationen brauchen — der Agent macht, du siehst das Ergebnis, dann musst du wieder ran.

Wer’s nicht braucht: Wenn deine Hauptnutzung „schnelle Antworten im Chat” ist, zahl nicht die Premium-Stufe. Standard-Pro reicht.

💡 Heute ausprobieren

Wenn du Cowork (oder ChatGPT Codex / Gemini Spark) gerade evaluierst, ist hier ein Test, der dir in 15 Minuten zeigt, ob’s für dich Sinn ergibt. Anstatt eine Demo zu fahren — gib dem Agenten eine echte Task aus deinem letzten Arbeitstag:

Du bekommst eine echte Aufgabe aus meinem Arbeitsalltag,
nicht eine Demo. Hier der Kontext:

- Was ich gerade habe: [Datei / PDF / Liste]
- Was ich brauche: [konkretes Output-Format]
- Wofür ich es nutze: [Kunde / Reporting / interne Doku]
- Wie lange ich es manuell brauche: [X Minuten]

Mach die Aufgabe. Wenn du zwischendurch Annahmen
triffst, notier die in einem separaten Block am Anfang.
Wenn dir Input fehlt, frag NICHT zurück — markier die
Lücke und arbeite mit Platzhalter weiter.

Am Ende: Self-Review. Drei Sätze. Was ist gut, was
ist schwach, was würdest du beim zweiten Versuch
anders machen?

Erwarteter Output: Erledigte Task + Annahme-Liste + ehrliches Self-Review. Anders als „schreib mir dazu was” — weil’s nach echtem Vergleich „Agent vs. Aban” fragt, mit Zeitschätzung als Baseline.

Outro

Falls du Cowork oder Codex schon ein paar Wochen nutzt — schick mir kurz, wofür’s bei dir wirklich funktioniert. Sammle gerade Use Cases für eine Vergleichs-Ausgabe.

—Aban