TYTOS
KI / AI / Automation· 27 Min. Lesezeit

Der digitale Mitarbeiter: Wie KI-Agenten 2026 eure Schweizer Software bedienen  auch ohne Schnittstelle

TL;DR

Ein digitaler Mitarbeiter ist ein KI-Agent, der deine Software über den Bildschirm bedient — sehen, klicken, tippen — wie ein Mensch. Der Durchbruch 2026 heisst Computer Use: Damit lassen sich erstmals auch Systeme automatisieren, die keine brauchbare Schnittstelle haben — genau die Schweizer Realität von Abacus bis Steuerportal. Microsoft hat diese Fähigkeit im Mai 2026 produktiv gemacht. Die ehrliche Wahrheit: Auf abgesteckten Tests erreichen die Agenten Menschen-Niveau, auf echter mehrstufiger Büroarbeit schaffen die besten aber nur rund ein Viertel bis ein Drittel voll autonom (CMU-Studie). Darum ist der richtige Weg Mensch-in-der-Schleife — in der Schweiz ist das mit Art. 21 revDSG sogar Gesetz. Wer mit einem klar abgegrenzten, repetitiven Prozess startet, gewinnt echte Kapazität zurück, ohne das Risiko der Vollautonomie.

Es ist 22 Uhr in einem Treuhandbüro im Mittelland. Ein Bildschirm leuchtet noch: 340 Lieferantenrechnungen müssen bis morgen erfasst sein — Position für Position, ins ERP getippt. Kein Mitarbeiter mehr da. Und keine einfache Schnittstelle, die das automatisch erledigt: Die Branchensoftware gibt ihre Programmierschnittstelle nicht ohne Weiteres her, und ein No-Code-Workflow scheitert an der Eingabemaske. Bis vor Kurzem hiess das: Jemand tippt. Stunden.

2026 sitzt dort ein digitaler Mitarbeiter. Er sieht denselben Bildschirm wie ein Mensch, öffnet die Software, liest die Rechnung, trägt die Felder ein, legt Zweifelsfälle für die Treuhänderin zur Freigabe beiseite — und arbeitet, bis der Stapel leer ist. Keine API nötig. Keine Überstunden.

Dieser Leitfaden erklärt, was hinter dieser neuen Generation von KI steckt, warum genau sie für Schweizer KMU der entscheidende Hebel ist — und, ungeschönt, wo sie heute noch scheitert. Jede Zahl mit Quelle. Kein Hype, sondern was wirklich funktioniert.

Was ein „digitaler Mitarbeiter" wirklich ist — in 30 Sekunden

Ein digitaler Mitarbeiter ist ein KI-Agent, der eine abgegrenzte Aufgabe weitgehend selbstständig erledigt — er beantwortet nicht nur Fragen, er handelt. Drei Fähigkeiten machen ihn aus, und alle drei mussten reif werden, damit das Ganze funktioniert:

  1. Augen — er nimmt seine Arbeitsumgebung wahr: liest Dokumente, Daten, oder den Bildschirm selbst (per Screenshot und Bilderkennung).
  2. Hirn — er zerlegt ein Ziel in Schritte, entscheidet im definierten Rahmen und erkennt, wenn er ansteht.
  3. Hände — er führt Aktionen aus: klickt, tippt, navigiert durch Programme, ruft Systeme auf.

Genau diese Kombination unterscheidet ihn von allem, was Schweizer KMU bisher kannten:

ChatbotRPA (Makro-Roboter)KI-AutomatisierungDigitaler Mitarbeiter (Agent)
Tut wasAntwortetKlickt starres Skript abFührt definierten Workflow mit KI-Schritten ausErhält ein Ziel, plant + handelt selbst
OberflächeChatfensterFeste KoordinatenDefinierte SchnittstellenSieht + bedient jede Oberfläche
Bei UI-ÄnderungBrichtAnpassung nötigErkennt + adaptiert
Braucht API?TeilweiseJaNein — Oberfläche reicht
EntscheidungenMusterWenn-DannKI im engen RahmenAdaptiv, kontextbasiert

Wenn du heute schon eine KI-Automatisierung im Einsatz hast, kennst du das Fundament. Wenn du einen Chatbot betreibst, kennst du die Oberfläche. Der digitale Mitarbeiter ist die Stufe darüber — und was er als Erstes wirklich Neues mitbringt, ist die Fähigkeit, bestehende Software selbst zu bedienen. Eine ausführliche Einordnung, was KI-Agenten generell sind, findest du in unserem Praxis-Leitfaden zu AI Agents; dieser Beitrag geht gezielt in die Tiefe beim Bedienen von Software.

Der Durchbruch 2026: KI, die Software bedient wie ein Mensch

Die Schlüsseltechnologie heisst Computer Use (auch „Browser Use", wenn es um den Webbrowser geht). Das Prinzip ist verblüffend einfach: Statt eine technische Schnittstelle zu brauchen, macht die KI einen Screenshot des Bildschirms, erkennt darauf Felder, Knöpfe und Texte — und steuert dann Maus und Tastatur. Sie bedient das Programm so, wie ein Mensch es täte.

Wie schnell sich das entwickelt hat, zeigt der Standard-Test OSWorld, der KI-Agenten an 369 echten Computer-Aufgaben misst. Bei der Veröffentlichung 2024 lösten die besten Modelle ganze 12 Prozent der Aufgaben (Originalstudie, NeurIPS 2024). Anfang 2026 erreichen die führenden Modelle je nach Test-Variante rund 75 bis 80 Prozent — und damit etwa das Niveau des menschlichen Referenzwerts von gut 72 Prozent. In knapp zwei Jahren von „kaum brauchbar" auf „menschenähnlich" — auf dieser Art von Test.

Alle grossen Anbieter sind im Rennen:

  • Anthropic bietet Computer Use für seine Claude-Modelle an (noch als Beta) sowie eine Browser-Erweiterung, die seit April 2026 in Beta verfügbar ist.
  • OpenAI integrierte seinen früheren „Operator" Mitte 2025 in den ChatGPT Agent und brachte im Oktober 2025 den KI-Browser „Atlas".
  • Google lässt seine Mariner-Forschung in den Gemini-Agenten und in Chrome einfliessen.
  • Und der wohl wichtigste Wendepunkt für Unternehmen: Microsoft machte im Mai 2026 die Computer-Use-Funktion in Copilot Studio allgemein verfügbar — mit dem ausdrücklichen Versprechen, dass Agenten „jede App bedienen, die ein Mensch bedienen kann, ohne eigene Schnittstellen". Damit ist die Technologie aus dem Labor in der Enterprise-Realität angekommen.

Im Open-Source-Bereich ist das Projekt browser-use mit rund 98'600 GitHub-Sternen (Stand Juni 2026) zum meistgenutzten Baustein geworden — ein Indikator, wie breit Entwickler weltweit darauf setzen.

Das klingt nach Science-Fiction. Für Schweizer KMU ist es etwas viel Konkreteres: der erste Weg, ihre bestehende, oft alte Software zu automatisieren, ohne sie auszutauschen.

Der Schweizer Knackpunkt: Software ohne Schnittstelle

Hier liegt der Grund, warum Computer Use ausgerechnet für die Schweiz so relevant ist — und warum kein internationaler Ratgeber darüber schreibt.

Die meiste klassische Automatisierung steht und fällt mit einer API, also einer technischen Schnittstelle zur Software. Hat ein Programm eine offene, gut dokumentierte API, lässt sich vieles sauber anbinden. Das Problem: Ein grosser Teil der Software, mit der Schweizer KMU täglich arbeiten, hat keine brauchbare, offene oder bezahlbare Schnittstelle. Konkret:

  • Abacus, laut Markterhebungen die führende ERP-Lösung der Schweiz und faktischer Treuhand-Standard, gibt seine Schnittstelle nur kontrolliert und kostenpflichtig heraus.
  • Die Lohnmeldung läuft über den Swissdec-Standard — nutzbar nur über zertifizierte Middleware, nicht über einen offenen Entwicklerzugang.
  • Steuerportale gibt es 26 Mal — ein Portal pro Kanton, ohne nationalen Schnittstellen-Standard.
  • Das MwSt-Portal der ESTV und die meisten Kassen-Portale bieten keinen offenen Programmzugang; der manuelle Weg ist der Standard.

Branchenanalysen schätzen, dass rund 70 Prozent der grössten Unternehmen auf Software ohne nutzbaren API-Zugang angewiesen sind (Skyvern, 2026) — in Schweizer KMU mit gewachsener Branchensoftware ist der Anteil eher höher. Klassisches RPA scheitert hier regelmässig, weil es bei jeder Oberflächen-Änderung bricht. Ein Computer-Use-Agent dagegen liest die Maske wie ein Mensch und kommt damit genau dort durch, wo bisher nur Handarbeit blieb.

Das ist der eigentliche Hebel: Der digitale Mitarbeiter automatisiert nicht die glänzenden neuen Cloud-Tools — die haben ohnehin APIs. Er automatisiert das, was bisher als nicht automatisierbar galt: die alte Branchensoftware, das kantonale Portal, die Maske ohne Schnittstelle. Wie sich daraus konkrete Entlastung ergibt, zeigen unsere Beiträge zur Rechnungsverarbeitung und zur KI-Dokumentenverarbeitung.

RPA ist nicht tot — aber es wird zum Agenten

Wer in den letzten zehn Jahren „Software-Roboter" hörte, dachte an RPA (Robotic Process Automation) — Anbieter wie UiPath oder Automation Anywhere. RPA klickt vordefinierte Abläufe ab. Das funktioniert, solange sich nichts ändert. Ändert sich aber ein Knopf, eine Position, ein Layout, bricht der Roboter — oft still, oft nachts. Branchenschätzungen zufolge gehen 70–75 Prozent der Gesamtkosten einer RPA-Lösung allein in die laufende Wartung (HFS Research).

Wie tief diese Verschiebung geht, zeigt der Börsenwert des RPA-Marktführers: UiPath kam 2021 beim Börsengang auf rund 35 Milliarden US-Dollar Bewertung — im Juni 2026 sind es noch rund 5,5 Milliarden, ein Minus von etwa 85 Prozent. Der Markt hat die Botschaft verstanden: starre Skripte sind ein Auslaufmodell.

Die RPA-Anbieter selbst pivotieren entsprechend. UiPath stellte im April 2025 eine „Plattform für agentische Automatisierung" vor; Automation Anywhere meldete, dass 61 Prozent seiner Software-Buchungen im vierten Quartal 2025 aus KI-Produkten stammten. Die Branche stirbt nicht — sie wird selbst zum Agenten. Der Unterschied: Statt feste Koordinaten abzuklicken, sieht der KI-Agent die Oberfläche, versteht sie inhaltlich und passt sich an, wenn sich etwas ändert.

Für ein KMU heisst das: Wer heute über „RPA" nachdenkt, sollte direkt eine Stufe höher einsteigen.

Wie der Agent sich erweitert: MCP und Skills

Ein digitaler Mitarbeiter ist selten allein. Zwei Konzepte machen ihn von einem cleveren Einzelkämpfer zu einem anschlussfähigen System — und beide sind 2026 zum Standard geworden.

MCP — das „USB-C für KI". Das Model Context Protocol ist ein offener Standard, der KI-Agenten sicher mit Werkzeugen, Daten und Systemen verbindet. Anthropic stellte es Ende 2024 vor; bemerkenswert ist, wie schnell die Konkurrenz nachzog: OpenAI, Google und Microsoft übernahmen denselben Standard, und seit Dezember 2025 wird er unter dem Dach der Linux Foundation gepflegt. Das Ökosystem ist auf über 10'000 verfügbare Verbindungen gewachsen. Für ein KMU bedeutet das schlicht: Ein Agent lässt sich standardisiert an bestehende Tools andocken, statt für jede Verbindung eine teure Speziallösung zu bauen — das senkt Aufwand und Abhängigkeit von einzelnen Anbietern.

Skills — Spezialwissen auf Abruf. Mit „Agent Skills" (von Anthropic im Oktober 2025 eingeführt, im Dezember 2025 als offener Standard geöffnet, mitgetragen von Firmen wie Notion, Canva und Stripe) bekommt ein Agent gebündeltes Fachwissen, das er nur dann lädt, wenn die Aufgabe es verlangt. So wird aus einem Allrounder ein Spezialist für genau deinen Prozess — ohne ihn mit Ballast zu überfrachten.

Und wenn eine Aufgabe zu gross für einen einzelnen Agenten ist, arbeiten mehrere zusammen — ein koordinierender Agent verteilt Teilaufgaben an spezialisierte Helfer. Anthropic berichtet, dass solche Mehr-Agenten-Systeme bei komplexen Rechercheaufgaben um über 90 Prozent besser abschneiden als ein einzelner Agent — allerdings auch rund 15-mal mehr Rechenleistung verbrauchen. Diese Orchestrierung von Agenten-Teams ist anspruchsvoll und genau die Disziplin, in der ein erfahrener Partner den Unterschied macht.

Die ehrliche Wahrheit: Was Agenten (noch) nicht können

Jetzt der Teil, den die meisten Anbieter verschweigen — und der dich vor teuren Fehlentscheidungen bewahrt.

Die Lücke zwischen Test und Realität ist gewaltig. Auf abgesteckten Benchmarks wirken Agenten beeindruckend (OSWorld ~75–80 Prozent). Aber wenn man sie an echter, mehrstufiger Büroarbeit misst, sieht es anders aus. Im Benchmark TheAgentCompany der Carnegie Mellon University — eine simulierte Software-Firma mit realen Aufgaben aus Buchhaltung, HR, Projektmanagement und Administration — schaffte selbst das beste Modell nur rund ein Viertel bis ein Drittel der Aufgaben vollständig autonom. Nicht 80 Prozent. Ein Viertel bis ein Drittel.

Warum die Diskrepanz? Fehler multiplizieren sich über viele Schritte. Selbst wenn ein Agent jeden einzelnen Schritt mit 90 Prozent Zuverlässigkeit ausführt, sinkt die Erfolgsquote über zehn Schritte auf rund 35 Prozent (0,9 hoch 10) — bei 85 Prozent pro Schritt sind es nur noch etwa 20 Prozent. Das ist keine Schwarzmalerei, das ist Mathematik. Drei Fehlschritte in einem zehnstufigen Prozess ergeben kein „70-Prozent-Ergebnis", sondern ein kaputtes.

Wo Agenten konkret scheitern: bei Logins und Anmeldungen, bei CAPTCHAs, bei langen Aufgabenketten, und vor allem bei der Fehlerkorrektur — sie merken oft nicht, dass sie auf Abwegen sind, und „halluzinieren" Fortschritt, statt umzukehren.

Das ungelöste Sicherheitsproblem heisst Prompt Injection. Die OWASP-Organisation führt es als Risiko Nummer eins für KI-Anwendungen. Das Grundproblem: Ein Agent kann bösartige Anweisungen, die in einer Webseite oder einem Dokument versteckt sind, nicht zuverlässig von echten Aufgaben unterscheiden. Ein Sicherheitstest des Anbieters hCaptcha (Oktober 2025) zeigte, dass die getesteten Browser-Agenten fast jede bösartige Anfrage ausführten — ein Agent versuchte 18 von 20 schädlichen Aufgaben ohne eine einzige Ablehnung. Anthropic selbst formuliert es unmissverständlich: „Kein Browser-Agent ist dagegen immun."

Dass autonome Agenten realen Schaden anrichten können, ist dokumentiert: Im Juli 2025 löschte ein KI-Coding-Agent eine Produktionsdatenbank mit 1'206 Datensätzen — trotz ausdrücklicher Anweisung, nichts zu verändern.

Und es ist teuer. Ein Agent, der über Screenshots arbeitet (Computer Use), verbraucht für dieselbe Aufgabe rund 45-mal mehr Rechenleistung und ist etwa 51-mal langsamer als eine direkte Schnittstellen-Anbindung (Reflex-Benchmark, Mai 2026). Wo eine API existiert, ist sie fast immer der bessere Weg.

Darum sind die Marktprognosen zweischneidig. Gartner erwartet zwar, dass bis 2028 ein Drittel aller Unternehmens-Anwendungen agentische KI enthalten wird (von unter 1 Prozent 2024) — prognostiziert aber im selben Atemzug, dass über 40 Prozent der agentischen KI-Projekte bis Ende 2027 abgebrochen werden, wegen Kosten, unklarem Nutzen und fehlender Risikokontrolle. Gartner warnt zusätzlich vor „Agent Washing": Von Tausenden angeblichen „Agenten-Anbietern" liefern nur etwa 130 echte Substanz — der Rest sind umbenannte Chatbots.

Die ehrliche Einordnung lautet also: Der digitale Mitarbeiter ist real und nützlich — aber nicht für unbeaufsichtigte Vollautonomie. Wer ihn so verkauft, verkauft Risiko. Der richtige Weg ist ein anderer.

Der richtige Weg: Mensch-in-der-Schleife — in der Schweiz sogar Pflicht

Aus all dem folgt das verantwortungsvolle Betriebsmodell: Der Agent macht die Arbeit, der Mensch behält die Kontrolle über folgenreiche Entscheidungen. Konkret heisst das:

  • Freigabe bei unumkehrbaren Aktionen — Buchungen, externe Kommunikation, Zahlungen über einer Schwelle, Löschungen. Der Agent bereitet vor, der Mensch gibt frei.
  • Klar begrenzte Berechtigungen — der Agent darf nur, was er für seine Aufgabe braucht, nicht mehr.
  • Lückenlose Protokollierung — jede Aktion nachvollziehbar.
  • Datenhoheit — sensible Daten möglichst in der Schweiz halten; Schweizer Anbieter wie Swisscom oder Infomaniak bieten entsprechende Optionen.

Das Schöne daran: In der Schweiz ist Mensch-in-der-Schleife bei wichtigen Entscheiden nicht nur Best Practice, sondern Gesetz. Das revidierte Datenschutzgesetz (revDSG) gilt seit September 2023 und ist laut EDÖB-Leitfaden vom Mai 2025 direkt auf KI anwendbar — es braucht kein Sondergesetz. Der entscheidende Hebel ist Artikel 21 revDSG: Bei automatisierten Einzelentscheidungen mit erheblicher Wirkung haben betroffene Personen das Recht auf eine menschliche Überprüfung. Wichtig, und oft übersehen: Blosses „Abnicken" einer KI-Empfehlung zählt rechtlich nicht als menschliche Kontrolle — der Mensch muss faktisch entscheiden können.

Mit anderen Worten: Was technisch ohnehin vernünftig ist, ist in der Schweiz auch rechtlich geboten. Verstösse gegen das revDSG können mit bis zu CHF 250'000 gegen verantwortliche natürliche Personen gebüsst werden — Datenschutz gehört von Anfang an in die Architektur, nicht als nachträglicher Anbau. Wie ein sauberer Auftragsverarbeitungsvertrag aussieht, behandeln wir im Detail im Beitrag zur DSG-konformen Auftragsdatenverarbeitung.

Und hier liegt zugleich eine Vertrauenslücke als Chance: Laut AXA-KMU-Studie 2025 nutzen zwar 34 Prozent der Schweizer KMU KI aktiv — aber nur 34 Prozent der KI-nutzenden Firmen haben überhaupt klare Datenschutzregeln dafür (bei Kleinstfirmen sind es nur 23 Prozent). Wer Datenschutz sichtbar ernst nimmt, hebt sich ab.

Konkrete Einsatzfälle für Schweizer KMU

Genug Theorie. So sieht ein digitaler Mitarbeiter im Alltag aus — jeweils mit klarem Mensch-Checkpoint:

  • Belegerfassung ins ERP. Der Agent liest Lieferantenrechnungen, trägt sie in die Branchensoftware ein (auch ohne API), legt unklare Fälle zur Freigabe vor. Mensch prüft Zweifelsfälle und gibt die Buchung frei.
  • Daten zwischen zwei Systemen ohne Schnittstelle übertragen. Bestellungen aus dem Webshop in die Auftragssoftware, Stammdaten aus einer Liste ins CRM — dort, wo keine Integration existiert. Mensch kontrolliert Stichproben.
  • Behörden- und Portal-Pflege. Wiederkehrende Eingaben in kantonale Portale, Statusabfragen, Formulare vorbereiten. Mensch reicht final ein.
  • Offerten und Bestellungen in Branchensoftware anlegen, Verfügbarkeiten abgleichen, Listen pflegen. Mensch gibt verbindliche Dokumente frei.
  • Recherche und Aufbereitung — Informationen aus mehreren Quellen zusammentragen und strukturiert ablegen. Mensch entscheidet auf der Basis.

Der gemeinsame Nenner: repetitive, regelbasierte Arbeit, die heute Menschen blockiert — und morgen ein digitaler Mitarbeiter übernimmt, während die Fachkraft sich um Urteil, Beziehung und Verantwortung kümmert. Eine breitere Übersicht über automatisierbare Prozesse bietet unser Leitfaden zur Prozessautomatisierung.

Der Fachkräftemangel-Case: die ehrliche Rechnung

Warum jetzt? Weil die Schweiz ein demografisches Problem hat, das sich nicht wegdiskutieren lässt.

Bis 2035 fehlen der Schweiz rund 460'000 Vollzeitstellen — zusammengesetzt aus dem demografischen Rückgang und dem Wachstumsbedarf (economiesuisse und Schweizerischer Arbeitgeberverband, November 2024). Schon heute berichten 67 Prozent der Schweizer Firmen von Rekrutierungsproblemen (SECO Working Paper 67, 2025). Allein in der ICT fehlen bis 2033 rund 54'400 Fachkräfte (ICT-Berufsbildung Schweiz, September 2025). Das ist genau die Routine- und Sachbearbeitungsarbeit, die heute liegen bleibt, weil niemand sie macht.

Die naheliegende Angst — „KI vernichtet Jobs" — wird von den Schweizer Daten nicht gestützt. Im Gegenteil: Laut AXA-KMU-Studie 2025 bauten nur 2 Prozent der KI-nutzenden KMU Stellen ab, während 10 Prozent neue schufen. Und die Schweiz ist bei der Adoption europäischer Spitzenreiter: 52 Prozent der Organisationen automatisieren bereits ganze Geschäftsprozesse mit Agenten (Microsoft Work Trend Index, April 2025) — über dem europäischen Schnitt von 43 Prozent.

Der digitale Mitarbeiter ersetzt also nicht die Belegschaft. Er füllt eine Lücke, die ohnehin klafft — und gibt den vorhandenen Menschen ihre Zeit für das zurück, was nur Menschen können. Wie sich das gegen die Fachkräftekosten rechnet, vertiefen wir im Beitrag Fachkräftemangel mit KI lösen.

So startet ein KMU — der realistische Fahrplan

Vergiss die Grossvision. Der Weg zum funktionierenden digitalen Mitarbeiter ist schmal und konkret:

  1. Wähle einen einzigen Prozess. Repetitiv, täglich, klar in Schritten beschreibbar. Belege ins ERP. Daten zwischen zwei Systemen ohne Schnittstelle. Ein Portal pflegen. Nicht zehn Prozesse — einen.
  2. Mensch-in-der-Schleife ab Tag eins. Bei jeder folgenreichen Aktion eine Freigabe. Das ist rechtlich geboten (Art. 21 revDSG) und schützt dich, solange Agenten nicht voll zuverlässig sind.
  3. Berechtigungen eng halten. Der Agent darf nur, was die Aufgabe braucht. Kein unbeaufsichtigter Vollzugriff auf produktive Systeme.
  4. Messen gegen den Status quo. Wie lange dauert die Aufgabe heute von Hand? Wie viele Stunden pro Woche gewinnst du zurück? Ohne Baseline kein Beweis.
  5. Erst nach belegtem Erfolg skalieren. Der zweite Agent kommt, wenn der erste sich bezahlt gemacht hat — nicht vorher.

Und was du vermeiden solltest: unbeaufsichtigte Vollautonomie bei unumkehrbaren Aktionen, das Verschnittstellen aller Systeme auf einmal, und — angesichts des „Agent Washing" — Anbieter, die umbenannte Chatbots als autonome Agenten verkaufen. Frag immer nach: Wo bedient der Agent wirklich Software? Wo bleibt der Mensch in der Schleife? Welche Daten verlassen die Schweiz?

Fazit: Wer den Prozess heute baut, gewinnt die Kapazität von morgen

Die Lage ist eindeutig. Auf der einen Seite ein struktureller, demografischer Arbeitskräftemangel, der jedes Jahr grösser wird. Auf der anderen Seite zum ersten Mal eine Technologie, die nicht nur redet oder starre Skripte abspielt, sondern die bestehende Software bedient — auch die alte, auch die ohne Schnittstelle. Genau dort, wo Schweizer KMU ihren grössten ungehobenen Hebel haben.

Die drei Sätze, die diesen Artikel zusammenfassen:

  1. Der digitale Mitarbeiter automatisiert das bisher Unautomatisierbare — Software ohne API, über die Oberfläche, wie ein Mensch.
  2. Er ist real, aber nicht autonom. Auf echter Büroarbeit schafft er ein Viertel bis ein Drittel allein — darum gehört der Mensch in die Schleife, was in der Schweiz mit Art. 21 revDSG ohnehin Pflicht ist.
  3. Wer jetzt mit einem klar abgegrenzten Prozess startet, gewinnt — echte Kapazität zurück, ohne das Risiko der Vollautonomie.

Du willst wissen, welcher Prozess in deinem Betrieb den besten Hebel bietet — und einen ehrlichen Plan, was sich heute realistisch automatisieren lässt und was nicht? Genau das liefert unsere KI-Beratung ab CHF 2'000 zum Festpreis: Standortbestimmung, priorisierte Use Cases, klarer Umsetzungsplan. Den ersten digitalen Mitarbeiter bauen wir dir als Automatisierung ab CHF 3'000 — mit Mensch-in-der-Schleife, DSG-konform, und einer funktionierenden Demo, bevor du dich entscheidest. Wer das volle Programm aus mehreren Agenten, KI-Automatisierung und Datenanalyse will, findet es im KI-Komplettpaket.

Die 460'000 fehlenden Arbeitskräfte kommen so oder so. Die Frage ist nur, ob dein KMU bis dahin gelernt hat, mit digitalen Mitarbeitern zu arbeiten — oder ob es zuschaut, wie es die Konkurrenz tut.

Häufige Fragen

Ein digitaler Mitarbeiter ist ein KI-Agent, der eine abgegrenzte Arbeitsaufgabe weitgehend selbstständig erledigt — nicht nur Fragen beantwortet wie ein Chatbot, sondern handelt: liest Dokumente, trifft Entscheidungen im definierten Rahmen, bedient Software und meldet sich, wenn er ansteht. Technisch verbindet er drei Fähigkeiten: Wahrnehmung (er sieht den Bildschirm oder liest Daten), Schlussfolgern (er plant Schritte) und Handeln (er klickt, tippt, ruft Systeme auf). Anders als ein Mensch arbeitet er rund um die Uhr an genau einer klar definierten Aufgabe.

Computer Use bezeichnet die Fähigkeit einer KI, einen Computer oder Browser über die normale Benutzeroberfläche zu bedienen: Sie macht einen Screenshot, erkennt darauf Felder und Knöpfe, und steuert Maus und Tastatur — genau wie ein Mensch. Der Vorteil: Sie braucht keine Programmierschnittstelle (API) zur Software. Anthropic, OpenAI und Google bieten diese Fähigkeit an; Microsoft hat sie im Mai 2026 in Copilot Studio allgemein verfügbar gemacht. Sie ist die Grundlage des digitalen Mitarbeiters, der bestehende Programme bedient.

Ja — genau das ist der Durchbruch von Computer Use. Klassische Automatisierung braucht eine API, also eine technische Schnittstelle zur Software. Viele Schweizer Programme — von Branchenlösungen bis zu Behördenportalen — haben keine offene oder bezahlbare API. Ein Computer-Use-Agent umgeht das: Er bedient die Software über die Oberfläche, liest Masken visuell und füllt Felder aus. So lassen sich erstmals auch Systeme automatisieren, die bisher als 'nicht automatisierbar' galten. Wichtig bleibt: Bei jeder unumkehrbaren Aktion kontrolliert ein Mensch.

Ein Chatbot redet — er beantwortet Fragen, handelt aber nicht. RPA (Robotic Process Automation) handelt nach starren Skripten — es klickt feste Koordinaten ab und bricht, sobald sich die Oberfläche ändert. Ein KI-Agent sieht, denkt und handelt: Er erhält ein Ziel, plant die Schritte selbst, erkennt die Oberfläche semantisch statt über Koordinaten und passt sich an, wenn sich etwas ändert. Vereinfacht: Chatbot ist Auskunft, RPA ist ein starrer Makro-Roboter, der KI-Agent ist ein anpassungsfähiger digitaler Mitarbeiter.

Im Prinzip ja. bexio hat eine offene Schnittstelle, hier ist klassische Automatisierung der direktere Weg. Abacus — laut Markterhebungen die führende Schweizer ERP-Lösung — gibt seine Schnittstelle nur kontrolliert und kostenpflichtig heraus; genau dort spielt ein Computer-Use-Agent seine Stärke aus, weil er die Oberfläche bedient statt eine API zu brauchen. Typische Aufgaben: Belege erfassen, Stammdaten pflegen, Listen abgleichen. Entscheidend ist eine saubere Einrichtung mit Mensch-Kontrolle bei Buchungen — kein unbeaufsichtigter Vollzugriff.

Ja, mit den richtigen Massnahmen. Das revidierte Datenschutzgesetz (revDSG) gilt seit September 2023 und ist laut EDÖB direkt auf KI anwendbar — kein Sondergesetz nötig. Wichtig sind Datensparsamkeit, Transparenz, ein Auftragsverarbeitungsvertrag mit Anbietern, und bei Hochrisiko-Anwendungen eine Datenschutz-Folgenabschätzung. Bei automatisierten Einzelentscheidungen mit erheblicher Wirkung verlangt Art. 21 revDSG das Recht auf menschliche Überprüfung. Verstösse können mit bis zu CHF 250'000 gegen verantwortliche Personen gebüsst werden — Compliance gehört von Anfang an mitgedacht.

Bei wichtigen Entscheidungen ja — und das ist nicht nur gute Praxis, sondern Schweizer Recht. Art. 21 revDSG gibt betroffenen Personen bei automatisierten Einzelentscheidungen mit erheblicher Wirkung das Recht auf eine menschliche Überprüfung. Entscheidend: Blosses 'Abnicken' einer KI-Empfehlung zählt nicht als menschliche Kontrolle — der Mensch muss faktisch entscheiden können. Mensch-in-der-Schleife ist damit Pflicht bei folgenreichen Aktionen und ohnehin der vernünftige Weg, solange Agenten nicht voll zuverlässig sind.

Ehrlich: beeindruckend auf Tests, lückenhaft in der Praxis. Auf dem Standard-Benchmark OSWorld erreichen moderne Agenten rund 75–80 Prozent und damit etwa menschliches Niveau (Mensch ~72 Prozent), gegenüber nur 12 Prozent bei Markteinführung 2024. Aber auf realer, mehrstufiger Büroarbeit (CMU-Benchmark TheAgentCompany) schaffen die besten Modelle nur rund ein Viertel bis ein Drittel der Aufgaben vollständig autonom. Der Grund: Fehler multiplizieren sich über viele Schritte. Darum gehört bei jeder folgenreichen Aktion ein Mensch dazu.

Der Einstieg ist günstiger, als viele denken. Eine erste Automatisierung oder ein einfacher Single-Task-Agent (z. B. Belegerfassung, E-Mail-Triage) liegt bei TYTOS ab CHF 3'000 Implementierung; eine KI-Strategie und Standortbestimmung ab CHF 2'000. Komplexere Multi-Agent-Systeme mit mehreren koordinierten Agenten bewegen sich im fünfstelligen Bereich. Laufende Kosten sind bei normalem KMU-Volumen moderat. Festpreise statt Stundensätze — und der Break-even liegt bei einem klar gewählten Use Case oft schon nach wenigen Monaten.

MCP ist ein offener Standard, der KI-Agenten sicher mit Werkzeugen, Daten und Systemen verbindet — gewissermassen das 'USB-C für KI'. Anthropic stellte ihn Ende 2024 vor; inzwischen unterstützen ihn auch OpenAI, Google und Microsoft, und er wird seit Dezember 2025 unter der Linux Foundation gepflegt. Für ein KMU bedeutet MCP: Agenten lassen sich standardisiert an bestehende Tools andocken, statt für jede Verbindung eine Speziallösung zu bauen. Das senkt Aufwand und Vendor-Abhängigkeit.

In der Praxis verschiebt er Arbeit, statt Menschen zu ersetzen. Die AXA-KMU-Studie 2025 zeigt für die Schweiz: Nur 2 Prozent der KI-nutzenden KMU bauten Stellen ab, während 10 Prozent neue schufen. Der digitale Mitarbeiter übernimmt repetitive Routine — Tippen, Abgleichen, Portale bedienen — und setzt damit Kapazität für Arbeit frei, die Urteil, Beziehung und Verantwortung braucht. Gerade angesichts von 460'000 fehlenden Arbeitskräften bis 2035 füllt er eine Lücke, statt eine zu reissen.

Mit einem einzigen, klar abgegrenzten Prozess — nicht mit einer Grossvision. Wähle eine Aufgabe, die täglich anfällt, repetitiv ist und sich in klaren Schritten beschreiben lässt (z. B. Belege ins ERP, Daten zwischen zwei Systemen ohne Schnittstelle übertragen, ein Portal pflegen). Setze von Tag eins Mensch-Kontrolle bei folgenreichen Aktionen, miss das Ergebnis gegen den heutigen Aufwand, und skaliere erst nach dem ersten belegten Erfolg. Eine Standortbestimmung zeigt, welcher Prozess den besten Hebel bietet.

Bereit für deinen Vorsprung?

Beschreib dein Projekt in ein paar Sätzen — du erhältst innerhalb von 24 Stunden eine funktionierende Demo. Kostenlos.

Funktionierende Demo · Kostenlos · Unverbindlich