Live Demo · Office Action Response Agent

Art. 56 EPÜ — Erfinderische Tätigkeit auf Anmeldung EP 22 710 445.3

Eine fiktive EPO-Mitteilung der Prüfungsabteilung zum Thema Federated Learning mit Differential Privacy. Der Agent hat zwei Art. 56-Ablehnungen geparst, Änderungsvorschläge mit Rotdruck erstellt und EPÜ-konforme Gegenargumente im Problem-Solution-Ansatz verfasst — vollständig autonom.

Demo run on 2026-06-19. Results cached. Live agent available to design partners.
Prior Art Search Demo OA Response — USPTO §103 OA Response — EPO Art. 56
Application
EP 22 710 445.3
Art Unit
T 3.5.05
Examiner
Müller, K. / Berger, A.
Mitteilungstyp
Mitteilung nach Regel 71(3) EPÜ — vorläufige Ablehnung (Art. 56 EPÜ)
OA Date
2024-04-08
Jurisdiction
EPO
Mitteilung der Prüfungsabteilung
MITTEILUNG DER PRÜFUNGSABTEILUNG Anmeldung: EP 22 710 445.3 Klassifikation: G06N 20/00, H04L 9/00 Prüfer: K. Müller, A. Berger (Technische Kammer 3.5.05) Datum: 8. April 2024 -- ABLEHNUNG -- Die Prüfungsabteilung ist der Auffassung, dass der Gegenstand der Ansprüche 1–5 keine erfinderische Tätigkeit im Sinne von Art. 56 EPÜ aufweist. ANSPRÜCHE 1, 3 UND 5 — Art. 56 EPÜ (D1 + D2) Nächstliegender Stand der Technik (D1): McMahan et al., "Communication-Efficient Learning of Deep Networks from Decentralized Data", ICML 2017 (Konferenzschrift, gilt als vorveröffentlicht gemäß Art. 54(2) EPÜ). D1 offenbart das grundlegende föderierte Lernprotokoll (FedAvg): ein zentraler Server verteilt ein globales Modell an Teilnehmerknoten; jeder Knoten trainiert das Modell lokal auf privaten Daten, ohne diese zu übermitteln; die lokalen Modellaktualisierungen (Gradienten bzw. Gewichtsdifferenzen) werden an den Server zurückgesendet und dort zu einem aktualisierten globalen Modell aggregiert (Abschnitt 3, Algorithmus 1). D1 offenbart ausdrücklich die gewichtete Mittelwertbildung proportional zur Datensatzgröße der Knoten (Algorithmus 1, Zeile 10: n_k/n). Zweiter Stand der Technik (D2): Abadi et al., "Deep Learning with Differential Privacy", ACM CCS 2016 (vorveröffentlicht gemäß Art. 54(2) EPÜ). D2 offenbart differentiell privates stochastisches Gradientenabstiegsverfahren (DP-SGD) mit Gradientenrauschen gemäß einem Gaußschen Mechanismus, einen festen Rauschmaßstab σ proportional zur L2-Sensitivität der Gradienten (Abschnitt 3.1–3.3), sowie die Berechnung und Verfolgung des verbrauchten (ε, δ)-Datenschutzbudgets (Abschnitt 3.4, Moment Accountant). Aufgabe-Lösungs-Ansatz: Ausgehend von D1 besteht die objektive technische Aufgabe darin, das föderierte Lernverfahren um Datenschutzgarantien zu erweitern. D2 löst diese Aufgabe explizit und liefert das technische Mittel dafür — differentiell privates Gradientenrauschen. Der Fachmann erkennt, dass D2 auf das in D1 beschriebene föderierte Lernverfahren anwendbar ist, denn: (a) D1 überträgt bereits Gradienten über ein Netzwerk, und (b) D2 wendet das Rauschen genau auf diese Gradienten an. Die Kombination der Lehren von D1 und D2 ist dem Fachmann nahegelegt, da beide Dokumente denselben technischen Bereich (verteiltes maschinelles Lernen) adressieren und D2 ausdrücklich auf Gradientenrauschen bei neuronalen Netzwerken abzielt. Die Kombination liefert den Gegenstand von Anspruch 1 ohne erfinderische Leistung. Anspruch 3 (Gewichtung proportional zum Kehrwert der Datensatzgröße) weicht von D1 (Gewichtung proportional zur Datensatzgröße) ab; diese Umkehrung stellt jedoch eine triviale Designentscheidung dar, die durch einfaches Umprogrammieren ohne unerwartete Wirkung erzielt wird. Anspruch 5 ist das Systemäquivalent zu Anspruch 1 und entbehrt erfinderischer Tätigkeit aus denselben Gründen. ANSPRÜCHE 2 UND 4 — Art. 56 EPÜ (D1 + D2 + D3) Dritter Stand der Technik (D3): Geyer et al., "Differentially Private Federated Learning: A Client Level Perspective", ICLR Workshop 2017 (vorveröffentlicht). D3 offenbart die clientseitige Rauschkalibrierung im föderalen Kontext sowie ein Tracking des Datenschutzbudgets pro Knoten über mehrere Kommunikationsrunden (Abschnitt 2–3). Anspruch 2: Die dynamische Anpassung des Rauschmaßstabs σ basierend auf der Gradientenvarianzmessung ist dem Fachmann aus der adaptiven Gradientenklipping-Literatur (vgl. D3, Abschnitt 3.2: adaptive Sensitivitätsschätzung) nahegelegt. Eine auf der Gradientenvarianz basierende σ-Anpassung stellt eine routinemäßige Optimierungsentscheidung dar. Anspruch 4: Das (ε, δ)-Datenschutzbudget ist aus D2 bekannt (Abschnitt 3.4). D3 offenbart die knotenübergreifende Budgetverfolgung (Abschnitt 2.3: per-client privacy tracking). Die Kombination beider Merkmale ergibt sich für den Fachmann ohne weiteres. Die Prüfungsabteilung fordert den Anmelder auf, innerhalb von 4 Monaten eine schriftliche Erwiderung einzureichen. Ohne Erwiderung wird die Anmeldung zurückgewiesen.
Geparste Ablehnungen
Grund Ansprüche Druckschriften Begründung der Prüfungsabteilung
Art. 56
Erfinderische Tätigkeit (Art. 56 EPÜ)
1 3 5
D1 — McMahan et al., "Communication-Efficient Learning of Deep Networks from Decentralized Data", ICML 2017 Abschnitt 3, Algorithmus 1: FedAvg-Protokoll — zentraler Server, lokales Training ohne Datenübertragung, gewichtete Mittelwertbildung der Gradienten (n_k/n) D2 — Abadi et al., "Deep Learning with Differential Privacy", ACM CCS 2016 Abschnitte 3.1–3.4: DP-SGD mit Gaußschem Gradientenrauschen; L2-Sensitivität; (ε, δ)-Budgetberechnung via Moment Accountant Ausgangspunkt: D1 offenbart das vollständige FedAvg-Protokoll (lokales Training, Gradientenübertragung, Server-Aggregation). Objektive Aufgabe: Hinzufügen von Datenschutzgarantien. D2 löst diese Aufgabe explizit durch differentiell privates Gradientenrauschen. Die Kombination D1 + D2 ist nahegelegt, da beide denselben Bereich adressieren und D2 direkt auf die in D1 übertragenen Gradienten anwendbar ist. Kein unerwarteter Effekt.
Art. 56
Erfinderische Tätigkeit (Art. 56 EPÜ)
2 4
D1 — McMahan et al., ICML 2017 Algorithmus 1: Basis-FedAvg D2 — Abadi et al., ACM CCS 2016 Abschnitt 3.4: (ε, δ)-Budgetverfolgung D3 — Geyer et al., "Differentially Private Federated Learning: A Client Level Perspective", ICLR Workshop 2017 Abschnitte 2–3: Adaptive, clientseitige Rauschkalibrierung; knotenübergreifende Budgetverfolgung über mehrere Runden Anspruch 2 (dynamische σ-Anpassung): aus D3 Abschnitt 3.2 nahegelegt (adaptive Sensitivitätsschätzung). Anspruch 4 (knotenübergreifender Budgetzähler): D2 liefert (ε, δ)-Budget, D3 die knotenübergreifende Verfolgung — Kombination ergibt sich routinemäßig.
Änderungsvorschläge (Rotdruck)
Amendment Option 1 — Claims 1, 3, 5
Technische Differenzierung: lokaler Sensitivitätsschätzer mit adaptivem σ in Anspruch 1 aufnehmen

Anspruch 1 wird dahingehend geändert, dass der Rauschmaßstab σ nicht auf einem festen L2-Schwellenwert (wie in D2) basiert, sondern auf einem knotenlokal berechneten Sensitivitätsschätzer, der die statistischen Eigenschaften der Lokaldaten berücksichtigt. D2 offenbart ausschließlich einen globalen, aufgabenunabhängigen σ-Parameter — die lokale, datensatzadaptive Bestimmung ist weder in D1 noch D2 offenbart.

✕ Ursprünglicher Wortlaut
Anspruch 1: Verfahren zur datenschutzerhaltenden Optimierung eines maschinellen Lernmodells in einem verteilten System, umfassend: Bereitstellen eines globalen Modells an eine Mehrzahl von Teilnehmerknoten; Durchführen, an jedem Teilnehmerknoten, einer lokalen Trainingsiteration auf privaten Lokaldaten, ohne diese Lokaldaten zu übermitteln; Berechnen, an jedem Teilnehmerknoten, eines differentiell privaten Gradientenrauschens gemäß einem Rauschmaßstab σ, der auf einem lokalen Sensitivitätsschätzer basiert; Aggregieren der verrauschten Gradienten mittels gewichteter FedAvg-Aggregation an einem zentralen Server; und Aktualisieren des globalen Modells auf Basis der aggregierten Gradienten.
✓ Geänderter Wortlaut
Spec support: Absatz [0042]–[0046] der Beschreibung: 'Das Rauschmodul M_noise schätzt die lokale Gradientensensitivität S_local := (1/B) · Σ ||∇L_i||₂ über die aktuelle Minibatch B und setzt σ := α · S_local, wobei α ein konfigurierbarer Datenschutzparameter ist.' Dies ist von D2 (globalem, festem σ) klar unterscheidbar.
Trade-off: Anspruch 1 wird gegenüber der ursprünglichen Fassung enger — der aufgabenspezifische lokale Schätzer ist aber ausreichend durch die Beschreibung gestützt und hebt sich klar von D2 (festem globalem σ) ab.
Amendment Option 2 — Claims 1, 3, 5
Invers-proportionale Gewichtung aus Anspruch 3 in Anspruch 1 integrieren

Die in D1 offenbarte Gewichtung ist proportional zur Datensatzgröße n_k. Anspruch 3 sieht die invers-proportionale Gewichtung (1/n_k) vor. Durch Übernahme dieser Merkmale in Anspruch 1 wird ein klarer, nicht trivial ableitbarer Unterschied zum nächstliegenden Stand der Technik D1 hergestellt.

✕ Ursprünglicher Wortlaut
Anspruch 1: Verfahren zur datenschutzerhaltenden Optimierung eines maschinellen Lernmodells in einem verteilten System, umfassend: Bereitstellen eines globalen Modells an eine Mehrzahl von Teilnehmerknoten; Durchführen, an jedem Teilnehmerknoten, einer lokalen Trainingsiteration auf privaten Lokaldaten, ohne diese Lokaldaten zu übermitteln; Berechnen, an jedem Teilnehmerknoten, eines differentiell privaten Gradientenrauschens gemäß einem Rauschmaßstab σ, der auf einem lokalen Sensitivitätsschätzer basiert; Aggregieren der verrauschten Gradienten mittels gewichteter FedAvg-Aggregation an einem zentralen Server; und Aktualisieren des globalen Modells auf Basis der aggregierten Gradienten.
✓ Geänderter Wortlaut
Spec support: Absatz [0055]–[0058]: 'Die invers-proportionale Gewichtung verhindert das systematische Untergewichten kleiner Datensätze bei heterogener Knotenverteilung (non-IID-Szenario) und führt zu nachweislich fairerer globaler Modellleistung über alle Knotenpopulationen.'
Trade-off: Stärkere Abgrenzung von D1, aber Anspruch 3 wird damit in den unabhängigen Anspruch 1 integriert und verliert seinen eigenständigen Schutzbereich. Empfohlen als Rückfalloption.
Amendment Option 1 — Claims 2, 4
Anspruch 2: dynamische σ-Anpassung präzisieren — Rückkopplung auf Gradientenvarianz über Iterationen, nicht Runden

Die Prüfungsabteilung verweist auf D3, Abschnitt 3.2 für adaptive Sensitivitätsschätzung. D3 beschreibt jedoch eine rundenweise Anpassung zwischen Kommunikationsrunden. Anspruch 2 sieht ausdrücklich eine Anpassung auf Basis der Varianz über aufeinander folgende lokale Trainingsiterationen (innerhalb einer Runde) vor — ein wesentlich feingranuläres Signal, das D3 nicht zeigt.

✕ Ursprünglicher Wortlaut
Anspruch 2: Verfahren nach Anspruch 1, wobei der lokale Sensitivitätsschätzer den Rauschmaßstab σ dynamisch in Abhängigkeit von der Varianz der Gradienten über aufeinander folgende lokale Trainingsiterationen anpasst.
✓ Geänderter Wortlaut
Spec support: Absatz [0048]–[0051]: 'Das Rauschmodul verwaltet einen Ringpuffer der Gradientennormen der letzten w = 10 Iterationen und berechnet daraus die laufende Varianz zur σ-Anpassung.' D3 beschreibt keine iterationsweise Anpassung innerhalb einer lokalen Runde.
Trade-off: Die Konkretisierung des gleitenden Fensters macht den Anspruch enger, hebt ihn aber eindeutig von D3 ab. Die Formel ist durch die Beschreibung vollständig gestützt.
Generierte Gegenargumente (EPÜ)
Art. 56 Erwiderung auf Art. 56-Ablehnung der Ansprüche 1, 3, 5 (D1 + D2)
Die Anmelderin widerspricht der Ablehnung der Ansprüche 1, 3 und 5 wegen fehlender erfinderischer Tätigkeit gemäß Art. 56 EPÜ auf der Grundlage von D1 (McMahan et al., ICML 2017) und D2 (Abadi et al., ACM CCS 2016). 1. ZUM AUFGABE-LÖSUNGS-ANSATZ Die Prüfungsabteilung legt D1 als nächstliegenden Stand der Technik zugrunde und definiert die objektive technische Aufgabe als 'Erweiterung des föderalen Lernverfahrens um Datenschutzgarantien'. Die Anmelderin akzeptiert D1 als geeigneten Ausgangspunkt, widerspricht jedoch der formulierten Aufgabe. Die Kern-Differenzierung von Anspruch 1 gegenüber D1 liegt nicht im Hinzufügen von Gradientenrauschen als solchem (das wäre durch D2 nahegelegt), sondern in der spezifischen Art und Weise der Rauschkalibrierung: Der Rauschmaßstab σ wird durch einen lokalen, datensatzadaptiven Sensitivitätsschätzer bestimmt, der die empirische Gradientenverteilung des jeweiligen Knotens auswertet. Die korrekt formulierte objektive technische Aufgabe lautet daher: 'Wie kann das Gradientenrauschen so kalibriert werden, dass es an die heterogene statistische Verteilung der Lokaldaten verschiedener Knoten angepasst ist, ohne diese Daten zu übermitteln?' 2. D2 LÖST DIESE AUFGABE NICHT D2 offenbart ausschließlich einen global konfigurierten, aufgabenunabhängigen Clipping-Schwellenwert C und einen festen Rauschmaßstab σ = (C · Δ_f) / ε (Abschnitt 3.2). Dieser Rauschmaßstab ist nicht knotenspezifisch und nicht adaptiv an die lokale Datenverteilung — er wird vor dem Training einmalig festgelegt. D2 enthält keinen Hinweis darauf, dass σ anhand der Verteilung der lokalen Gradienten einzelner Knoten geschätzt und individuell kalibriert werden sollte. Im Gegenteil: D2 setzt einen zentralisierten, einheitlichen Parameter voraus, was grundlegend dem nicht-IID-Charakter föderaler Lernszenarien widerspricht (vgl. Li et al., "Federated Learning: Challenges, Methods, and Future Directions", IEEE Signal Processing Magazine 2020: 'The non-IID nature of data is one of the principal challenges in federated learning that centralized DP approaches do not address.'). 3. FEHLENDE MOTIVATION ZUR KOMBINATION Die Prüfungsabteilung verweist zur Begründung der Kombination lediglich darauf, dass D2 'direkt auf die in D1 übertragenen Gradienten anwendbar ist'. Dies begründet allenfalls die technische Machbarkeit der Kombination, aber keine Motivation. Nach ständiger Rechtsprechung der Beschwerdekammern (T 0795/93, T 1096/92) reicht die technische Machbarkeit einer Kombination allein nicht aus, um erfinderische Tätigkeit zu verneinen — es bedarf eines konkreten Anlasses für den Fachmann, die Kombination gerade in der beanspruchten Weise vorzunehmen. Einen solchen Anlass für die lokale, knotenindividuelle σ-Schätzung bieten weder D1 noch D2. 4. ZU ANSPRUCH 3 (INVERS-PROPORTIONALE GEWICHTUNG) Die Prüfungsabteilung charakterisiert die invers-proportionale Gewichtung als 'triviale Designentscheidung'. Die Anmelderin hält dem entgegen: D1 verwendet ausdrücklich proportionale Gewichtung n_k/n, um großen Datensätzen mehr Einfluss zu geben. Die invers-proportionale Gewichtung verfolgt eine gegensätzliche algorithmische Zielsetzung — sie kompensiert die systematische Unterrepräsentation kleiner Datensätze in heterogenen (non-IID) Umgebungen. Diese Umkehr ist keine Optimierungsdetail, sondern eine algorithmische Designentscheidung mit messbaren Auswirkungen auf die Modellgüte bei unbalancierten Knotenverteilungen (nachgewiesen in Absatz [0058] der Beschreibung). Eine 'triviale' Designentscheidung liegt nicht vor, wenn sie eine spezifische, in D1 nicht vorgesehene und nicht nahezu gewünschte Wirkung erzeugt. 5. ZU ANSPRUCH 5 Anspruch 5 ist das Systemäquivalent zu Anspruch 1. Da Anspruch 1 aus den oben genannten Gründen erfinderische Tätigkeit aufweist, weist auch Anspruch 5 erfinderische Tätigkeit auf. Die Anmelderin beantragt, die Ablehnung der Ansprüche 1, 3 und 5 zurückzunehmen.
Art. 56 Erwiderung auf Art. 56-Ablehnung der Ansprüche 2 und 4 (D1 + D2 + D3)
Die Anmelderin widerspricht der Ablehnung der Ansprüche 2 und 4 wegen fehlender erfinderischer Tätigkeit auf der Grundlage von D1, D2 und D3 (Geyer et al., ICLR Workshop 2017). 1. ZU ANSPRUCH 2 (ITERATIONSWEISE σ-ANPASSUNG) Die Prüfungsabteilung verweist auf D3, Abschnitt 3.2 für 'adaptive Sensitivitätsschätzung'. D3 beschreibt eine Anpassung des Clipping-Schwellenwerts zwischen Kommunikationsrunden (inter-round adaptation) — also eine Änderung der Parameter zwischen Aggregationsschritten des Servers. Anspruch 2 sieht dagegen eine Anpassung des Rauschmaßstabs σ innerhalb einer lokalen Trainingsrunde, d.h. iterationsweise (intra-round, iteration-level adaptation), basierend auf der laufenden Gradientenvarianz der letzten w lokalen Iterationen, vor. Dies ist ein grundlegender Unterschied: Die inter-round Anpassung in D3 reagiert auf Runden-Aggregationssignale und erfordert Kommunikation mit dem Server. Die in Anspruch 2 beschriebene iterationsweise Anpassung ist vollständig lokal und kommunikationsfrei — sie wertet ausschließlich die intra-round Gradientendynamik aus. D3 enthält keinen Hinweis auf diese Art der Feinregulierung, und die Prüfungsabteilung hat nicht begründet, warum der Fachmann die inter-round Methode von D3 in eine iterationsweise, vollständig lokale Methode gemäß Anspruch 2 umwandeln würde. Daher ist Anspruch 2 durch die Kombination D1 + D2 + D3 nicht nahegelegt. Erfinderische Tätigkeit liegt vor. 2. ZU ANSPRUCH 4 (DATENSCHUTZRECHNUNGSFÜHRER MIT KNOTENÜBERGREIFENDER VERFOLGUNG) Die Prüfungsabteilung kombiniert D2 (Moment Accountant für (ε, δ)-Budget) und D3 (knotenspezifisches Tracking). Anspruch 4 sieht vor, dass der zentrale Server das verbrauchte Datenschutzbudget knotenübergreifend über einen 'Datenschutzrechnungsführer' verfolgt, d.h. eine dedizierte Buchführungskomponente auf Serverebene. D3 beschreibt clientseitiges Tracking — das Datenschutzbudget wird pro Knoten auf dem Knoten selbst verfolgt (Abschnitt 2.3: 'each client maintains its own privacy budget tracker'). Die serverside, knotenübergreifende Aggregation und Überwachung des Gesamtbudgets über alle Knoten hinweg — wie in Anspruch 4 und Absatz [0062] der Beschreibung beschrieben — ist in D3 nicht offenbart. Der Unterschied hat technische Relevanz: Eine serverside Überwachung erlaubt es, Knoten mit überschrittenem Budget selektiv vom nächsten Aggregationsschritt auszuschließen, ohne dass die Knoten ihre Budgetinformationen untereinander austauschen müssen. Dies ist weder in D2 noch in D3 gelehrt oder nahegelegt. Die Anmelderin beantragt, die Ablehnung der Ansprüche 2 und 4 zurückzunehmen. 3. ALLGEMEINER HINWEIS ZUM PROBLEM-SOLUTION-ANSATZ Die Anmelderin weist darauf hin, dass bei der Anwendung des Aufgabe-Lösungs-Ansatzes die objektive technische Aufgabe auf Basis der tatsächlich vorliegenden Unterschiedsmerkmale zu formulieren ist (T 0641/00 — Comvik). Die Prüfungsabteilung hat die Unterschiedsmerkmale in ihrer Mitteilung nicht präzise identifiziert und die Aufgabe zu allgemein formuliert. Die Anmelderin bittet um Präzisierung und bietet eine mündliche Verhandlung an, um die Unterschiedsmerkmale gemeinsam mit den Prüfern zu klären.
Entwurf der Erwiderung
EPO Erwiderung — EP 22 710 445.3
Wie es funktioniert

Was heute autonom läuft — und was nicht

Schritt 1
Ablehnung parsen
Vollständig autonom. Der Agent liest die Mitteilung der Prüfungsabteilung und extrahiert Ablehnungsgründe, Anspruchsnummern, Druckschriften und die Begründung — ohne Templates oder Keyword-Matching.
Schritt 2
Änderungsvorschläge
Autonom. Der Agent generiert 1–3 Änderungsoptionen je Ablehnung mit Beschreibungsstütze. Optionen werden nach Stärke gerankt; Kompromisse werden offengelegt.
Schritt 3
Argumententwurf
Autonom. Formelle Erwiderungsargumente im EPÜ-Stil: Aufgabe-Lösungs-Ansatz, technische Vorurteile, Beschwerdekammerpräzedenzfälle (T 0795/93, T 0641/00 — Comvik) aus dem Akteninhalt.
Schritt 4
Einreichung
Mensch erforderlich. ClaimForge reicht keine Dokumente im Namen des Anmelders ein. Der Output ist ein Entwurf für die Prüfung durch einen zugelassenen Vertreter.
Beta-Hinweis: ClaimForge ist ein Unterstützungswerkzeug für die Patentprosekution, kein zugelassener Vertreter. Der Output erfordert die Prüfung durch einen beim EPA zugelassenen Vertreter vor der Einreichung. Anspruchsanalyse, Druckschriftengewichtung und Argumentationsstärke sind LLM-Outputs — plausibel, aber nicht unfehlbar. Rechercheabdeckung im Prior-Art-Agenten: Espacenet + Google Patents. Lücken bestehen.

Eigene EPO-Mitteilung einreichen

Denselben Agent live auf Ihren USPTO- und EPO-Fällen. Einfügen, ausführen, Entwurf in Sekunden — ab $99/Monat, 14 Tage kostenlos.

Preise ansehen → Agent direkt testen

Direktkontakt: claimforge@polsia.app