PDF-Tools von Tachytelic (unabhängiger Herausgeber) (Vorschau)
PDF-Tools sind eine kostenlose Gruppe von Aktionen zum Arbeiten mit PDF-Dateien. Es bietet Funktionen zum Zusammenführen, Teilen, Extrahieren von Seiten, Extrahieren von Text, Optimieren der Dateigröße und Verwalten von PDF-Metadaten. Entwickelt, um PDF-Vorgänge in Ihren Flüssen zu vereinfachen.
Dieser Connector ist in den folgenden Produkten und Regionen verfügbar:
| Service | Klasse | Regions |
|---|---|---|
| Copilot Studio | Premium | Alle Power Automate Regionen mit Ausnahme der folgenden: - US Government (GCC) - US Government (GCC High) - China Cloud betrieben von 21Vianet - US Department of Defense (DoD) |
| Logik-Apps | Standard | Alle Logik-Apps-Regionen mit Ausnahme der folgenden Bereiche: - Azure Government Regionen - Azure China-Regionen - US Department of Defense (DoD) |
| Power Apps | Premium | Alle Power Apps Regionen mit Ausnahme der folgenden: - US Government (GCC) - US Government (GCC High) - China Cloud betrieben von 21Vianet - US Department of Defense (DoD) |
| Power Automate | Premium | Alle Power Automate Regionen mit Ausnahme der folgenden: - US Government (GCC) - US Government (GCC High) - China Cloud betrieben von 21Vianet - US Department of Defense (DoD) |
| Kontakt | |
|---|---|
| Name | Paul Murana |
| URL | https://tachytelic.net |
| paulie@tachytelic.net |
| Connectormetadaten | |
|---|---|
| Herausgeber | Tachytelic |
| Webseite | https://tachytelic.net/pdf-tools-for-power-automate/ |
| Datenschutzrichtlinie | https://tachytelic.net/privacy |
| Kategorien | Daten |
PDF Tools von Tachytelic
PDF-Tools sind eine kostenlose Gruppe von Aktionen zum Arbeiten mit PDF-Dateien in Power Automate. Es bietet Funktionen zum Zusammenführen, Teilen, Extrahieren von Seiten, Extrahieren von Text, Optimieren der Dateigröße und Verwalten von PDF-Metadaten. Wurde entwickelt, um PDF-Vorgänge in Ihren Flüssen zu vereinfachen, ohne dass eine Premiumlizenz erforderlich ist.
Herausgeber: Paul Murana
Voraussetzungen
Es gibt keine Voraussetzungen für die Verwendung dieses Connectors. Sie ist vollständig kostenlos und erfordert keine API-Schlüssel oder Authentifizierung.
Unterstützte Vorgänge
Optimieren von PDF-Dateien
Optimieren Sie ein PDF durch Reinigung und Rekomprimierung interner Objekte. Übernimmt eine base64-codierte PDF und gibt eine optimierte base64-codierte PDF zurück. Unterstützt aggressive und sichere Komprimierungsmodi.
Extrahieren bestimmter Seiten
Extrahieren Sie bestimmte Seiten aus einer PDF-Datei mithilfe eines Seitenbereichs (z. B. "1-3,7"). Gibt eine neue PDF zurück, die nur die angegebenen Seiten enthält.
Extrahieren von Informationen
Extrahiert detaillierte Metadaten aus einer PDF-Datei, einschließlich Titel, Autor, CreationDate, PDF-Version, Seitenanzahl und mehr.
Festlegen von Metadaten
Legt Metadatenwerte (Titel, Autor, Betreff, Stichwörter, Datumsangaben) in einer PDF-Datei fest. Gibt die PDF-Datei mit aktualisierten Metadaten zurück.
Text extrahieren
Extrahiert den gesamten Text aus einer PDF-Datei mit optionalen StartPage- und EndPage-Parametern. Gibt kombinierten Text und textgeordnet nach Seite zurück.
PDF teilen
Teilt eine PDF-Datei entweder durch eine feste Anzahl von Seiten oder durch angegebene Seitenbereiche auf. Gibt ein Array von PDF-Dateien zurück.
Zusammenführen von PDF-Dateien
Führt mehrere PDF-Dateien zusammen, die als Base64-Zeichenfolgen bereitgestellt werden, in einer einzigen PDF-Datei.
Abrufen von Anmeldeinformationen
Für diesen Connector sind keine Anmeldeinformationen erforderlich. Es ist ein kostenloser Dienst ohne Authentifizierung erforderlich.
Erste Schritte
- Hinzufügen des Connectors zu Ihrem Power Automate-Fluss
- Es ist keine Verbindungseinrichtung erforderlich – beginnen Sie einfach mit der Verwendung der Aktionen.
- Alle PDF-Inhalte müssen als base64-codierte Zeichenfolgen bereitgestellt werden.
- Verwenden Sie die Aktion "Dateiinhalt abrufen" aus OneDrive, SharePoint oder anderen Connectors, um PDFs abzurufen und in Base64 zu konvertieren.
Beispiel: Optimieren einer PDF-Datei aus SharePoint
- Hinzufügen von "Dateiinhalt abrufen" aus SharePoint
- Hinzufügen der Aktion "PDF optimieren"
- Legen Sie PdfFileContent auf die Ausgabe von "Dateiinhalt abrufen" fest (sie wird automatisch base64-codiert)
- Verwenden sie die OptimizedPdf-Ausgabe, um mithilfe von "Datei erstellen" wieder auf SharePoint zu speichern.
Bekannte Probleme und Einschränkungen
- Alle PDF-Vorgänge arbeiten mit base64-codierten Inhalten, wodurch die Datengröße um ca. 33%
- Sehr große PDFs (über 100 MB) können Timeouts auftreten
- Kennwortgeschützte PDF-Dateien können von den meisten Vorgängen nicht verarbeitet werden.
- Der Vorgang "Text extrahieren" funktioniert möglicherweise nicht gut mit gescannten Dokumenten (bildbasierte PDF-Dateien)
Häufig gestellte Fragen
Ist dieser Connector wirklich kostenlos?
Ja! Dieser Connector ist vollständig kostenlos ohne Nutzungsbeschränkungen, ohne API-Schlüssel und ohne Premiumlizenz erforderlich.
Welche maximale Dateigröße wird unterstützt?
Der Connector kann die meisten typischen Geschäftsdokumente verarbeiten. Sehr große Dateien (über 100 MB) können aufgrund der Verarbeitungszeit Timeoutprobleme auftreten.
Kann ich gescannte PDF-Dateien verarbeiten?
Der Verbinder funktioniert am besten mit textbasierten PDF-Dateien. Gescannte Dokumente (Bild-PDFs) verfügen nicht über extrahierenden Text. Erwägen Sie zuerst die Verwendung eines OCR-Diensts.
Wie kann ich eine Datei in Base64 konvertieren?
Wenn Sie Aktionen wie "Dateiinhalt abrufen" aus SharePoint oder OneDrive verwenden, ist der Inhalt automatisch in einem Format verfügbar, das an diesen Connector übergeben werden kann.
Bereitstellungsanweisungen
Dies ist ein veröffentlichter unabhängiger Publisher-Connector und steht direkt in Power Automate zur Verfügung. Es ist keine Bereitstellung erforderlich.
Wenn Sie dies als benutzerdefinierter Connector zum Testen bereitstellen möchten:
- Herunterladen der
apiDefinition.swagger.jsonDateienapiProperties.json - Führen Sie
paconn create --api-def apiDefinition.swagger.json --api-prop apiProperties.jsonaus.
Drosselungsgrenzwerte
| Name | Aufrufe | Verlängerungszeitraum |
|---|---|---|
| API-Aufrufe pro Verbindung | 100 | 60 Sekunden |
Aktionen
| Extrahieren bestimmter Seiten |
Extrahieren Sie bestimmte Seiten aus einer PDF-Datei mithilfe eines Seitenbereichs (z. B. "1-3,7"). |
| Extrahieren von Informationen |
Extrahiert detaillierte Metadaten aus einer PDF-Datei (z. B. Titel, Autor, CreationDate, PDF-Version, Dateigröße usw.). |
| Festlegen von Metadaten |
Legt Metadatenwerte (Titel, Autor, Datum usw.) in einer PDF-Datei fest. |
| Optimieren von PDF-Dateien |
Optimieren Sie ein PDF durch Reinigung und Rekomprimierung interner Objekte. Übernimmt eine base64-codierte PDF und gibt eine optimierte base64-codierte PDF zurück. |
| PDF teilen |
Teilt eine PDF-Datei entweder durch eine feste Anzahl von Seiten oder durch angegebene Seitenbereiche auf. |
| Text extrahieren |
Extrahiert den gesamten Text aus einer PDF-Datei mit optionaler StartPage und EndPage. |
| Zusammenführen von PDF-Dateien |
Führt mehrere PDF-Dateien zusammen, die als Base64-Zeichenfolgen bereitgestellt werden, in einer einzigen PDF-Datei. |
Extrahieren bestimmter Seiten
Extrahieren Sie bestimmte Seiten aus einer PDF-Datei mithilfe eines Seitenbereichs (z. B. "1-3,7").
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
PDF-Dateiinhalt
|
PdfFileContent | True | byte |
Base64-codierter Inhalt der PDF-Datei. |
|
Seitenbereich
|
PageRange | True | string |
Zu extrahierender Seitenbereich (z. B. "1-3,7") |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Extrahierte PDF-Datei
|
ExtractedPdf | byte |
Base64-codierter Inhalt der extrahierten PDF-Datei. |
Extrahieren von Informationen
Extrahiert detaillierte Metadaten aus einer PDF-Datei (z. B. Titel, Autor, CreationDate, PDF-Version, Dateigröße usw.).
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
PDF-Dateiinhalt
|
PdfFileContent | True | byte |
Der base64-codierte Inhalt der PDF-Datei |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Dokumenttitel
|
Title | string |
Die Titelmetadaten der PDF |
|
Dokumentautor
|
Author | string |
Die Metadaten des PDF-Autors |
|
Dokumentbetreff
|
Subject | string |
Die PDF-Betreffmetadaten |
|
Dokumentstichwörter
|
Keywords | string |
Die Metadaten der PDF-Schlüsselwörter |
|
Ist verschlüsselt?
|
IsEncrypted | boolean |
Gibt an, ob die PDF-Datei verschlüsselt ist. |
|
Hat extraktierbarer Text?
|
HasText | boolean |
Gibt an, ob die PDF-Seiten extrahierenden Text enthalten. |
|
Creator-Anwendung
|
Creator | string |
Der Name der Anwendung, die zum Erstellen der PDF-Datei verwendet wird. |
|
Producer
|
Producer | string |
Die Software, die die PDF-Datei erstellt hat |
|
Erstellungsdatum
|
CreationDate | string |
Das Datum, an dem die PDF ursprünglich erstellt wurde |
|
Änderungsdatum
|
ModDate | string |
Das Datum, an dem die PDF zuletzt geändert wurde |
|
Seitenanzahl
|
PageCount | integer |
Die Gesamtanzahl der Seiten in der PDF-Datei |
|
PDF-Version
|
PDFVersion | string |
Die PDF-Spezifikationsversion (z. B. 1.4, 1.7) |
Festlegen von Metadaten
Legt Metadatenwerte (Titel, Autor, Datum usw.) in einer PDF-Datei fest.
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
PDF-Dateiinhalt
|
PdfFileContent | True | byte |
Base64-codierter PDF-Inhalt |
|
Title
|
Title | string |
Der Dokumenttitel |
|
|
Verfasser
|
Author | string |
Der Dokumentautor |
|
|
Betreff
|
Subject | string |
Der Betreff des Dokuments |
|
|
Schlüsselwörter
|
Keywords | string |
Dokumentschlüsselwörter |
|
|
Erstellungsdatum
|
CreationDate | string |
Erstellungsdatum der PDF-Datei |
|
|
Änderungsdatum
|
ModificationDate | string |
Datum, an dem die PDF-Datei geändert wurde |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
PDF aktualisiert
|
UpdatedPdf | byte |
Base64-codierte PDF mit aktualisierten Metadaten |
Optimieren von PDF-Dateien
Optimieren Sie ein PDF durch Reinigung und Rekomprimierung interner Objekte. Übernimmt eine base64-codierte PDF und gibt eine optimierte base64-codierte PDF zurück.
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
PDF-Dateiinhalt
|
PdfFileContent | True | byte |
Base64-codierter Inhalt der PDF-Datei zur Optimierung. |
|
Optimierungsmodus
|
Mode | string |
Wählen Sie aggressiv für maximale Komprimierung oder sicher aus Kompatibilität. |
|
|
Garbage Collection Level
|
Garbage | integer |
Ebene der nicht verwendeten Objektentfernung (0-4). Höhere Werte entfernen mehr nicht verwendete Daten. |
|
|
Anwenden der Deflate-Komprimierung
|
Deflate | boolean |
Gibt an, ob die Verzögerungskomprimierung auf Datenströme angewendet werden soll. |
|
|
Dokument bereinigen
|
Clean | boolean |
Gibt an, ob der PDF-Inhalt bereinigt und sanitiert werden soll. |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Optimierte PDF-Datei
|
OptimizedPdf | byte |
Base64-codierter Inhalt der optimierten PDF-Datei. |
PDF teilen
Teilt eine PDF-Datei entweder durch eine feste Anzahl von Seiten oder durch angegebene Seitenbereiche auf.
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
PDF-Dateiinhalt
|
PdfFileContent | True | byte |
Base64-codierter Inhalt der PDF-Datei. |
|
Geteilter Typ
|
SplitType | True | string |
Wählen Sie aus, wie die PDF-Datei geteilt werden soll. |
|
Seiten pro Split
|
PagesPerSplit | integer |
Anzahl der Seiten pro Ausgabedatei (erforderlich, wenn der geteilte Typ "Anzahl von Seiten" ist). |
|
|
Seitenbereiche
|
PageRanges | string |
Seitenbereiche, die geteilt werden sollen (z. B. "1-2,4") (erforderlich, wenn der geteilte Typ angegebene Bereiche ist). |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Teilen von PDF-Dateien
|
SplitPdfs | array of byte |
Array von geteilten PDF-Dateien. |
Text extrahieren
Extrahiert den gesamten Text aus einer PDF-Datei mit optionaler StartPage und EndPage.
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
PDF-Dateiinhalt
|
PdfFileContent | True | byte |
Base64-codierte PDF-Datei |
|
Startseite
|
StartPage | integer |
Seitenzahl zum Starten der Extraktion von |
|
|
Seite beenden
|
EndPage | integer |
Seitenzahl zum Beenden der Extraktion bei (einschließlich) |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Extrahierter Text
|
ExtractedText | string |
Kombinierter Text von allen markierten Seiten |
|
Text nach Seite
|
ExtractedTextByPage | array of object |
Array von extrahierten Textobjekten pro Seite |
|
Seitennummer
|
ExtractedTextByPage.Page | integer |
Seitenzahl der PDF-Datei |
|
Textinhalt
|
ExtractedTextByPage.Text | string |
Von dieser Seite extrahierter Text |
Zusammenführen von PDF-Dateien
Führt mehrere PDF-Dateien zusammen, die als Base64-Zeichenfolgen bereitgestellt werden, in einer einzigen PDF-Datei.
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
PDF-Dateien
|
PdfFiles | True | array of byte |
Ein Array von base64-codierten PDF-Dateien zum Zusammenführen |
Gibt zurück
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
PDF zusammengeführt
|
MergedPdf | byte |
Base64-codierter Inhalt der zusammengeführten PDF-Datei |