Große PDF Datei anzeigen und cachen in Wordpress?

Ungesund

Feiner Herr
Registriert
15 Juli 2013
Beiträge
1.871
Ort
Achterbahn
Heyho,

ich erstelle gerade eine kleine Wordpress-Website für einen Verein in meiner Nähe. Dazu habe ich deren Festschrift digitalisiert, ist ein 100 seitiges PDF mit 178MB. (Die rohen Bilder davon habe ich zur not auch noch.)

Nun wollte ich, dass dieses PDF auf der Website einsehbar ist, direkt im Browser.

Dabei stellt sich ein Problem: Das PDF wird jedes mal neu heruntergeladen, wenn man die Seite aufruft. Einmal komplett laden ist ja okay, aber man braucht nur den Tab zu schließen und die Seite neu zu öffnen und die 178MB werden erneut geladen. Gibts da ne Möglichkeit, das auf dem User-Rechner zu Cachen? Idealerweise halbwegs umsetzbar für einen Menschen, der nur noch alle paar Jahre eine Website baut.

Einfach hochladen und einbetten über den "File"-Block im Editor bringt einen nicht ganz so schönen Reader mit sich (der im Browser integrierte) und ist auf Mobile nicht sichtbar. Nutze ich Adobe PDF embed API habe ich zwar einen super Viewer mit allem was ich brauche, aber es gehen unnötig Daten an Adobe, auf einer Website die ansonsten komplett Metric-free ist. Und der Viewer crasht auf Mobile und führt dort zu einer Lade-Schleife die ständig das PDF neu herunterlädt.

Evtl. hat ja einer schonmal ähnliches umgesetzt, und hat einen Lösungsansatz. Nur bei WP-Plugin Empfehlungen bitte nix wo man Geld bezahlen muss. Danke schonmal!
 
Vielleicht auch noch interessant und gut zu wissen:

Vermutlich tut der Vorschlag von Dexter das gleiche, nur über die Kontrolle über die .htaccess.
 
Bedenke aber auch, dass die ganzen Header zur Steuerung des Caches bloss eine Erlaubnis an die Browser sind, Daten zu cachen, keine Verpflichtung. Es gibt keine Garantie, dass der Browser tatsaechlich cached, gerade bei grossen Dateien. Firefox z.B. cached keine Dateien die groesser als browser.cache.disk.max_entry_size (default ~ 50 MB) sind.

Ich wuerde versuchen, das PDF selbst zu optimieren. 178 MB fuer 100 Seiten klingt nach einem Bild pro Seite. Idealerweise wuerde man die Texte mit OCR erkennen (oder von den digitalen Originaldokumenten statt von einem Scan ausgehen, wenn vorhanden) und die dann als Text statt als Bild im PDF speichern. Wenn's ein Bild sein muss, dann notfalls halt staerker komprimieren, mit einem Algorithmus, der fuer Schwarz-Weiss-Bilder wie Text vorgesehen ist, etwa JBIG(2).
 
  • Thread Starter Thread Starter
  • #6
Jo, die PDF-Optimierung ist bereits an ihrer akzeptablen Grenze. Das ist eine analoge Sammlung (Von Hand gestaltete DIN A3 Seiten) aller Zeitungsauschnitte der letzten 50 Jahre, vermengt mit Fotos, Handschriftlichen Notizen und Magazin-Covers der Vereinsnahen Publikationen. Viele der Zeitungsausschnitte sind gescant, ausgedruckt und dann oft schräg eingeklebt worden. Verschiedene OCR-Lösungen erkennen da auch wegen der geringen Qualität vielleicht 30% bis maximal 50%. Mit dem Menschlichen Auge sind die Texte noch lesbar. Ich setze da aber keine Texte neu, da komme ich in Teufels Küche mit bei 100 Seiten.

Aber nicht nur wegen der gerade noch lesbaren Texte kann ich das PDF nicht hart komprimieren: Weil das Menschen sehen, die sich und Menschen die sie ewig nicht gesehen haben darin suchen. Da kann ich gerade bei den Fotos nicht harsch komprimieren, weil sonst die JPEG-Fraktale die Gesichter zerfressen.

Ich bin inzwischen evtl. eher bei einer Lösung, bei der ich die Seiten als JPEG o.ä. einzeln, in einer für die Größe (DIN A3) passende Gallerie mit Zoom und Scroll funktion packe. Dann wird jede Seite zumindest einzeln geladen, und ich habe immer nur so 2 MB pro Seite zu laden. Da kann ich dann evtl. auch die cache-controll sachen effektiver nutzen. Danke schonmal für die Tipps!
 
Zurück
Oben