Dlouhodobá validace PDF: proč dnes vyhovující PDF může selhat při ověření v roce 2035
Archiv dokumentů je užitečný pouze tehdy, pokud lze dokumenty v něm ověřit v okamžiku, kdy o ně auditor požádá. Ne v době, kdy jste je vytvořili. Ne když je chtějí vaši právníci. Ve chvíli, kdy vás někdo mimo vaši organizaci požádá, abyste něco prokázali.
U digitálně podepsaných a orazítkovaných dokumentů má ověření omezenou trvanlivost. Kryptografické mechanismy, které dnes dělají dokument PDF/A-3 důvěryhodným, závisejí na certifikátech, algoritmech a řetězích důvěry, které mohou vypršet, být odvolány nebo zastaralé. Budovat archiv dokumentů bez plánování pro tuto situaci znamená budovat archiv, který selže v nejhorší možný okamžik.
Problém s ověřením závislým na certifikátech
Digitální podpis PDF se ověřuje pomocí řetězu certifikátů: certifikátu podepisujícího, certifikátu vydávající CA a certifikátu kořenové CA. Každý certifikát má dobu platnosti, obvykle jeden až tři roky pro certifikáty koncové entity.
Pokud ověřujete podpis po vypršení certifikátu podepisujícího, ověření selže, pokud ověřovatel nemůže prokázat, že certifikát byl platný v době podpisu. Prokázat to vyžaduje:
- Znát čas podpisu dokumentu (důvěryhodné časové razítko)
- Mít stav odvolání certifikátu v době podpisu (odpověď OCSP nebo CRL)
- Mít kompletní řetěz certifikátů tak, jak existoval v době podpisu
Pět let po podpisu je certifikát dávno prošlý. CA možná již nefunguje. OCSP respondér rozhodně již nevydává odpovědi pro tento certifikát. Stav odvolání z doby podpisu neexistuje nikde online.
Bez těchto informací přísný ověřovatel odmítne podpis potvrdit, i když byl při aplikaci zcela platný.
Dlouhodobá validace (LTV)
Dlouhodobá validace (LTV) je technika pro vložení důkazů potřebných pro budoucí ověření přímo do dokumentu. Standardem pro PDF je ETSI EN 319 132 (PAdES) a ISO 32000.
Dokument PDF/A-3 s podporou LTV obsahuje:
- Tokeny podpisu a razítka (jako vždy)
- Kompletní řetěz certifikátů každého certifikátu zapojeného do podepisování a razítkování
- Informace o odvolání (odpovědi OCSP nebo snímky CRL) zachycené v době podpisu, dokud byly certifikáty ještě platné a OCSP respondéry stále fungovaly
S těmito informacemi vloženými může ověřovatel v roce 2035 rekonstruovat kompletní řetěz důvěry tak, jak existoval v roce 2026, bez přístupu k síti.
Přidání informací LTV vyžaduje jejich vložení před vypršením platnosti zahrnutých certifikátů. To se typicky provádí ihned po podpisu nebo v krátkém časovém okně, nikoli roky poté.
Zastarávání algoritmů
SHA-1 byl jako podpisový algoritmus zastaralý v roce 2017. Certifikáty podepsané SHA-1 již nejsou důvěryhodné u hlavních ověřovatelů. Každé PDF podepsané certifikátem SHA-1 je nyní v přísném režimu neověřitelné.
SHA-256 je aktuálním standardem a očekává se, že zůstane bezpečný v dohledné budoucnosti, ale „dohledná budoucnost” je v kryptografii kvalifikovaný termín. NIST pracuje na post-kvantových kryptografických standardech od roku 2016 a přechod na kvantově odolné algoritmy se očekává v průběhu příštích 10 až 15 let.
Pro dokument, který musí zůstat ověřitelný do roku 2040, může být podpisový algoritmus zvolený v roce 2026 zastaralý před koncem archivní doby. Zmírněním je archivní razítkování: aplikace nového razítka před zastaráním algoritmu starého, přičemž nové razítko pokrývá dokument plus staré razítko. Tím se zachovává řetěz důvěry přes přechody algoritmů.
Archivní razítkování
Archivní razítko prodlužuje platnost orazítkovaného dokumentu za bod, kde by algoritmus nebo certifikát původního razítka mohl být považován za slabý.
Postup:
- Dokument má stávající RFC 3161 razítko z roku 2026
- Před zastaráním SHA-256 (hypoteticky kolem roku 2036) si vyžádáte nové razítko
- Nové razítko pokrývá dokument plus existující token razítka z roku 2026
- Nové razítko používá aktuálně doporučený algoritmus (kvantově odolný, kolem roku 2036)
- Ověřovatel v roce 2040 ověří: razítko z roku 2036 (pomocí algoritmu z roku 2036) pokrývalo razítko z roku 2026, které pokrývalo dokument s jeho původním hašem
Tento řetěz přesouvá důvěru: každé nové razítko ručí za všechna předchozí. Není třeba znovu podepisovat původní dokument; stačí přidat nové razítko před tím, než se předchozí stane kryptograficky nedostatečným.
Pro desetileté daňové archivy obvykle stačí jedno opětovné razítkování v polovině doby. Pro 20letové nebo 30letové archivy (zdravotní záznamy, nemovitosti, veřejné zakázky) by měl být harmonogram opětovného razítkování stanoven při počáteční archivaci.
Stabilita písem a barevných profilů
Mimo kryptografické obavy má PDF/A-3 jednodušší dlouhodobou výhodu oproti běžnému PDF: nařizuje vložení všech písem a barevných profilů do souboru. PDF, které odkazuje na externí písmo nebo používá systémový barevný profil, se může za deset let renderovat odlišně, když písmo již není nainstalováno nebo byl barevný profil aktualizován.
PDF/A-3 zakazuje externí odkazy, JavaScript a jakýkoli obsah vyžadující rozlišení za běhu. Co je v souboru, to je vše, co je potřeba pro identické renderování na jakémkoli vyhovujícím prohlížeči, nyní i v budoucnosti.
Proto je PDF/A-3 správným archivním formátem pro jakýkoli dokument, který musí být čitelný lidským auditorem za mnoho let. Běžné PDF, které dnes validuje, může vypadat špatně nebo být nečitelné v roce 2035, ne kvůli kryptografii, ale protože se změnil renderer písem.
Validace dlouhodobých archivů
VeraPDF je referenční implementací pro validaci PDF/A. Je open-source, udržována PDF Association a Open Preservation Foundation a jde o nástroj používaný národními archivy a regulatorními orgány po celé Evropě.
Spuštění VeraPDF proti archivu PDF/A-3 potvrzuje:
- Dokument splňuje ISO 19005-3 (PDF/A-3)
- Všechna písma jsou vložena
- Barevné profily jsou soběstačné
- Nejsou přítomny zakázané funkce (JavaScript, externí obsah, šifrování)
- Metadata XMP jsou platná a správně identifikují úroveň shody
VeraPDF nevaliduje kryptografické podpisy ani razítka. Pro ty použijte ověřovatel kompatibilní s PAdES, jako je ETSI Signature Validation API nebo DSS (Digital Signature Service), open-source knihovna udržovaná Evropskou komisí.
Kompletní workflow dlouhodobé validace spouští oba: VeraPDF pro shodu s PDF/A, DSS pro ověření podpisů a razítek.
Budování archivů, které přežijí svou dobu uchovávání
Praktický kontrolní seznam pro archiv dokumentů, který zůstane ověřitelný na konci doby uchovávání:
- Používejte PDF/A-3 pro všechny archivované dokumenty (všechna písma a barevné profily vloženy)
- Aplikujte podpisy PAdES s informacemi LTV vloženými v době podpisu
- Používejte RFC 3161 razítka od TSA na důvěryhodném seznamu EU
- Zahrňte kompletní řetěz certifikátů a data odvolání do dokumentu v době archivace
- Ukládejte dokumenty v WORM úložišti se zámky uchovávání v compliance mode
- Zahrňte harmonogram opětovného razítkování do vaší politiky uchovávání, spouštěný před tím, než se jakýkoli vložený certifikát nebo algoritmus přiblíží zastaralosti
- Pravidelně ověřujte archiv (ročně pro archivy s dlouhou retencí) pomocí VeraPDF a DSS
Kroky 1 až 4 se provádějí v době archivace. Kroky 5 až 7 jsou provozní závazky po celou dobu existence archivu.
SealDoc a dlouhodobá platnost
SealDoc generuje dokumenty PDF/A-3 s podpisy s povoleným LTV a RFC 3161 razítky od kvalifikovaných EU TSA. Řetězy certifikátů a OCSP odpovědi jsou vkládány v době vytvoření dokumentu, nikoli zpětně.
Balíček důkazů zahrnuje ověřovací materiál: kompletní řetěz certifikátů, snímky odvolání a tokeny razítek v jejich původním CMS kódování. Auditor v roce 2035 může balíček ověřit pomocí VeraPDF, DSS nebo OpenSSL bez přístupu k síti nebo jakékoli závislosti na infrastruktuře SealDoc.
Opětovné razítkování pro archivy s dlouhou retencí je dostupné jako plánovaná operace prostřednictvím SealDoc API, která organizacím umožňuje udržovat algoritmickou aktuálnost pro archivy přesahující očekávanou životnost současných kryptografických standardů.