Katalog formátů

Doporučené formáty

Volba vhodných, zdokumentovaných a vyzkoušených formátů je pro oblast trvalého ukládání digitálních dat klíčovou otázkou. Na těchto vlastnostech totiž závisí dlouhodobá čitelnost uložených dat1. Z tohoto důvodu digitální archiv Národního archivu na vstupu všechny formáty identifikuje pomocí nástroje DROID a kontroluje dle zveřejněných formátových pravidel Národního archivu.2

Formáty používané v oblasti prostorových dat nejsou výjimkou a jejich dlouhodobá čitelnost ve spojení s předpokládanou interoperabilitou je zatím velkou neznámou. Obecně známý formát Shapefile, který je nyní nejčastěji používaný k předávání nebo zveřejňování prostorových dat, je vzorovým příkladem nevhodného formátu pro trvalé uchování.3 Na druhou stranu při konverzích do formátů vhodných pro dlouhodobé ukládání může docházet ke ztrátě informací a tím k jejich znehodnocení. Je proto nezbytné hledat, popsat a testovat vhodné formáty pro dlouhodobé uložení prostorových dat a lze v této oblasti očekávat další vývoj. Výsledkem této činnosti je i Katalog formátů.

Na základě Národního standardu formátů pro archivaci (platný od 6. 6. 2023 v rámci Národního architektonického plánu), testovacích datových setů, vyzkoušených postupů a získaných znalostí jsou v datasetech vyžadovány tyto výstupní formáty pro prostorová data:

  1. Formát GML (Geograhy Markup Language .gml) pro vektorová data nebo objekty s ohledem na dlouhodobou datovou čitelnost a široké využití v oblasti EU.
  2. Pro rastrová data veškeré formáty dle §23 odst. 3 vyhlášky č. 259/2012 o podrobnostech výkonu spisové služby v aktuálním znění. Doporučeným formátem je TIFF (vč. verze pro prostorová data GEOTIFF)
  3. Pro relačně databázové části systémů GIS doporučujeme využít ověřený formát SIARD, tabulková data lze také ukládat ve formátu CSV, kódovaná v UTF-8 a opatřená metadaty, které umožňují zpětný import do databáze (např. soubor createdb.sql)
  4. Dokumentaci, která je přílohou ukládaného datového setu, doporučujeme konvertovat dle § 23 odst. 2 – 4 Vyhlášky

Akceptovanými formáty jsou:

  • Formát OGC GeoPackage (.gpkg), dokumentace tohoto formátu je otevřená a zveřejněná, je možná jeho datová validace a navíc není vyloučeno ani budoucí označení tohoto formátu jako vhodného pro trvalé ukládání prostorových dat. Tento formát doporučujeme využít jako druhou reprezentaci dat v případě, kdy velikost vstupních dat znemožňuje transformaci do formátu .gml. Objemově se jedná o jednotky Gigabytů a s tím spojená technická omezení pro zpracování velkého objemu dat v textové podobě.  Pokud z nějakého důvodu, proběhlo nebo proběhne rozdělení datasetu na menší části do formátu .gml, reprezentaci ve formátu .gpkg je vhodné uložit jako celek, tj. nerozdělenou. Jeho využití jako jediné reprezentace je nutno konzultovat s archivem, protože dlouhodobá čitelnost tohoto formátu zatím není ověřena.
  • Formát JPEG 2000 pro rastrová data v případě bezztrátové komprese
  • Soubory ve formátech obsahující popisné informace k ukládaným datům, např. soubory ve formátech SLD, LYR, LYRX případně i jiné. Objekty tohoto typu, které jsou lidsky čitelné, a editovatelné pomocí dostupných textových editorů, doporučujeme uložit též ve formátu PDF/a a zajistit tak jejich integritu.
  • Formáty rodiny LIDAR
  • Formáty rodiny CAD

Přijímané formáty, u nichž lze předpokládat možnou ztrátu čitelnosti v dlouhodobém časovém horizontu a formátové konverze do nové datové reprezentace buď během ukládacího procesu4, nebo během doby uložení:

  1. ESRI Shapefile (jako sestava povinných komponent .shp, .shx a .dbf a navázaných komponent ve formátech .prj ,.xml, .cpg atp.)
  2. Formáty rodiny Golden Software (.gpj,.grd,.grf,.gsf,.gsi,.gsr,.srf)
  3. Formáty rodiny CAD (.dwg, .dwf, .dxf, .dgn a další)

1 Další možnou strategii trvalého uchovávání, emulaci, v současné době Národní archiv standardně nevyužívá a nemá zařazenu do běžných postupů, zejména z důvodu značných nároků na technické a licenční zajištění. I když ani tyto postupy nejsou vyloučeny, je tato metodika plně orientovaná výhradně na metodu migrace formátů

2 V Metodice srv. též příl. 9 a 10.

3 http://switchfromshapefile.org, https://www.gis-blog.com/geopackage-vs-shapefile/ 

4 Tímto se rozumí, že objekty datasetu budou uloženy v originálních formátech i s vědomím, že šance na jejich dlouhodobou čitelnost je velmi malá, a proto bude předmětem uložení i datová reprezentace v některém z výstupních nebo alespoň akceptovaných formátů i za cenu datové ztráty (pokud možno co nejmenší), neboť data uložená v proprietární podobě není možné ve všech případech migrovat do formátů doporučených v Příloze  č. 10 Metodiky


Katalog formátů


GeoPackage[zdroj]

Mimetype: application/geopackage+sqlite

Extenze: .gpkg

PUID: neuveden (příp. fmt/ 729)

Stručná charakteristika:

Otevřený, na platformě nezávislý a na standardech založený datový formát pro přenos
informací, implementovaný jako databázový kontejner SQLite. Byl definován Open Geospatial Consortium (OGC), publikovaný v roce 2014.

Pravidla a požadavky na kontejner SQLite se řídí standardem GeoPackage Encoding Standard, který definuje schéma, včetně definic tabulek, integrity, omezení formátu a omezení obsahu. Je možná jeho validace.

Archivní zhodnocení:

  • obsahuje vektorová i rastrová data
  • textový soubor – ne
  • kontejner – ano
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ano
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven (GDAL, QGIS, GeoServer, Esri ArcGIS, Compusult, Hexagon, Envitia MapLink, GeoTools, National Geospatial-Intelligence Agency, FME aj.)
  • rozšíření: formát má podporu vládních, komerčních i open source organizací
  • velikost: je mírně úspornější než Shapefile, poměrně rychlý při prostorových a databázových filtrech (viz zde a zde)
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – ponechat nebo převod do GML.
  • ponechat původní formát – ano

Závěr:

Formát je vhodný pro trvalé uchovávání.

Tento formát doporučujeme využít jako druhou reprezentaci dat v případě, kdy data ve formátu .gml přesahují velikost 1GB. Pokud z nějakého důvodu, proběhlo nebo proběhne rozdělení datasetu na menší části, např. dle krajů, reprezentaci ve formátu .gpkg je vhodné uložit jako celek, tj. nerozdělenou.

nahoru


[zdroj] https://www.ogc.org/standards/geopackage ; https://www.geopackage.org/ ; https://www.loc.gov/preservation/digital/formats/fdd/fdd000520.shtml; https://kost-ceco.ch/cms/geopackage.html


GML(Geographic Information – Geography Markup Language)[zdroj]

Mimetype: application/gml+xml

Extenze: .gml, .xml

PUID: fmt/1047, x-fmt/227

Stručná charakteristika:

Otevřený, na platformě nezávislý formát založený na specifikaci XML, definován Open Geospatial Consortium (OGC) pro vyjádření geografických rysů. Jedná se o modelovací jazyk pro geografické systémy a také o otevřený formát pro výměnu geografických transakcí a prostorových dat. Je založený na standardu ISO 19136: 2007, vytvořen byl v roce 1998. Umožňuje popis schémat a datových sad, výběr profilů pro určité komunity (např. aplikační schéma pro počasí, letectví aj.). Významná je jeho schopnost integrovat všechny formy geografických informací, včetně konvenčních vektorových nebo spojitých objektů, pokrytí a senzorových dat.

Archivní zhodnocení:

  • obsahuje vektorová data
  • textový soubor – ano
  • kontejner – ne
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ano, umožňuje mít pro každou geometrii definovaný jiný systém
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven (GDAL, QGIS, Esri, ArcGIS, FME, Geomedia, GeoServer s plug-inem pro GML aj.)
  • rozšíření: tvůrci GIS dat není běžně využíván, ale je rozšířen. Jeho použití pro archivní účely je podporováno aktivitami EU, je na něm vystavěna výměna INSPIRE dat.
  • velikost: jeho velikost není limitována, ale soubory s velikostí nad 1 GB, lze velmi omezeně zpracovat. Řešením tak může být rozdělení do více souborů (např. dle krajů).
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – ponechat
  • ponechat původní formát – ano

Závěr:

Formát je doporučený pro trvalé uchovávání, jedná se výstupní formát dle §23 odst 2 Vyhlášky.

Tento formát doporučujeme využít jako formát, do nějž jsou převáděna vektorová data z méně perspektivních formátů.

nahoru


[zdroj] https://www.ogc.org/standards/gml; https://en.wikipedia.org/wiki/Geography_Markup_Language; https://www.loc.gov/preservation/digital/formats/fdd/fdd000296.shtml ; https://is.muni.cz/th/p42lc/text_DP.pdf


KML (Keyhole Markup Language)[zdroj]

Mimetype: application/kml+xml

Extenze: .kml, .xml; .kmz

PUID: fmt/244; fmt/724

Stručná charakteristika:

Formát původně vyvinula společnost Keyhole inc. pro prohlížeč prostorových dat Keyhole Earth Viewer. Keyhole inc. byla zakoupena v roce 2004 společností Google, která technologii zahrnula do portfolia svých produktů. Samotný formát je založený na specifikaci XML, jeho dokumentace byla společností Google zveřejněna a adoptována konsorciem OGC jako standard. Součástí rodiny tohoto formátu je i kontejnerová forma s extenzí .kmz.

Archivní zhodnocení:

  • obsahuje vektorová data
  • textový soubor – ano
  • kontejner –  ne, povoleno pro extenzi .kmz
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ne, vyžadována příloha A dle specifikace
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven (GDAL, QGIS, Esri, ArcGIS, FME, GeoServer aj.)
  • rozšíření: tvůrci GIS dat není běžně využíván s ohledem na velikostní omezení, ale je dostupný jako vhodný formát k snadnému zobrazování prostorových dat pomocí aplikace Google Earth
  • velikost: limitována na 10MB pro KML, 3MB pro kontejner KMZ
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – ponechat
  • ponechat původní formát – ano

Závěr:

Formát je akceptovaný pro trvalé uchovávání.

nahoru


[zdroj] https://www.ogc.org/standards/kml; https://www.loc.gov/preservation/digital/formats/fdd/fdd000340.shtml; https://www.nationalarchives.gov.uk/PRONOM/fmt/244; https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=1523


EO-GeoJSON, CityJSON (JavaScript Object Notation JSON)[1]

Mimetype: application/geo+json

Extenze: .geojson

PUID:  fmt/1367

Stručná charakteristika:

Formát Javascript Object Notation je formát využívaný pro datovou výměnu prostorových prvků včetně neprostorových atributů pomocí všeobecně známého kódování JSON.  Implementace GeoJSON podporuje geometrické vektorové typy odvozené ze specifikace OGC Simple Features. Výhodou tohoto formátu je lidská čitelnost, nevýhodou pak absence schématu. Z tohoto důvodu je formát založen na normativním kontextu JSON-LD, který umožňuje explicitně definovat každou vlastnost jako URI, a jeho kódování je určeno schématem JSON [OR18] pro potřeby validace.

Archivní zhodnocení:

  • obsahuje vektorová data
  • textový soubor – ano
  • kontejner – ne
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ano, umožňuje mít pro každou geometrii definovaný jiný systém
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven (GDAL, QGIS, Esri, ArcGIS, FME, Mapserver, GeoServer aj.)
  • rozšíření: tvůrci GIS dat není běžně využíván, ale je rozšířen. Jeho použití pro archivní účely je podporováno aktivitami EU, je na něm vystavěna výměna INSPIRE dat.
  • velikost: není limitována, ale soubory s velikostí nad 1 GB, lze velmi omezeně zpracovat. Řešením tak může být rozdělení do více souborů podobně jako u GML, příp. využít rozdělení pomocí sítě.
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – ponechat
  • ponechat původní formát – ano

Závěr:

Formát je vhodný pro trvalé uchovávání a je možné jej využít jako alternativu preferovaného výstupního formátu GML.

nahoru


[1] https://www.loc.gov/preservation/digital/formats/fdd/fdd000382.shtml; http://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=2185; https://datatracker.ietf.org/doc/html/rfc7946; https://www.ogc.org/standards/eo-geojson; https://docs.ogc.org/cs/20-072r2/20-072r2.html; https://github.com/glenrobertson/leaflet-tilelayer-geojson  


Interlis 1 a Interlis 2 [1]

Mimetype: application/Interlis

Verze 1 Extenze: verze 1 .ili (model), .itf (výměna dat)

PUID: verze 1 fmt/1013; fmt/1014;

Verze 2 Extenze:.xtf (model); .xml (výměna dat)

PUID: : verze 2.2 fmt/1012; verze 2.3 fmt/654; fmt/1011; verze 2.3 fmt/653;

Stručná charakteristika:

Formát spravuje instituce KOGIS (koordinace, geoinformace a služby) ve spolupráci s odbornou skupinou eCH INTERLIS; KOGIS poskytuje potřebné informace a dokumenty (více na https://www.kogis.ch/). Spolkový topografický úřad provozuje také vlastní informační stránku INTERLIS (http://interlis.ch/), kde jsou k dispozici všechny specifikace formátu.

Oproti jiným výměnným formátům pro vektorová data, je v INTERLIS datový model uložen odděleně od vlastních prostorových dat, tj. jednotný datový model lze použít pro několik datasetů. U datasetu se tak musí shodovat verze formátu přenosového souboru INTERLIS 1 (.itf Transfer File) a souvisejícího modelu INTERLIS 1 (.ili Model File).

Archivní zhodnocení:

  • obsahuje vektorová data
  • textový soubor – ano
  • kontejner – ne
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ano, umožňuje mít pro každou geometrii definovaný jiný systém
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – QGIS, FME, ESRI GDB, PostGIS, nástroje vyvíjené na území Švýcarské federace (ili2c, umleditor, eg/Check*, ilivalidator, ili2db, ili2fme),
  • rozšíření: Jeho využití je prakticky výhradně omezeno na území Švýcarské federace a je využíván i pro archivní účely.
  • velikost: není limitována, ale u souborů s velikostí nad 1 GB, lze předpokládat obdobné obtíže jako u formátů GML a GeoJSON.
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – ponechat
  • ponechat původní formát – ano

Závěr:

Formát je vhodný pro trvalé uchovávání a je akceptovaný. S ohledem na malou rozšířenost tohoto formátu doporučujeme původcům a tvůrcům prostorových dat využívat formát GML.

nahoru

[1] https://www.interlis.ch; https://kost-ceco.ch/cms/interlis-1.html; https://kost-ceco.ch/cms/INTERLIS-2.html;   http://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=1819;https://www.swisstopo.admin.ch/de/swisstopo/organisation/kogis.html


TIFF (Tagged Image File Format nebo Tag Image File Format)[1]

Mimetype: image/tiff

Extenze: .tiff, .tif., .xml

PUID: fmt/353,  (fmt/7; fmt/8; fmt/9; fmt/10)

Stručná charakteristika:

TIFF je de facto standardem a zároveň proprietárním formátem společnosti Adobe. Původně byl koncipován jako výměnný formát pro digitalizaci obrázků (vytvořen v roce 1986), poté se díky své univerzálnosti vyvinul v preferovaný formát pro obrazová data.

Definuje jej soubor značek (tagů), které popisují vlastnosti obrázku nebo více obrázků, jež obsahuje. Je velmi flexibilní, může např. využívat různé komprese (např. Packbits, CCITT G3&4, JPEG, LZW).

Specifikace TIFF 6.0 definuje tak zvaný „Baseline TIFF“ (základní TIFF), který by měly podporovat všechny aplikace pracující s TIFF a v této verzi je i vyžadován pro trvalé uchovávání.

Archivní zhodnocení:

  • obsahuje rastrová data
  • textový soubor – ne, je binární
  • kontejner – ano
  • obsahuje GIS metadata – ne
  • obsahuje souřadnicový systém – ne, je nutné předávat alespoň se souborem World File TFW[]
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – je velmi rozšířený,
  • podpora řady nástrojů a knihoven (GDAL, QGIS, Esri, ArcGIS, FME, GeoServer, GRASS aj.)
  • rozšíření: je běžně využíván pro statickou prezentaci GIS dat, jako rastrový podklad a pro georeferencování
  • velikost: sice umožňuje širokou škálu komprese, pro trvalé uchování jsou akceptována pouze nekomprimovaná data, příp. komprimována bezztrátově.[6]
  • možnost další interoperability (strojové vytěžení): ne
  • doporučení pro převod do jiného formátu – ponechat, pokud možno doplnit o související soubory (viz níže) nebo převést do GeoTIFF
  • ponechat původní formát – ano

Závěr:

Formát TIF/TIFF v revizi 6, nekomprimovaný, je vhodný pro trvalé uchovávání statických obrázků, pro něž je již dnes tzv. výstupním datovým formátem podle § 23 odst. 3 Vyhlášky. Dále je doporučen pro trvalé ukládání digitalizátů[7] Pro prostorová data je však vhodnější formát, který z TIFF vychází, a to  GeoTIFF.

Při ukládání geoprostorových rastrových dat ve formě georeferencovaných rastrových obrázků a souborů se sítí, je doporučeno vytvořit následující sestavu[8]:

1. soubor TIFF pro rastrový objekt

2. soubor TFW pro lokalizaci rastrového objektu

3. soubor PRJ pro uložení a popis použitého koordinačního a referenčního systému (CRS)

4. soubor např. Geopackage[9] pro uložení dlaždicového schématu nebo prostorového pokrytí

nahoru


[1]TIFF (archive.org); https://www.loc.gov/preservation/digital/formats/fdd/fdd000022.shtml; https://kost-ceco.ch/cms/kad_tiff_de.html; https://training.gismentors.eu/open-source-gis/formaty/rastr.html

[5] Externí soubor obsahující 6 řádků textu: velikost pixelu ve směru osy X, rotace okolo osy Y, rotace okolo osy X, velikost pixelu ve směru osy Y, souřadnice X středu levého-horního pixelu, souřadnice Y středu levého-horního pixelu. Pokud se soubor worldfile jmenuje stejně jako soubor TIFF a má koncovku .tfw, tak jej většina GIS automaticky použije; https://www.loc.gov/preservation/digital/formats/fdd/fdd000287.shtml

[6] https://www.dpconline.org/docs/technology-watch-reports/2478-preserving-raster-images/file

[7] https://www.nacr.cz/wp-content/uploads/2019/05/metodika2015.pdf, str. 21; metodika FADGI, Dostupné z: http://www.digitizationguidelines.gov/guidelines/FADGI_Still_Image_Tech_Guidelines_2016.pdf

[8] Srv. metodika EARK: Guideline for CITS Geospatial, Appendix 2, Long-Term preservation format Profile for Geospatial Raster data using TIFF baseline 6

[9] https://gdal.org/programs/gdaltindex.html


GEOTIFF[1]

Mimetype: image/tiff

Extenze: .tiff, tif

PUID: fmt/155[2]

Stručná charakteristika:

GeoTIFF je založen na standardním formátu TIFF v revizi 6, ke kterému jsou přidána metadata určující jeho prostorové umístění a souřadnicový systém (matice čísel je doplněna o georeferenci, tzn. umístění v geografickém prostoru). Formát byl vyvinut na začátku 90. let

Archivní zhodnocení:

  • obsahuje rastrová data
  • textový soubor – ne, je binární
  • kontejner – ano
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ano
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven (GDAL, QGIS, Esri, ArcGIS, FME, GeoServer, GRASS aj.)
  • rozšíření: rozšířený, jde o obvyklý výměnný formát pro georeferencované rastrové objekty mezi různými GIS nástroji.
  • velikost: pro trvalé uchování jsou akceptována nekomprimovaná data, příp. komprimována bezztrátově.[3]
  •  možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – TIFF nebo ponechat
  • ponechat původní formát – ano

Závěr:

GeoTIFF je vhodný pro trvalé uchovávání rastrových prostorových dat, ale nepatří mezi současné výstupní datové formáty podle § 23 odst. 3 Vyhlášky.

nahoru


[1] https://www.ogc.org/standards/geotiff; https://www.loc.gov/preservation/digital/formats/fdd/fdd000279.shtml

[2] https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=798

[3] https://www.dpconline.org/docs/technology-watch-reports/2478-preserving-raster-images/file


JPEG (Joint Photographic Experts Group Interchange Format)[1]

Mimetype: image/jp2, image/jpeg2000, image/jpeg2000-image, image/x-jpeg2000-image

Extenze: . .jp2; .jp2, .jpg2, .j2c (.jpc, .j2k)

PUID: x-fmt/392

Stručná charakteristika:

JPEG 2000 je standard pro kompresi obrazu založený na vlnkové transformaci. Soubor vyvinutý skupinou Joint Photographic Experts Group (JPEG) pro statické snímky používá základní kódování JPEG 2000. Byl navržen tak, aby kompenzoval několik nevýhod formátu JPEG. Nabízí zejména metodu ztrátové i bezztrátové komprese. V části 2 normy je definován rozšířený formát souboru (.jpx), který zahrnuje mechanismy pro animaci a pro spojování různých proudů kódu do jednoho obrázku. Je založen na standardu ISO/IEC 15444.

Archivní zhodnocení:

  • obsahuje rastrovou grafiku
  • textový soubor – ne, je binární
  • kontejner – ano
  • obsahuje GIS metadata – ne
  • obsahuje souřadnicový systém – ne
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven
  • rozšíření: v GIS rozšířený jako formát pro export a vizualizace; jinak pro digitalizaci a ukládání obrázků[3]
  • velikost: Při stejném kompresním poměru poskytuje lepší kvalitu nežli starší standard JPEG. Naopak při použití bezeztrátové metody dosahuje většinou lepšího kompresního poměru než formát PNG.
  •  možnost další interoperability (strojové vytěžení): ne
  •  doporučení pro převod do jiného formátu – převést do výstupního datového formátu dle § 23 odst. 3 Vyhlášky
  • ponechat původní formát – ano

Závěr:

JPEG 2000 je velmi nadějným a akceptovaným formátem[4] pro trvalé uchovávání statických obrázků, vizualizace, náhledy prostorových dat a pro další součásti dokumentace. Není však výstupním datovým formátem podle § 23 odst. 3 Vyhlášky a proto by měl být v datovém balíčku doplněn o reprezentaci ve výstupním formátu.

nahoru


[1] ISO/IEC 15444-1:2004: Information technology — JPEG 2000 image coding system: Core coding system https://www.iso.org/standard/37674.html ; https://www.loc.gov/preservation/digital/formats/fdd/fdd000143.shtml; https://kost-ceco.ch/cms/jpeg2000.html

[3] metodika FADGI, Dostupné z: http://www.digitizationguidelines.gov/guidelines/FADGI_Still_Image_Tech_Guidelines_2016.pdf

[4] Např. specifikace PDF/A 2 umožňuje jeho použití (srv.  ISO 19005-2:2011), je vhodný pro trvalé ukládání digitalizátů; JPEG 2000 – a Practical Digital Preservation Standard? DPC Technology Watch Report 08-01 2008 Dostupné z: http://www.dpconline.org/docs/technology-watch-reports/87-jpeg-2000-a-practical-digital-preservation-standard/file


PNG  (Portable Network Graphics) [pozn]


Mimetype: image/png

Extenze: .png

PUID: x-fmt/11; x-fmt/12; x-fmt/13

Stručná charakteristika:

PNG byl vytvořen s cílem poskytovat bezztrátový, přenosný, komprimovaný formát pro uložení rastrových dat. Lze jím nahradit jiné formáty jako např. TIFF. Je vhodný pro použití v online prostředí, podporuje indexování barev, stupně šedi, gama, chromatičnost a detekuje poškození souboru.

Archivní zhodnocení:

  • obsahuje rastrovou grafiku
  • textový soubor – ne, je binární
  • kontejner – ne
  • obsahuje GIS metadata – ne
  • obsahuje souřadnicový systém – ne
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven
  • rozšíření: rozšířený jako formát pro export a vizualizace; tak i pro digitalizaci a ukládání obrázků
  • velikost: Při použití bezeztrátové metody dosahuje většinou horšího kompresního poměru než formát JPEG 2000.
  •  možnost další interoperability (strojové vytěžení): ne
  •  doporučení pro převod do jiného formátu – ponechat, výstupní formát dle § 23 odst. 3 Vyhlášky
  • ponechat původní formát – ano

Závěr:

PNG je vhodný pro trvalé uchovávání statických obrázků, např. statické vizualizace a náhledy prostorových dat, lze jej použít pro dokumentaci. Patří mezi tzv. výstupní datové formáty podle § 23 odst. 3 Vyhlášky. Je doporučený od Library of Congress pro uchování digitálních fotografií, digitálních obrázků a dále 2D a 3D počítačově vytvořených rasterových obrázků.

poznámka https://www.loc.gov/preservation/digital/formats/fdd/fdd000153.shtml; https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=666; https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=1740; https://gdal.org/drivers/raster/png.html – raster-png

nahoru


GIF (Graphics Interchange Format)[pozn]

Mimetype: image/gif

Extenze: .gif

PUID: x-fmt/3; x-fmt/4

Stručná charakteristika:

Formát Graphics Interchange format jet bitmapovým obrázkem široce využívaným na síti internet. Jedná se prakticky o kontejner, který obsahuje záhlaví, popisnou část, kterou následuje jedna nebo více obrazových sekcí a ukončovací částí. Podporována je 1 až 8 bitová hloubka barev, prokládání a průhlednost, obrázky jsou ukládány pomocí bezztrátové komprese LZW.

Archivní zhodnocení:

  • obsahuje rastrovou grafiku
  • textový soubor – ne, je binární
  • kontejner – ano
  • obsahuje GIS metadata – ne
  • obsahuje souřadnicový systém – ne
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven
  • rozšíření: využívaný jako formát pro ukládání obrázků obsahujících nízký počet barev nebo pro malé dynamické obrazové dokumenty (animace a klipy).
  • možnost další interoperability (strojové vytěžení): ne
  •  doporučení pro převod do jiného formátu – ponechat
  • ponechat původní formát – ano

Závěr:

GIF je výstupním formátem pro dynamické obrazové dokumenty dle §23 odst. 4 Vyhlášky a jedná se vhodný formát k uložení dokumentace prostorových dat, kdy je součástí dokumentace např. webová stránka, která data zveřejňovala nebo propagovala.

nahoru


[poznámka] http://giflib.sourceforge.net/; https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=619; https://www.loc.gov/preservation/digital/formats/fdd/fdd000133.shtml; https://gdal.org/drivers/raster/gif.html – raster-gif 


Esri Shapefile[pozn]

Mimetype: pro .shp a .shx x-gis/x-shapefile; pro dbf application/octet-stream nebo text/plain

Extenze: .shp + .shx + .dbf a další (.sbn; .sbx; .atx; .fbn; .fbx; .ain; .aih; .ixs; .mxs; prj; xml; cpg.)

PUID: x-fmt/235[2], fmt/277[3]

Stručná charakteristika:

Jedná se o proprietární formát společnosti Esri, ale dokumentace byla v roce 1998 zveřejněna a licence uvolněna s cílem podpořit interoperabilitu mezi aplikacemi GIS. Formát Shapefile uchovává netopologické geometrické a atributové informace o prostorových prvcích v datové sadě. Skládá se minimálně z hlavního souboru *.shp – geometrie (shape), indexového souboru *.shx – propojení geometrie a atributů (index) a tabulky dBASE *.dbf – atributy (databáze). Soubory mají stejný název a liší se koncovkou.

Archivní zhodnocení:

  • obsahuje vektorová data
  • textový soubor – ne, je binární
  • kontejner – ne, jedná se o skupinu formátů
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ano
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven (GDAL, QGIS, Esri, ArcGIS, FME, GeoServer, GRASS aj.)
  • rozšíření: Je podporován prakticky všemi nástroji GIS a ve své době se stal v podstatě oborovým standardem a formátem pro výměnu dat díky uvolnění dokumentace a možnosti jeho implementace v software třetích stran. Je však zastaralý (problémy plynoucí z kombinace více souborů, omezení v názvech atributů, omezení celkové velikosti, neznámá znaková sada, neobsahuje topologii)[4].
  • velikost: omezena na 2 GB. Formát je nejužitečnější pro rychlý zápis jednoduchých prvků a atributů, protože ve formátu Shapefile existují omezení týkající se geometrie i atributů. Tato omezení však mohou způsobit ztrátu dat při použití Shapefile pro obsah nebo výměnu složité geometrie nebo atributů.
  •  možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – GML, příp. GeoPackage; model objektu v PDF/A
  • ponechat původní formát – ano

Závěr:

Esri Shapefile je sice velice rozšířený, není však vhodný pro trvalé ukládání. Proto je vyžadována jeho migrace do GML nebo GeoPackage, vizualizaci náhledu lze uložit ve výstupním datovém formátu (§ 23 odst. 2 a 3 Vyhlášky).

nahoru


[poznámka] https://www.esri.com/content/dam/esrisites/sitecore-archive/Files/Pdfs/library/whitepapers/pdfs/shapefile.pdf; https://www.loc.gov/preservation/digital/formats/fdd/fdd000280.shtml; https://training.gismentors.eu/open-source-gis/formaty/vektor.html#shapefile

[2] https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=328

[3] https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=1017

[4] https://www.cagi.cz/upload/documents/givs2015/cepicky_shapefile_must_die.pdf


Esri Grid[1]

Mimetype: image /adf;

Extenze: .adf,

PUID: x-fmt/218

Stručná charakteristika:

Esri Grid je proprietární formátem používaným v software ArcGis pro rastrová data. Jedná se o standardní rastrová data v podobě sítě polí v řádcích a sloupcích, tzv. dlaždice, které reprezentují prostorové fenomény. Rastrová data v tomto formátu v sobě obsahují souřadnicová data. Jednotlivé bloky jsou uloženy v komprimované podobě a ve vysoké kvalitě.

Archivní zhodnocení:

  • obsahuje rastrová data
  • textový soubor – ano, může mít i ASCI podobu
  • kontejner – ne
  • obsahuje GIS metadata – ne
  • obsahuje souřadnicový systém – ano
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven (GDAL, QGIS, Esri, ArcGIS, FME, GeoServer, GRASS aj.)
  • rozšíření: Je podporován prakticky všemi nástroji GIS a ve své době se stal v podstatě oborovým standardem a formátem pro výměnu dat díky uvolnění dokumentace a možnosti jeho implementace v software třetích stran.
  • velikost: omezena povolenou kvalitou 4 000 000 x 4 000 000 polí
  •  možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – TIFF, GeoTIFF
  • ponechat původní formát – ano

Závěr: Esri Grid není vhodný pro trvalé uložení, jedná se sice o nativní formát využívaný v GIS systému, který je široce využíván po celém světě a přestože se jedná o textový formát, doporučujeme datový balíček obohatit o datovou reprezentaci v některém z výstupních formátů dle §23 odst. 2 ne odst. 3 Vyhlášky.

nahoru


[poznámka] https://desktop.arcgis.com/en/arcmap/10.3/manage-data/raster-and-images/esri-grid-format.htm; https://www.loc.gov/preservation/digital/formats/fdd/fdd000421.shtml; https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=309; https://gdal.org/drivers/raster/aig.html – raster-aig 


Esri BIL, BIP, BSQ[1]

Mimetype: image/BIL; image/BIP; image/BSQ

Extenze: .bil; .bip; .bsq

PUID: x-fmt/1238; x-fmt/1239;  x-fmt/1240

Stručná charakteristika:

BIL, BIP a BSQ samy o sobě nejsou obrazovými formáty, ale jsou to pouze schémata pro ukládání skutečných hodnot pixelu obrázku do souboru. Tyto soubory podporují zobrazení jednopásmových a vícepásmových obrázků a zpracovávají černobílá data, data ve stupních šedi, pseudobarvy, věrné barvy a multispektrální obrazová data.

Data ve formátech BIL, BIP a BSQ  mají binární podobu a aby byly správně interpretovány ze strany software, musí mít přidružené záhlaví souboru ASCII. Tento soubor záhlaví obsahuje pomocná data o obrázku, jako je počet řádků a sloupců v obrázku, pokud existuje barevná mapa, a zeměpisná šířka a délka. Na základě implementace formátu BIP je založen známý formát TIFF.[2]

Archivní zhodnocení:

  • obsahuje rastrová data
  • textový soubor – ne, jedná se o binární data
  • kontejner – ne
  • obsahuje souřadnicový systém – ano
  • obsahuje GIS metadata – ano
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – ArcGIS Desktop/PRO,  FME,  QGIS)
  • rozšíření: Formát je známý, ale nahrazen modernějším TIFF
  • velikost: není limitována
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – migrovat do GeoTIFF/TIFF
  • ponechat původní formát – ano

Závěr:

Přestože jsou Esri formáty BIL, BIP a BSQ  de facto předchůdci výstupního formátu TIFF, tak se nejedná o formáty vhodné k trvalému uchování. Proto doporučujeme datový balíček obohatit o datovou reprezentaci v některém z výstupních formátů dle §23 odst. 2 ne odst. 3 Vyhlášky zejména z důvodu zastaralosti těchto formátů.

nahoru


[poznámka] https://desktop.arcgis.com/en/arcmap/10.3/manage-data/raster-and-images/bil-bip-and-bsq-raster-files.htm; https://www.loc.gov/preservation/digital/formats/fdd/fdd000305.shtml; https://www.loc.gov/preservation/digital/formats/fdd/fdd000304.shtml; https://www.loc.gov/preservation/digital/formats/fdd/fdd000306.shtml; https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=2056; https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=2057;

https://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=2058;

[2] Conference Proceedings of Mining multimedia and complex data: KDD Workshop MDM/KDD 2002, str. 104 dostupné z https://books.google.com/books?id=Yiw1EaNUOQ8C&pg=PA104&lpg=PA104&dq=TIFF+BIP+band-interleaved


Formát LIdar/LiDAR/LADAR[pozn]

Mimetype: Application/Lidar

Extenze: .laz, .las

PUID: fmt/367; fmt/368; fmt/369

Stručná charakteristika:

Binární datový formát využívaný v mnoha vědeckých oborech pro výměnu dat dálkového optického výzkumu Země a také k tvorbě rastrových map ve vysokém rozlišení.

Archivní zhodnocení:

  • obsahuje rastrová data
  • textový soubor – ne, je binární
  • kontejner – ne
  • obsahuje souřadnicový systém – ano
  • obsahuje GIS metadata – ano
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – ArcGIS Desktop/PRO, DWG True View, FME, Global Mapper, QGIS)
  • rozšíření: Formát je rozšířený
  • velikost: není limitována
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – migrovat do GeoTIFF/TIFF
  • ponechat původní formát – ano
  • limitovány pouze Variabilní datové typy na 65,535 bytů, rozšířené mohou mít větší objem

Závěr:

Formát není vhodný pro trvalé uchovávání. Pro tento formát je vyžadována migrace druhé datové reprezentace do formátu GeoTIFF nebo TIFF, v takovém případě lze datový balíček SIP předat k trvalému uložení.

nahoru


[poznámka] https://www.loc.gov/preservation/digital/formats/fdd/fdd000418.shtml; https://library.carleton.ca/guides/help/lidar-formats; http://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=listReport; https://www.asprs.org/divisions-committees/lidar-division/laser-las-file-format-exchange-activities; http://www.asprs.org/wp-content/uploads/2019/03/LAS_1_4_r14.pdf 


GPJ, GRD, GRF, GSB, GSI, GSR, SRF  (Formáty Golden Software)[pozn]

Mimetype: application/Dataset

Extenze: .gpj; .grd; .gsb; .gsi, .gsr, .gsr2, .srf

PUID:

Stručná charakteristika:

Proprietární datové formáty používané nástroji vyvíjenými společností Golden Software. Nástroje Surfer, Grapher, Strater, Voxler jsou využívány pro tvorbu prostorových dat, jako je modelování zemského povrchu, půdní stratigrafie, důlní díla, znečištění půdy, znečištění podzemních vod, seismologie, meteorologie, archeologie atd. a umožňují analýzu včetně 3D modelování těchto fenoménů.

Archivní zhodnocení:

  • formáty se dělí na soubory s mřížkou, datové sestavy, rastrové mapy a vektorové mapy
  • textový soubor – ne, soubory jsou binární, výjimkou jsou pouze mřížková data .grd, která mohou mít formu ASCII
  • kontejner –  ano
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ne (výjimkou jsou soubory .gsr)
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – omezený – omezená podpora (nástroje Golden Software, GDAL, FME)
  • rozšíření: Golden Software je v České republice omezeně využíván pro mapování, modelování, projektování a analýzy prostorových fenoménů
  • velikost: limity nezjištěny
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – ponechat
  • ponechat původní formát – ano

Závěr:

Formáty používané nástroji Golden Software nejsou vhodné pro trvalé uchování, ale s ohledem na rizika datové ztráty spojené s datovou konverzí je doporučujeme do datového balíčku SIP uložit jako jednu datovou reprezentaci v originálních formátech. Datový balíček SIP zároveň vyžadujeme obohatit o datovou reprezentaci v některém z metodikou doporučených formátů. Pro statická rastrová data dle §23 odst. 3 Vyhlášky, pro dynamická rastrová data dle §23 odst. 4 Vyhlášky, PDF/A-4. Vektorové mapy lze exportovat do formátu SHP File, a ten pomocí open source nástroje QGIS konvertovat např. do formátu Geopackage. Pro datové soubory s hodnotami je možné využít např. formát SIARD nebo CSV ve znakové sadě UTF8 a doplnit metadaty, která umožní import dat do databáze.

nahoru


[poznámka] https://support.goldensoftware.com/hc/en-us/articles/226629527-The-difference-between-GPJ-and-GRF-files-in-Grapher; http://surferhelp.goldensoftware.com/subsys/subsys_gsi_grd_file_format.htm; http://grapherhelp.goldensoftware.com/subsys/subsys_gsb_goldensoftware_boundary_file_desc.html; http://surferhelp.goldensoftware.com/subsys/subsys_gsigsi_hid_gsigsi_filedesc.htm; https://gdal.org/drivers/raster/gsag.html; https://support.goldensoftware.com/hc/en-us/articles/227882008-Surfer-Supported-File-Formats

https://support.goldensoftware.com/hc/en-us/articles/115005530868-What-File-Format-Should-I-Export-from-Surfer- –


SIARD (Software-Independent Archiving of Relational Databases)[pozn]

Mimetype: application/database

Extenze: .siard

PUID:  verze 1.0 fmt/161;  verze 2.0 fmt/995, verze  2.1. fmt/1196 )

Stručná charakteristika:

Na software nezávislý formát pro archivaci relačních databází, který je otevřený, založený na standardech, je využíván k trvalému uložení relačních databází a umožňuje migrace mezi relačními prostředími založenými na SQL Standardu. Formát byl vyvinut ve Švýcarsku pro potřeby Švýcarského federálního archivu. Jedná se o kontejner ve formátu ZIP, který obsahuje tabulková data, potřebná metadata ve formátu XML a volitelně extrahuje objekty BLOB a CLOB.

Archivní zhodnocení:

  • obsahuje tabulková data a popisná metadata ve výstupním formátu XML
  • textový soubor – ano
  • kontejner – ano
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ano
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven (Database Preservation Toolkit, SIARDGui, Full Convert)
  • rozšíření: formát má podporu vládních, komerčních i open source organizací
  • velikost: závislá na velikosti ukládané databáze
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu – ponechat
  • ponechat původní formát – ano

Závěr:

Formát je doporučený pro trvalé uchovávání. Tento formát doporučujeme využít pro části GIS, které jsou běžnou relační databází založenou na SQL Standardu bez extenzí pro práci s prostorovými daty a obsahují běžná tabulková data. Tento formát prozatím není vhodný pro vlastní prostorová data, protože SQL Standard neumožňuje některé z funkcí, které jsou obvyklé v systémech GIS. Testování tohoto formátu a případné úpravy pro potřeby trvalého uložení GIS jsou teprve na svém počátku.

nahoru


[poznámka] https://www.loc.gov/preservation/digital/formats/fdd/fdd000426.shtml; http://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=2006;  https://kost-ceco.ch/cms/siard_de.html; https://github.com/DILCISBoard/SIARD; https://github.com/keeps/dbptk-developer/releases; https://github.com/sfa-siard/SiardGui/releases;


CSV (Comma Separated Values)[zdroj]

Mimetype: text/csv

Extenze: .csv

PUID:  x-fmt/18, CSV schema fmt/800

 Stručná charakteristika:

Jednoduchý textový formát využívaný pro ukládání tabulkových dat numerických i textových. Jednotlivé řádky jsou odděleny zalomením a hodnoty ve sloupcích oddělovačem. Každý řádek by měl obsahovat stejné množství polí. Pokud pole obsahuje speciální znak, musí být označeno uvozovkami „pole„. Je povoleno, aby první řádek obsahoval hlavičku s názvem jednotlivých sloupců.

Archivní zhodnocení:

  • obsahuje tabulková data a volitelně popisná metadata
  • textový soubor – ano
  • kontejner – ne
  • obsahuje GIS metadata – ne
  • obsahuje souřadnicový systém – ne
  • neexistuje specifikace
  • rozšíření: formát je široce využíván
  • velikost: závislá na velikosti uložené tabulky
  • možnost další interoperability (strojové vytěžení): ano
  • doporučení pro převod do jiného formátu
  • ponechat původní formát – ano

Závěr:

Formát je akceptovaný pro trvalé uchovávání a je možné jej využít pro uložení tabulkových hodnot využívaných ve spojení s prostorovými daty. Pro tabulkové hodnoty, které jsou využívány v systémech GIS, doporučujeme využít formátu SIARD.

nahoru


[zdroj] https://www.loc.gov/preservation/digital/formats/fdd/fdd000323.shtml; http://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=45; http://www.nationalarchives.gov.uk/PRONOM/Format/proFormatSearch.aspx?status=detailReport&id=1600


PDF/A[1]

Mimetype: application/pdf

Extenze: . pdf

PUID: fmt/95, fmt/354, fmt/476, fmt/477, fmt/478, fmt/479, fmt/480, fmt/481

Stručná charakteristika:

PDF/A je standardizovaná verze formátu PDF (Portable Document Format) podle normy ISO 19005, která je určena pro archivaci a trvalé uchovávání elektronických dokumentů. PDF/A se od PDF liší tím, že zakazuje funkce nevhodné pro trvalé uchování, jako je propojování písem (na rozdíl od vkládání písem), šifrování, komprese, použití JavaScriptu a spustitelných souborů. Požadavky ISO na prohlížeče souborů PDF/A zahrnují pokyny pro správu barev, podporu vložených písem a uživatelské rozhraní pro čtení vložených poznámek. Dosud existují 4 základní verze založené na standardech, všechny jsou výstupním datovým formátem pro textové nebo textové a obrazové dokumenty. Od verze PDF/A-2 může být formát použit jako kontejner, pak je v České republice vyžadováno, aby soubory, které obsahuje, odpovídaly pro trvalé uložení Formátovým pravidlům NA.

Standardy PDF/A:

PDF/A-1- ISO 19005-1 (založen na PDF 1.4)

PDF/A-2 – ISO 19005-2 (založen na PDF 1.7, ISO 32000-1:2008)

PDF/A-3 – ISO 19005-3 (založen na PDF 1.7, ISO 32000-1:2008 s podporou vložených souborů)

PDF/A-4 – ISO 19005-4 (založen na PDF 2.0, ISO 32000-2:2020)

Archivní zhodnocení:

  • textový soubor – ne, je binární
  • kontejner – od verze PDF/A 2 ano
  • obsahuje GIS metadata – ne
  • obsahuje souřadnicový systém – ne
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný – podpora řady nástrojů a knihoven
  • rozšíření: rozšířený jako formát pro export a vizualizace, celosvětově podporovaný formát pro trvalé uchování
  • možnost další interoperability (strojové vytěžení): pokud obsahuje strojově čitelnou vrstvu
  • doporučení pro převod do jiného formátu – je výstupním datovým formátem podle formátu dle § 23 odst. 2 Vyhlášky, lze využít pro statické vizualizace, náhledy
  • ponechat původní formát – ano

Závěr:

Jedná se o archivační formát, již dnes patří mezi tzv. výstupní datové formáty pro texty, kombinované texty s obrázkem. Není určen pro uložení strojově zpracovatelných dat. Při použití PDF/A-3 pro trvalé uložení je vyžadováno, aby soubory, které obsahuje, odpovídaly Formátovým pravidlům NA.

nahoru


[1] https://www.pdflib.com/pdf-knowledge-base/pdfa/the-pdfa-standards/?gclid=EAIaIQobChMIr_Sgtqrv8gIVE5_VCh3zfAzhEAMYASAAEgKiOvD_BwE; https://www.loc.gov/preservation/digital/formats/fdd/fdd000030.shtml ; https://kost-ceco.ch/cms/pdf-a-2.html ; https://kost-ceco.ch/cms/pdf-a-1.html ; kost-ceco | PDF/A-3


PDF Geospatial[zdroj]

Mimetype: application/pdf

Extenze: . pdf

PUID: fmt/1129

Stručná charakteristika:

Formát PDF Geospatial je založen na standardu ISO 32000-1:2020, jedná se o kontejnerové PDF ve verzi 2.0 a skládá se ze záhlaví, těla, které obsahuje objekty tvořící obsah dokumentu, tabulku s odkazy a závěrečné sekce, která umožňuje čitelnost jednotlivých části kontejnerového PDF.

Archivní zhodnocení:

  • textový soubor – ne, je binární
  • kontejner – ano
  • obsahuje GIS metadata – ano
  • obsahuje souřadnicový systém – ano
  • dostupnost (nástroje na tvorbu, prohlížení, převod) – dostupný
  • rozšíření: Lze využít jako formát pro export a vizualizace
  • možnost další interoperability (strojové vytěžení): pokud obsahuje strojově čitelnou vrstvu
  • doporučení pro převod dle § 23 odst. 2 Vyhlášky, nelze využít pro statické vizualizace, náhledy
  • ponechat původní formát – ne

Závěr:

Formát není vhodný pro trvalé uložení v digitálním archivu, je vyžadována datová konverze do PDF/A-4


nahoru

[1] https://helpx.adobe.com/acrobat/using/geospatial-pdfs.html – about_geospatial_pdfs; https://gdal.org/drivers/raster/pdf.html; https://www.nationalarchives.gov.uk/PRONOM/fmt/1129; https://www.loc.gov/preservation/digital/formats/fdd/fdd000474.shtml; https://www.pdflib.com/pdf-knowledge-base/pdf-20/


CAD (.dwg, .dwf, .dxf, .dgn a další)

Formáty CAD (.dwg, .dwf, .dxf, .dgn a další)

CAD (Computer-Aided Design) označuje počítačem podporované návrhy různých výrobků, jako jsou automobily, letadla a budovy. V užším smyslu se jím rozumí kreslení stavebních a architektonických plánů s počítačovou podporou. Produktem je obvykle 2D nebo 3D vektorová grafika s metadaty pro jednotlivé vektorové prvky. Archivace tedy představuje podobný problém jako ukládání dat ze světa GIS, s tím rozdílem, že je využíván jiný software a pro výměnu mezi programy slouží jiné formáty.

Pokud budou nabízena i data ve formátech CAD, pak je doporučeno ponechat původní formát a k němu vytvořit reprezentaci (model) v obecně známém výstupním datovém formátu (PDF/A, příp. JPEG, PNG, srv. Formátová pravidla NA). Jako velmi perspektivní pro trvalé uložení se jeví proprietární, ale značně rozšířený formát DWG (Drawing)[1]. Postup ukládání a příp. tvorby datových balíčků pro data z CAD systémů není v současné době však podrobně definován, konkrétní možnosti je třeba konzultovat ad hoc (podle účelu a způsobu budoucího využití, možností původce a dalších okolností)[2].


nahoru

[1] https://www.loc.gov/preservation/digital/formats/fdd/fdd000445.shtml; https://kost-ceco.ch/cms/dwg.html;

[2] DPC Zpráva o sledování technologií – Uchování CAD (2013), Dostupné z:

https://www.dpconline.org/docs/technology-watch-reports/896-dpctw13-02-pdf/file;