Saved in:
| Main Author: | |
|---|---|
| Format: | Recurso digital |
| Language: | Hungarian |
| Published: |
Zenodo
2024
|
| Subjects: | |
| Online Access: | https://doi.org/10.5281/zenodo.13905488 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Table of Contents:
- <p>A Magyar Közlöny és társlapjai HTML-ként 1945-2022. </p> <p>A Magyar Közlöny 1945. óta jelenik meg, három formátumban tölthető le. A Magyar Közlöny mellékleteként tekinthetők (időszakonként) a Hivatalos Értesítő, a Határozatok Tára és az Indoklások Tára.</p> <p>1945-2009. között az Arcanum Adatbázisban szkennelt PDF-ként vagy JPG-ként érhető el (mintegy 130.000 oldal). A szöveg külön is tölthető, OCR-hibás és formázatlan. </p> <p>Az 1998/1-től 2013/72-es számig a magyarkozlony.hu-ról tölthetünk PDF-et; 2010-ig kéthasábos, elválasztós. A szövegréteg benne meglehetősen formázatlan, az Acrobat DC vagy az Abby FineReader nem is tudja rendesen kinyerni, a hosszú kettős ékezetes magánhangzók változatos karakerekkel és megoldásokkal vannak képviselve. Más kinyerők is küzdenek, pl. két-hárombetűs szavakat találnak. Idáig tehát OCR-re vagy más javító eljárásra van szükség.</p> <p>Kb. 1970-től az OCR megfelelő minőségű. A korábbiak javítására van módszer, ha igény van rá.</p> <p>A 2013/73-as számtól (május 3.) a PDF-ek szépen formázottak, aláírtak, a szövegminőség jó, a bekezdések nem nyúlnak át oldalhatáron, a tartalomjegyzék egyben könyvjelző is. Ezekből könnyű HTML-t csinálni.</p> <p>A jelen sorozat 1945-2022. június 6-ig tart. Az azóta megjelentek HTML-lé alakítása megoldható, ha van rá igény.</p> <p>Ismert hiányosságok: az 1995-ös 100-114. számok hiányoznak.</p>