-
Notifications
You must be signed in to change notification settings - Fork 3
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Bolyai-kéziratok #29
Comments
Ezek ha tényleg "kézzel írott kéziratok", akkor az majdnem lehetetlen. Ha gépeltek, vagy bármilyen formában nyomtatottak, akkor sem egyszerű probléma, de lehetséges. Tesseract OCR a jelenleg legjobb, nyílt forráskódú karakterfelismerő szoftver. |
Kézzel írott és néhol németül és latinul is ír és mindenféle kis cetlikre is, csokis papírra is.
Igen, nagyon nehéz feladat. Egyébként a Bolyai-kutatók már 2/3-át ismerik, kiolvasták és írtak róla. Viszont az úgy nem ugyanaz. Egy helyen kiolvasva nincs meg.
2017. ápr. 30. dátummal, 13:07 időpontban Dénes Csala <[email protected]> írta:
… Ezek ha tényleg "kézzel írott kéziratok", akkor az majdnem lehetetlen. Ha gépeltek, vagy bármilyen formában nyomtatottak, akkor sem egyszerű probléma, de lehetséges. Tesseract OCR a jelenleg legjobb, nyílt forráskódú karakterfelismerő szoftver.
—
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub, or mute the thread.
|
Hát így sajnos nagyon nehéz - mert akkor nem OCR-ra, hanem handwriting recognition-ra van szükség... De próbáljuk meg. Létrehozok egy projektet. |
A kéziratok Marosvásárhelyen vannak, a Teleki-Bolyai Könyvtárban. A kéziratról készült fotókat el lehet kérni, kutatás céljából.
Nekem megvan lementve.
Mindjárt küldök néhány oldalt, hogy látható legyen, miről van szó.
2017. ápr. 30. dátummal, 20:44 időpontban Dénes Csala <[email protected]> írta:
… Hát így sajnos nagyon nehéz - mert akkor nem OCR-ra, hanem handwriting recognition-ra van szükség... De próbáljuk meg. Létrehozok egy projektet.
—
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub, or mute the thread.
|
Két féle írásmódja volt Bolyai Jánosnak. Ha magának írt sajátos
betűkészletet használt, akárcsak Leonardo da Vinci, ha másnak írt, akkor
gyöngybetűkkel írt (hogy azokat ne fárassza az olvasással). Mindkét
írásmódról csatoltam egy-egy képet.
2017. április 30. 20:44 Dénes Csala írta, <[email protected]>:
… Hát így sajnos nagyon nehéz - mert akkor nem OCR-ra, hanem handwriting
recognition-ra van szükség... De próbáljuk meg. Létrehozok egy projektet.
—
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub
<#29 (comment)>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/Aa04oParMLUKkJ7Yxdalr2OG_OdpwnO6ks5r1NafgaJpZM4NMP1R>
.
|
Nem találom a csatolmányokat.. |
Köszi. Hadd agyaljak ezen egy pár napig. Kipróbálok majd egy pár megoldást amikor lesz egy kis időm. Bár lehet, hogy létre kell hozzak egy "nagyon nehéz" címkét : ) |
Persze, nyugodtan, nem sűrgös :)
Nézd, ez hasonló feladat:
http://hargitanepe.eu/barki-megkeresheti-felmenoit/
az egyházi anyakönyvek alapján elkészítettek egy adatbázist Erdély
lakosságának adataiból (1850-1914 közötti időszak)
Megnyitva az adatbázist, sok a hiányosság, látszik hogy nem mindent
sikerült "kiolvasni", ami oda volt írva. Itt az adatbázis:
http://hpdt.ro:4080
Üdv.
Ibolya
2017. május 2. 14:45 Dénes Csala írta, <[email protected]>:
… Köszi. Hadd agyaljak ezen egy pár napig. Kipróbálok majd egy pár megoldást
amikor lesz egy kis időm. Bár lehet, hogy létre kell hozzak egy "nagyon
nehéz" címkét : )
—
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub
<#29 (comment)>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/Aa04oLbU5yQXcH4DjHFcyKHGeIpRi_KZks5r1yVwgaJpZM4NMP1R>
.
|
Ez már meglévő projekt :) https://github.com/csaladenes/szekelydata/projects/13 |
Digitális fénykép van minden oldalról, szövegfelismerésre kellene szoftver, majd adatbányászati (szövegbányászati) munka lenne vele. 17 ezer oldalnyi kéziratról van szó.
The text was updated successfully, but these errors were encountered: