недеља, 15. јул 2018.

RJEČNIK JAZU - svezak 1



Na sajtu Hrvatske akademije znanosti i umjetnosti (HAZU) u odeljku Digitalna zbirka, stavljen je kompletan "Rječnik hrvatskoga ili srpskog jezika" (Rječnik JAZU).
SAJT

Trenutno se mogu skinuti samo sveske 56, 70 i 81 (fajlovi su dosta veliki, po 309 MB), dok se ostale sveske mogu samo pregledati. Našao sam način kako može da se snimi svaka stranica posebno, ali ovo zahteva dosta vremena, za skidanje 244 stranice prvog sveska bilo mi je potrebno skoro 2 sata, ako se ima brži internet (ja imam mobilni koji nije tako brz) onda mislim da se jedna knjiga može skinuti i brže.
Nakon skidanja svih 244 stranica, spojio sam ih u jedinstven PDF, a nakon toga sam PDF fajl provukao kroz ABBYY FineReader 12, i dobio sam pretraživ (OCR) PDF. Ovo ne zahteva mnogo posla, program sve sam odradi (prevođenje slike u slova).

Iz ovoga se vidi da je najveći deo posla skidanje svake stranice rečnika, i bilo bi dobro, ako ima dobrovoljaca da se pridruži poslu skidanja stranica rečnika. Sa više uključenih enigmata ovo bi se moglo relativno brzo uraditi, recimo 10 enigmata da skine po desetak svezaka, i eto celog rečnika.

Ako neko želi da se uključi u ovaj posao neka ostavi poruku u komentarima, a ja ću mu objasniti kako se snima svaka stranica rečnika (nije uopšte komplikovano, kao kada snimate bilo koju drugu fotografiju sa interneta), sve ostalo bih ja uradio, pravljenje PDF od slika rečnika i izrada OCR PDF-a.

Evo prve sveske OVDE

i prve sveske (pretraživ pdf) OVDE.

PDF se bolje pretražuje u programu "Sumatra" nego u "Adobe Acrobat Reader".

DOPUNA 15.07.2018.
Sveske koje se mogu skinuti direktno sa sajta HAZU su:
11, 56, 70, 76, 81.
sveske br. 1, 54, i 55 možete skinuti sa bloga (pod "knjige u pdf-u).
Trenutno ja skidam svezak br.2, a Živadin Jovanović je krenuo od sveske br.39 (ondje - osobit) jer imamo prvih 8 knjiga (to su sveske od 1-38).
Pošto je kvalitet skena tih 8 knjiga loš, ja sam krenuo od početka od prve sveske.
U međuvremenu sam našao na internetu mnogo bolji sken knjige 4 i 5
knjiga 4 (isprekrižati - kipac) ovo su sveske 13-17 preuzeti OVDE
knjiga 5 (kipak - leken) ovo su sveske 18-23 preuzeti OVDE

Adnane, ako hoćeš da se uključuš u posao skidanja rječnika kreni od poslednje sveske 97.
pošalji mi mejl da ti pošaljem kako da skineš stranicu po stranicu rečnika.




субота, 14. јул 2018.

петак, 13. јул 2018.

"MAJSTORIJE" RAJKA KUZMANOVIĆA


Skandinavke obiluju sa troslovnim skraćenicama (MMO, MMA, ATČ, SRR, IZT, ŠKS, GSI, GLA), čak je i ART opisano kao neka skraćenica.
Zanimljivo je kako je opisan pojam RANA (namirnice????), doduše u Vojvodini se po selima umesto "hrana" i kaže "rana", a onaj udić mogao je opisati i kao kurčić, onda bi to bio vrhunac gluposti.
Rajko Kuzmanović je u svoju bazu ubacio sve moguće i nemoguće skraćenice, i sada mu program izbacuje raznorazne gluposti, a on pošto o enigmatici nema pojma, sve to tako ostavi kako mu kompjuter izbaci sastavljenu ukrštenicu.
Inače skandinavke izgledaju jadno i po sastavu reči (ako izbacimo one silne skraćenice) i po rasporedu crnih polja.

ŠARENE STRANICE IZ "LJETNEG SUPER FENIKSA" BR.92



LJETNI SUPER FENIKS BR.92, 28.06.2018.

TRI KRIŽALJKE 21X13 IZ FENIKSA BR.608



                                           FENIKS BR.608, 26.04.2018. 



уторак, 10. јул 2018.

уторак, 03. јул 2018.

четвртак, 28. јун 2018.