Search results for "Tesseract"

showing 4 items of 4 documents

Latvijas automašīnu numura zīmju atpazīšana no video plūsmas

2015

Darba mērķis Panākt, lai atvērtā pirmkoda numura zīmju atpazīšanas risinājums darbojas ne sliktāk kā komerciālais risinājums. Darba saturs Bakalaura darbā tika pētīts vai atvērtā pirmkoda numura zīmju atpazīšanas risinājums spēj sasniegt tikpat labus rezultātus kā komerciālie risinājumi. Tiek apskatīts vispārējs numura zīmju atpazīšanas algoritms, OpenALPR uzbūve, apmācība un pielāgošana, kā arī veikta atvērtā pirmkoda risinājumu salīdzināšana ar komerciālajiem risinājumiem. Secinājumi Lai gan, izmantojot atvērtā pirmkoda numura zīmju atpazīšanas programmatūru, ir iespējams salīdzinoši precīzi veikt numura zīmes attēla pārveidošanu tekstā, pašas numura zīmes atrašanās vietas noteikšana attē…

DatorzinātneLatvijas numura zīmju atpazīšanaTesseractANPROpenCVOpenALPR
researchProduct

New Approaches to OCR for Early Printed Books

2020

Books printed before 1800 present major problems for OCR. One of the main obstacles is the lack of diversity of historical fonts in training data. The OCR-D project, consisting of book historians and computer scientists, aims to address this deficiency by focussing on three major issues. Our first target was to create a tool that identifies font groups automatically in images of historical documents. We concentrated on Gothic font groups that were commonly used in German texts printed in the 15th and 16th century: the well-known Fraktur and the lesser known Bastarda, Rotunda, Textura und Schwabacher. The tool was trained with 35,000 images and reaches an accuracy level of 98%. It can not on…

GermanInformation retrievalHebrewComputer scienceFontKrakenlanguageComparative historical researchTesseractHistory of the booklanguage.human_languageWoodcutDigItalia
researchProduct

Text Extraction from Scrolling News Tickers

2020

While a lot of work exists on text or keyword extraction from videos, not a lot can be found on the exact problem of extracting continuous text from scrolling tickers. In this work a novel Tesseract OCR based pipeline is proposed for location and continuous text extraction from scrolling tickers in videos. The solution worked faster than real time, and achieved a character accuracy of 97.3% on 45 min of manually transcribed 360p videos of popular Latvian news shows.

Information retrievalComputer scienceCharacter (computing)ScrollingExtraction (chemistry)ComputingMethodologies_DOCUMENTANDTEXTPROCESSINGKeyword extractionTesseractPipeline (software)
researchProduct

Optiskā simbolu atpazīšana čekos un pavadzīmēs.

2018

Mūsdienu digitizācijas un straujo tehnoloģiju ietekmē dažādu sfēru uzņēmumi steidz optimizēt un vienkāršot savu ikdienu, integrējot tajā pieejamos tehnoloģiskos risinājumus, lai spētu efektīvāk plānot laiku un būt konkurētspējīgi. Tā kā čeku un pavadzīmju apstrāde var būt laikietilpīgs process, tad pēc autora domām optiskās simbolu atpazīšanas sniegtās iespējas varētu būt viens no variantiem kā vienkāršot šo procesu. Galvenais mērķis ir pārliecināties, vai ar brīvi pieejamiem atvērtā pirmkoda risinājumiem ir iespējams veikt simbolu atpazīšanu, lai paātrinātu dokumentu apstrādi. Darba gaitā tiek pētīta optiskā simbolu atpazīšana…

OCRDatorzinātneTesseractImageMagickPHP
researchProduct