Search results for "Tesseract"

showing 4 items of 4 documents

Latvijas automašīnu numura zīmju atpazīšana no video plūsmas

2015

Darba mērķis Panākt, lai atvērtā pirmkoda numura zīmju atpazīšanas risinājums darbojas ne sliktāk kā komerciālais risinājums. Darba saturs Bakalaura darbā tika pētīts vai atvērtā pirmkoda numura zīmju atpazīšanas risinājums spēj sasniegt tikpat labus rezultātus kā komerciālie risinājumi. Tiek apskatīts vispārējs numura zīmju atpazīšanas algoritms, OpenALPR uzbūve, apmācība un pielāgošana, kā arī veikta atvērtā pirmkoda risinājumu salīdzināšana ar komerciālajiem risinājumiem. Secinājumi Lai gan, izmantojot atvērtā pirmkoda numura zīmju atpazīšanas programmatūru, ir iespējams salīdzinoši precīzi veikt numura zīmes attēla pārveidošanu tekstā, pašas numura zīmes atrašanās vietas noteikšana attē…

DatorzinātneLatvijas numura zīmju atpazīšanaTesseractANPROpenCVOpenALPR

researchProduct

New Approaches to OCR for Early Printed Books

2020

Books printed before 1800 present major problems for OCR. One of the main obstacles is the lack of diversity of historical fonts in training data. The OCR-D project, consisting of book historians and computer scientists, aims to address this deficiency by focussing on three major issues. Our first target was to create a tool that identifies font groups automatically in images of historical documents. We concentrated on Gothic font groups that were commonly used in German texts printed in the 15th and 16th century: the well-known Fraktur and the lesser known Bastarda, Rotunda, Textura und Schwabacher. The tool was trained with 35,000 images and reaches an accuracy level of 98%. It can not on…

GermanInformation retrievalHebrewComputer scienceFontKrakenlanguageComparative historical researchTesseractHistory of the booklanguage.human_languageWoodcutDigItalia

researchProduct

Text Extraction from Scrolling News Tickers

2020

While a lot of work exists on text or keyword extraction from videos, not a lot can be found on the exact problem of extracting continuous text from scrolling tickers. In this work a novel Tesseract OCR based pipeline is proposed for location and continuous text extraction from scrolling tickers in videos. The solution worked faster than real time, and achieved a character accuracy of 97.3% on 45 min of manually transcribed 360p videos of popular Latvian news shows.

Information retrievalComputer scienceCharacter (computing)ScrollingExtraction (chemistry)ComputingMethodologies_DOCUMENTANDTEXTPROCESSINGKeyword extractionTesseractPipeline (software)

researchProduct

Optiskā simbolu atpazīšana čekos un pavadzīmēs.

2018

Mūsdienu digitizācijas un straujo tehnoloģiju ietekmē dažādu sfēru uzņēmumi steidz optimizēt un vienkāršot savu ikdienu, integrējot tajā pieejamos tehnoloģiskos risinājumus, lai spētu efektīvāk plānot laiku un būt konkurētspējīgi. Tā kā čeku un pavadzīmju apstrāde var būt laikietilpīgs process, tad pēc autora domām optiskās simbolu atpazīšanas sniegtās iespējas varētu būt viens no variantiem kā vienkāršot šo procesu. Galvenais mērķis ir pārliecināties, vai ar brīvi pieejamiem atvērtā pirmkoda risinājumiem ir iespējams veikt simbolu atpazīšanu, lai paātrinātu dokumentu apstrādi. Darba gaitā tiek pētīta optiskā simbolu atpazīšana…

OCRDatorzinātneTesseractImageMagickPHP

researchProduct