Search results for "Tesseract"
showing 4 items of 4 documents
Latvijas automašīnu numura zīmju atpazīšana no video plūsmas
2015
Darba mērķis Panākt, lai atvērtā pirmkoda numura zīmju atpazīšanas risinājums darbojas ne sliktāk kā komerciālais risinājums. Darba saturs Bakalaura darbā tika pētīts vai atvērtā pirmkoda numura zīmju atpazīšanas risinājums spēj sasniegt tikpat labus rezultātus kā komerciālie risinājumi. Tiek apskatīts vispārējs numura zīmju atpazīšanas algoritms, OpenALPR uzbūve, apmācība un pielāgošana, kā arī veikta atvērtā pirmkoda risinājumu salīdzināšana ar komerciālajiem risinājumiem. Secinājumi Lai gan, izmantojot atvērtā pirmkoda numura zīmju atpazīšanas programmatūru, ir iespējams salīdzinoši precīzi veikt numura zīmes attēla pārveidošanu tekstā, pašas numura zīmes atrašanās vietas noteikšana attē…
New Approaches to OCR for Early Printed Books
2020
Books printed before 1800 present major problems for OCR. One of the main obstacles is the lack of diversity of historical fonts in training data. The OCR-D project, consisting of book historians and computer scientists, aims to address this deficiency by focussing on three major issues. Our first target was to create a tool that identifies font groups automatically in images of historical documents. We concentrated on Gothic font groups that were commonly used in German texts printed in the 15th and 16th century: the well-known Fraktur and the lesser known Bastarda, Rotunda, Textura und Schwabacher. The tool was trained with 35,000 images and reaches an accuracy level of 98%. It can not on…
Text Extraction from Scrolling News Tickers
2020
While a lot of work exists on text or keyword extraction from videos, not a lot can be found on the exact problem of extracting continuous text from scrolling tickers. In this work a novel Tesseract OCR based pipeline is proposed for location and continuous text extraction from scrolling tickers in videos. The solution worked faster than real time, and achieved a character accuracy of 97.3% on 45 min of manually transcribed 360p videos of popular Latvian news shows.
Optiskā simbolu atpazīšana čekos un pavadzīmēs.
2018
Mūsdienu digitizācijas un straujo tehnoloģiju ietekmē dažādu sfēru uzņēmumi steidz optimizēt un vienkāršot savu ikdienu, integrējot tajā pieejamos tehnoloģiskos risinājumus, lai spētu efektīvāk plānot laiku un būt konkurētspējīgi. Tā kā čeku un pavadzīmju apstrāde var būt laikietilpīgs process, tad pēc autora domām optiskās simbolu atpazīšanas sniegtās iespējas varētu būt viens no variantiem kā vienkāršot šo procesu. Galvenais mērķis ir pārliecināties, vai ar brīvi pieejamiem atvērtā pirmkoda risinājumiem ir iespējams veikt simbolu atpazīšanu, lai paātrinātu dokumentu apstrādi. Darba gaitā tiek pētīta optiskā simbolu atpazīšana…