6533b81ffe1ef96bd12775e9

RESEARCH PRODUCT

Neironu tīklu arhitektūras attēlu sintēzei no teksta

Dāgs ĀDams Grīnbergs

subject

DALLEDatorzinātneCLIPattēlu sintēzeGANneironu tīkli

description

Attēlu sintēze no teksta, izmantojot mākslīgos neironu tīklus, ir jauns uzdevums datorredzē, tā mērķis: no īsa tekstuāla apraksta ģenerēt atbilstošu un ticamu attēlu. Darbā sniegts apskats par pieejām uzdevuma risināšanā un veikti eksperimenti. Darba teorētiskajā daļā tiek apskatītas 3 GAN pamat-arhitektūras datu sintēzei, 5 GAN arhitektūras attēlu sintēzei no teksta, veikts 61 arhitektūras kvantitatīvs apkopojums par izmantotajām datu kopām, attēlu kvalitātes metriku rezultātiem un koda pieejamību. Tiek apskatītas 3 no populārākajām datu kopām un darbības principi 5 attēlu kvalitātes metrikām. Tiek pētīti transformer tīkli un kombinācijā ļoti labus rezultātus uzrādošie DALLE un CLIP. Darba praktiskajā daļā, izmantojot risinājumu DALLE-pytorch, tiek apmācīti modeļi uz CUB datu kopas, izvēlēts labākais un pārbaudītas tā spējas. 6 GAN modeļiem veikts attēlu sintēzes ātruma apskats.

https://dspace.lu.lv/dspace/handle/7/55805