6533b81ffe1ef96bd12775e9
RESEARCH PRODUCT
Neironu tīklu arhitektūras attēlu sintēzei no teksta
Dāgs ĀDams Grīnbergssubject
DALLEDatorzinātneCLIPattēlu sintēzeGANneironu tīklidescription
Attēlu sintēze no teksta, izmantojot mākslīgos neironu tīklus, ir jauns uzdevums datorredzē, tā mērķis: no īsa tekstuāla apraksta ģenerēt atbilstošu un ticamu attēlu. Darbā sniegts apskats par pieejām uzdevuma risināšanā un veikti eksperimenti. Darba teorētiskajā daļā tiek apskatītas 3 GAN pamat-arhitektūras datu sintēzei, 5 GAN arhitektūras attēlu sintēzei no teksta, veikts 61 arhitektūras kvantitatīvs apkopojums par izmantotajām datu kopām, attēlu kvalitātes metriku rezultātiem un koda pieejamību. Tiek apskatītas 3 no populārākajām datu kopām un darbības principi 5 attēlu kvalitātes metrikām. Tiek pētīti transformer tīkli un kombinācijā ļoti labus rezultātus uzrādošie DALLE un CLIP. Darba praktiskajā daļā, izmantojot risinājumu DALLE-pytorch, tiek apmācīti modeļi uz CUB datu kopas, izvēlēts labākais un pārbaudītas tā spējas. 6 GAN modeļiem veikts attēlu sintēzes ātruma apskats.
| year | journal | country | edition | language |
|---|---|---|---|---|
| 2021-01-01 |