ПОРІВНЯННЯ РІЗНИХ КОНФІГУРАЦІЙ МОДЕЛІ GAN НА БАЗІ СЕРВІСУ ХМАРНИХ ОБЧИСЛЕНЬ AWS

Автор(и)

DOI:

https://doi.org/10.32782/IT/2022-2-7

Ключові слова:

мова програмування Julia, машинне навчання, машинне мистецтво, Generative adversarial network (GAN), сервіс хмарних обчислень AWS

Анотація

У роботі було розглянуто модель машинного навчання, яка реалізує концепцію машинного мистецтва. За основу було взято такий алгоритм штучного інтелекту як Генеративна змагальна мережа (Generative adversarial network, GAN). Порівняно різні конфігурації цієї моделі. Для реалізації моделі було обрано мову програмування Julia. Також було проаналізовано продуктивність моделі на різних платформах, зокрема на базі сервісу хмарних обчислень AWS. В результаті дослідження було розроблено оптимальну конфігурацію моделі; запропоновано комбінацію підходів для навчання моделі; визначено найбільш продуктивну платформу для навчання моделі. Метою роботи є розробка оптимальної конфігурації системи для ефективного навчання моделі машинного навчання, яка реалізує концепцію машинного мистецтва. Конфігурація системи передбачає такі аспекти як архітектура моделі, алгоритм навчання та платформа, на якій цей алгоритм буде виконуватись. Кожен з цих аспектів опрацьований та запропоновано рішення, яке покаже найкращі результати замірів продуктивності. Методологія вирішення поставленого завдання полягає в проведенні порівняльного аналізу показників продуктивності різних конфігурацій системи, які запроваджені з урахуванням попередніх досліджень моделей машинного мистецтва, які реалізують концепцію машинного мистецтва. Наукова новизна. В ході виконання роботи набув подальший розвиток напрямок застосування мови програмування Julia на базі сервісу хмарних обчислень AWS. Вперше запропоновано ефективний варіант програмної та апаратної конфігурації системи для навчання моделі машинного навчання, яка реалізує концепцію машинного мистецтва. Висновки. Результати даної роботи можуть бути використані для реалізації ефективної системи для навчання моделі машинного навчання, яка реалізує концепцію машинного мистецтва, та в подальших дослідженнях перспектив використання мови програмування Julia в поєднанні з сервісом хмарних обчислень AWS. Всі отримані результати замірів продуктивності та якості навчання різних конфігурації подано в таблицях та графіках.

Посилання

Стаття авторів моделі GAN. [Electronic resource] – Access mode: https://arxiv.org/pdf/1406.2661.pdf

Функція активації maxout, яка була застосована в першій публікації про модель GAN [Electronic resource] – Access mode: https://arxiv.org/pdf/ 1302.4389v4.pdf

Стаття авторів моделі DCGAN [Electronic resource] – Access mode: https://arxiv.org/pdf/1511.06434.pdf

Свідчення спеціалістів, які підтвердили ефективність застосування функції активації LeakyReLU в моделі GAN [Electronic resource] – Access mode: https://www.reddit.com/r/MLQuestions/comments/c96mci/why_do_gans_only_work_with_leaky_relu/

Розділ книги Яна Гудфелоу, присвячений згортковим нейронним мережам [Electronic resource] – Access mode: https://www.deeplearningbook.org /contents/convnets.html

Стаття автора ідеї про додатковий шар BatchNorm в нейронній мережі [Electronic resource] – Access mode: https://arxiv.org/pdf/1502.03167.pdf

Стаття автора ідеї про додатковий шар Dropout в нейронній мережі [Electronic resource] – Access mode: https://www.cs.toronto.edu/~rsalakhu /papers/srivastava14a.pdf

Опис розрахунку функції помилки binary cross-entropy [Electronic resource] – Access mode: https://towardsdatascience.com/understanding-binary-cross-entropy-log-loss-a-visual-explanation-a3ac6025181a

Стаття автора алгоритму зворотного розповсюдження помилки та градієнтного спуску [Electronic resource] – Access mode: https://www.nature.com /articles/323533a0

Стаття автора методу оптимізації алгоритму навчання ADAM [Electronic resource] – Access mode: https://arxiv.org/pdf/1412.6980.pdf

##submission.downloads##

Опубліковано

2022-12-29