ПРОЄКТУВАННЯ ОНТОЛОГІЇ РОЗМІТКИ ДЛЯ СИСТЕМ КЕРУВАННЯ КОНТЕНТОМ

Автор(и)

DOI:

https://doi.org/10.32782/IT/2023-1-9

Ключові слова:

система керування контентом, онтології, розмітка, пошукові роботи

Анотація

Низькі стандарти написання контенту та низькі стандарти пошукової оптимізації (SEO) є головними проблемами в області управління контентом, особливо коли ми говоримо про величезні карти сайту з мільйонами сторінок. Для кожної веб-сторінки однаковий контент може бути представлений для двох цілей: для пошукових роботів, які працюють зі спеціальними схемами розмітки, і для користувачів. Зазвичай, інформація для пошукових роботів обмежена ключовими словами, які з різних причин не можуть чітко описати зміст текстових повідомлень на веб-сторінці. Проблема полягає в синхронізації вмісту як для користувачів, так і для пошукових роботів на всіх мільйонах сторінок. Різні компоненти веб-сторінки мають свій власний стиль і можуть містити деякий контент, що ми також будемо узгоджувати зі змістом сторінки. Найвідоміша схема розмітки була створена лідерами пошукових систем на ринку, а саме: Google, Yahoo, Microsoft та іншими (Schema.org, 2022). Це допомагає роботам пошукових систем краще розуміти контент веб-сторінок. Схему можна розширити за потребою, використовуючи добре задокументовану модель розмітки, включаючи словники, які описують сутності та зв’язки між ними. Ми збираємося вирішити проблеми синхронізації контенту та єдиної форми його представлення для користувачів і для пошукових роботів, тому методи генерації тексту в даній роботі не розглядаються. Звичайно, питання контролю вмісту мільйонів сторінок дуже важко вирішити навіть за допомогою сучасних систем керування контентом (CMS). Таким чином, ми вирішуємо проблеми керування контентом, встановлюючи семантику для схем розмітки веб-сторінок, компонентів веб-сторінок та їхнього контенту за допомогою єдиного представлення знань в онтології розмітки. Запропонований підхід на основі онтології здатний синхронізувати смисл контенту для користувачів і пошукових роботів веб-сторінок і може бути реалізований як додатковий плагін для CMS.

Посилання

Welcome to Schema.org. 2022. URL: https://schema.org/

Deane Barker. Web Content Management. Systems, Features, and Best Practices: O’Reilly Media, 2016. p. 550.

Lyashkevych V., Oksana O., Mirosh O. Logic-Textual and Neuronet Approach to Search Information. Proceedings of the 5th IEEE International Workshop on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications 21-23 September 2009, Rende (Cosenza), Italy. – P.539-543. - DOI: https://doi.org/10.1109/IDAACS.2009.5342920

Lyashkevych V., Olar O., Liashkevych M. Software Ontology Subject Domain Intelligence Diagnostics of Computer Means. The 7th IEEE International Conference on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications, 12-14 September 2013, Berlin, Germany. V.2. pp. 601-606. DOI: https://doi.org/10.1109/IDAACS.2013.6662995

Generating news image captions with semantic discourse extraction and contrastive style-coherent learning / Zhang Z., Zhang H., Wang J., Sun Z., Yang Z. Computers and Electrical Engineering. 2022. V. 104. Part A. DOI: https://doi.org/10.1016/j.compeleceng.2022.108429

Syntax Customized Video Captioning by Imitating Exemplar Sentences / Yuan, Yitian, Ma, Lin, Zhu, Wenwu. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2022. V. 44, I. 12. pp. 10209-10221. DOI: https://doi.org/10.1109/TPAMI.2021.3131618

##submission.downloads##

Опубліковано

2023-06-20