Софтуерни системи и услуги

Автоматична анотация на текст с езикови модели
Автоматичната анотация на текст използва няколко езикови модела, специално обучени за определена езикова задача, които заедно правят последователност от езикови анализи по няколко ключови направления.
Чрез езиков модел се извършва сегментиране на текста по думи и изречения. Те са последвани от лингвистичен анализ на изреченията, извършен паралелно от няколко модела.
Описание на системата.


Претренирани и свободно достъпни езикови модели
Претренираните от нас езикови модели, които използваме в КЛаДА-БГ за различни задачи: задачи за обработка на български език; задачи за векторизиране; задачи за индексиране и др., публикуваме на следния сайт


LABLASS  –Уеббазирана система за представяне и изучаване на словесните асоциации
LABLASS е първата българска уеббазирана система за изследване на словесните асоциации, разработена от екип на Лабораторията по приложна лингвистика към Шуменския университет „Епископ Константин Преславски“ в рамките на работната програма на националния проект CLaDA-BG.
Уебсистемата LABLASS обхваща данните от асоциативни колекции, разработени по проекта CLaDA-BG, както и данни от други речници от българската лексикографска традиция.


LABMETA –Уеббазирана система за представяне и изучаване когнитивните метафори
LABMETA е първата българска уеббазирана система за изследване на когнитивни метафори в българските политически речи,  разработена от екип на Лабораторията по приложна лингвистика (LABLING ) към ШУ в рамките на Националния проект CLaDA-BG.


PHRASO-LAB – Речници на фразеологичните единици
PhrasoLAB-BG е първата уеббазирана платформа за изучаване на български и немски фразеологични единици, свързани с човека като аксиологична система в българската и немската фразеологична картина на света. Платформата е разработена в рамките на националния научен проект „Национална интердисцилинарна изследователска Е-инфраструктура за ресурси и технологии за българско езиково и културно наследство, интегрирана в рамките на европейските инфраструктури CLARIN and DARIAH (КЛаДА-БГ).
PhrasoLAB-BG е електронен ресурс, съдържащ български и немски фразеологични единици.


Български корпус от текстови сегменти
Изработен от Ontotext в рамките на националния научен проект „Национална интердисцилинарна изследователска Е-инфраструктура за ресурси и технологии за българско езиково и културно наследство, интегрирана в рамките на европейските инфраструктури CLARIN and DARIAH (КЛаДА-БГ).
Текстови сегмент е извадка от текст, която показва последователност от няколко съседни езикови елемента (например думи, числа и др.). В Българския корпус от текстови сегменти може да се търси по няколко сегмента, най-много 6. Набор от няколко колекция и възможност за избор за една или повече, където да се търси даден сегмент. Резултатите от търсенето се визуализират в две таблици. Лявата показва размера и честотата на срещане на избрания сегмент, а дясната – левия и десния контекст, дата на публикуване на документа, както и източника, от който е изваден сегментът.


Семантично търсене в актуални новини и интернет съдържание
Изработен от Ontotext в рамките на националния научен проект „Национална интердисциплинарна изследователска Е-инфраструктура за ресурси и технологии за българско езиково и културно наследство, интегрирана в рамките на европейските инфраструктури CLARIN and DARIAH (КЛаДА-БГ).
Търсене в актуални новини, събрани от множество интернет източници и покриващи различни категории (напр. Икономика, Здраве, Култура и др.). Извличане на семантично обогатено съдържание и разнообразна информация от Мрежата от знание на КЛаДА-БГ. Преглед на тенденциите на споменаване на популярни теми за конкретни периоди от време. Предоставяне на съдържание със сходен тематичен профил.

Европейски контекст и финансова подкрепа