Езикови ресурси и технологии

Работен пакет РП2. Изучаване на нуждите на потребителите и тестване.

Отговорник: ОНТО

Задача 2.2: Разработка на Примерните приложения ПП01. Езикови и семантични технологии за хора със специални нужди.

Отговорници: ШУ+НБУ, участници: ИИКТ, ОНТО, ЮЗУ

Целта на това примерно приложение е изграждането на система от ресурси и модули за подпомагането на хора със специални нужди при използването на българския език. Такива хора могат да бъдат хора с говорни затруднения, аутисти, хора с дислексия и други. При решаването на техните проблеми има нужда от езикови ресурси и технологии, насочени към парафрази на сложни езикови структури, опростяване на изказа и други. По-конкретно погледнато, ще бъдат имплементирани езикови ресурси и технологии, насочени към хора с логопедични проблеми. Логопедичните проблеми се решават на интердисциплинарно равнище. Те имат допирни точки с науки като психологията, неврологията, лингвистиката и др. Един от проблемите в логопедията е трудността при произнасяне на определени съчетания от звукове. Разработените ресурси и технологии ще бъдат насочени към обработката на детска реч, която е записана на базата на общуване с деца с логопедични проблеми.

Друга основна цел на приложението е изграждането на система от ресурси и модули за подпомагането на деца и възрастни с тежки физически увреждания при използването на българския език, достъп до знания и създаване на интерфейси за интегриране на езиковите и семантични ресурси в специализирани приложения за обучение и комуникация на хора с тежки физически увреждания. Такива хора могат да бъдат хора с детска церебрална парализа, амиотрофична латерална склероза, невро-мускулни заболявания. Комуникацията и взаимодействието с околните и с дигиталните медии е затруднено или невъзможно поради двигателните им затруднения. Тези хора използват за комуникация компютри и таблети, които се управляват с алтернативни помагащи технологии (суич, ай-трекинг и др.). В модулите за деца с тежки физически увреждания и специални образователни потребности акцентът ще бъде в интеграцията на съществуващите ресурси (езикови, семантични, културно наследство) в електронна система за обучение и развитие на когнитивните способности и комуникация. При възрастните хора с тежки физически увреждания акцентът ще бъде във възможностите за комуникация и достъп до информация. Модулите не само ще улесняват взаимодействието с компютъра, но с помощта на семантичните и езиковите технологии ще подпомагат потребителите чрез система за предсказване, допълване на текстовете и проверка.

Задача 2.3: Разработка на Примерните приложения ПП02. Езикови технологии за електронно обучение.

Отговорници: НБУ+ОНТО, участници: СМ, ИИКТ, ИМИ

Целта на това примерно приложение е изграждането на система от ресурси и модули за подпомагането на създаване на национална база от семантично анотирани учебни материали (НБСАУМ). Семантичното анотиране ще позволява по-точно и детайлно търсене на учебни материали по дадена тема. Тъй като самото създаване на националната база от семантични учебни материали в нейния пълен обем е извън задачите на КЛаДА-БГ, то ние ще осъществим само прототипно примерно приложение. Като основа за примерното приложение ще стъпим на изграждането на релацията онтология-текст, която съдържа следните компоненти: онтология, речник, граматика, текст. Конкретното приложение ще бъде насочено към чуждоезиковото обучение.

Задача 2.4: Разработка на Примерните приложения ПП03. Езикови технологии за политически изследвания.

Отговорници: ОНТО + ИИКТ, участници: НБУ, СМ, ИМИ

Целта на това примерно приложение е изграждането на система от ресурси и модули за подпомагане на работата на политолози и други специалисти, които се интересуват от политическия дискурс в България и света. Това примерно приложение ще бъде и базата за съвместни разработки с колеги от други страни, участващи в CLARIN ERIC. В рамките на това приложение ще се създаде корпус от политическа реч, анотиран на нивото на изказванията в текста. Всяко изказване ще бъде анотирано с неговия автор, тема, обективност-субективност (в случаите на субективно изказване ще се посочва и изразеното отношение). Допълнително изказванията ще бъдат локализирани във времето и пространството. Така създаденият корпус ще бъде база от свързани данни за българския политически живот. Ще бъдат имплементирани и средства, които да визуализират изказванията във времето и пространството (използвайки технологии като GoogleMaps).