Работен пакет РП1. Изграждане на технологичната база на инфраструктурата КЛаДА-БГ

Отговорник: ИИКТ

Технологичната база на инфраструктурата КЛаДА-БГ се състои от следните типове центрове: CLaDA-BG-А, CLaDA-BG-B, CLaDA-BG-D и CLaDA-BG-C. В рамките на РП1 се изпълняват дейност и задачи за изграждането и поддържането на тези четири типа центрове. Работата по РП1 се подразделя на следните задачи:

Задача 1.1. Обзор на реализираните инфраструктурни компоненти в други европейски страни.

Отговорник: ИИКТ, участници: ИМИ, ОНТО, Булгариана, НБУ, ШУ

Задача 1.2. Създаване и поддържане на център от тип А: CLaDA-BG-А.

Отговорник: ИИКТ, участници: ИМИ, ОНТО

Основната цел на тази задача е създаването и поддържането на българския КЛаДА-БГ център от тип А. Този център ще представлява основата на КЛаДА-БГ инфраструктурата в България и връзката й с европейските инфраструктури. Дейностите са свързани с инсталирането на сървърите на центъра CLaDA-BG-А, инсталирането и разработването на специализиран софтуер за интеграция с европейската мрежа от центрове от тип А на CLARIN ERIC и работните групи на DARIAH ERIC, както и създаване на неговия портал.
CLaDA-BG-А ще бъде интегриран с националната инфраструктура “Национален център за високопроизводителни и разпределени пресмятания”, координирана от ИИКТ-БАН. Основните дейности и услуги включват минимум: Национален регистър споделени данни и метаданни; Национален регистър за постоянни идентификатори; Управление на изпълнението на отдалечени услуги; Услуги за достъп до високопроизводителни и разпределени изчислителни системи; Услуги за достъп до виртуални хранилища; Предоставяне на достъп и права.

Задача 1.3. Създаване и поддържане на център от тип В: CLaDA-BG-B01.

Отговорник: ИИКТ, участници: ИМИ, ОНТО, НБУ, ШУ

Основната цел на тази задача е създаването и поддържането на българския КЛаДА-БГ център от тип B. Той предоставя достъп до езикови ресурси (общи и за нуждите на езиковите технологии) и достъп до езикови технологии. Ще бъдат инсталирани и разработени системи за достъп на различни типове езикови ресурси – текстови архиви; детайлно аннотирани ресурси; многоезикови и мултимодални ресурси; системи за създаване на езикови ресурси, използващи интелигентни системи за минимизация на човешкия труд; системи за визуализация на езикови ресурси и резултати от анализ на текстови документи; системи за експерименти с езикови технологии; системи за поддържане на повтаряемостта на експериментите при езиковите технологии; езикови технологии за хуманитарни изследвания, за крайни потребители и за индустрията.

Центровете от тип В минават на европейска оценка за качеството, осъществявана от CLARIN ERIC. В рамките на първите две години се планира център CLaDA-BG-B01 да получи такава оценка и да поддържа съответното качество след това.

Този център ще представлява основата на КЛаДА-БГ инфраструктурата в България и връзката й с европейските инфраструктури. Дейностите са свързани с инсталирането на сървърите на центъра CLaDA-BG-А, инсталирането и разработването на специализиран софтуер за интеграция с европейската мрежа от центрове от тип А на CLARIN ERIC и работните групи на DARIAH ERIC, както и създаване на неговия портал. CLaDA-BG-А ще бъде интегриран с националната инфраструктура “Национален център за високопроизводителни и разпределени пресмятания”, координирана от ИИКТ-БАН. Основните дейности и услуги включват минимум: Национален регистър споделени данни и метаданни; Национален регистър за постоянни идентификатори; Управление на изпълнението на отдалечени услуги; Услуги за достъп до високопроизводителни и разпределени изчислителни системи; Услуги за достъп до виртуални хранилища; Предоставяне на достъп и права.

Задача 1.4: Създаване и поддържане на центровеот тип D: CLaDA-BG-D01, CLaDA-BG-D02 и CLaDA-BG-D03.

Отговорник: Онто, участници ИИКТ, ИМИ, СУ, Булгариана, КМНЦ-БАН, ИБЦТ-БАН, ИЕФЕМ-БАН, НБИВ, РИМС

Основната цел на тази задача е създаването и поддържането на българските КЛаДА-БГ центрове от тип D. Тези центрове ще бъдат свързани с подходящи работни групи на DARIAH ERIC.

CLaDA-BG-D01 ще бъде създаден в рамките на ИИКТ-БАН и ще осигурява един значителен набор от технологии за 3D обработка на артефакти от културно-историческото наследство, в това число 3D сканиране, 3D моделиране и 3D печат. CLaDA-BG-D02 ще бъде създаден в рамките на Онтотекст АД и ще осигурява услуги за семантична интеграция и търсене на културно-историческо съдържание, в това число онтологии и свързани отворени данни за обекти на културно-историческото наследство, както и средства за визуализация и достъп до тези метаданни. CLaDA-BG-D03 ще бъде създаден към сдружение „Булгариана“, който съгласно изискванията за център от този тип, следва да осигурява съхранение на и достъп до цифрови данни и метаданни за културно-историческо наследство, изкуството и хуманитарните науки, както и да предлага разработени в центъра инструменти и услуги за работа с тях за нуждите на научни изследвания и креативно използване на тази информация.

Задача 1.5. Създаване и поддържане на център от тип C: CLaDA-BG-C01.

Отговорник: ИМИ, участници ИИКТ, ОНТО, Булгариана, НБУ, ШУ, БСУ

Основната цел на този работен пакет е създаването и поддържането на българския КЛаДА-БГ център от тип С. Ще се синхронизират описанията на съществуващите ресурси и модули в КЛаДА-БГ, тяхното разширение с оглед на пълнота на покриване на явленията в българския език. За да се осъществят напълно целите на проекта по отношение на инфраструктурите CLARIN ERIC и DARIAH ERIC, трябва да бъдат демонстрирани възможностите за описание и търсене на съществуващи езикови, исторически и културни ресурси и технологии. Ще се осигурят услуги за описание и достъп до данни и средства на CLaDA-BG чрез стандартизирани метаданни. Центровете CLaDA-BG-A, CLaDA-BG-B01, CLaDA-BG-D01, CLaDA-BG-D02, CLaDA-BG-D03, CLaDA-BG-K01 от инфраструктурата ще могат да описват предоставяните от тях ресурси чрез услугите на CLaDA-BG-C01. Център С ще бъде стабилен и постоянно достъпен, за да подпомага другите центрове в създаването и разпространението на метаданни за техните ресурси и услуги.