Организация

Национална интердисциплинарна изследователска Е-инфраструктура за ресурси и технологии за българското езиково и културно наследство, интегрирана в рамките на европейските инфраструктури CLARIN и DARIAH
(КЛаДА-БГ)

Мисия

Мисията на КЛаДА-БГ е да се създаде национална виртуална инфраструктура за съхранение на езиковото, културното и историческото наследство. Тя включва: съвременни технологии, които да осигурят публичен достъп на изследователи-хуманитаристи и граждани до ресурсите; автоматични средства за обработка на текстове на български език; както и инструментариум за достъп до мрежи от данни за културното и историческото наследство.

КЛаДА-БГ се стреми към интегриране на източниците на информация, необходими за изследванията в областта на социалните науки и хумнанитаристиката (СС&Х), заедно с софтуерните услуги за тяхното използване. По този начин изследователят в тези областти, ще може да провежда своите изследвания изцяло в рамките на инфраструктурата.

Изследователска инфраструктура в социалните науки и хумнанитаристиката

Изследователските инфраструктури в социалните науки и хумнанитаристиката са сложни системи, включващи:

  • знания
  • данни
  • хора и 
  • услуги,

обединяващи различни ресурси за нуждите на широк кръг от потребители. Тези ресурси трябва да са използваеми и достъпни за достатъчно дълъг период, за да подкрепят научните изследвания (индивидуални или съвместни) и да споделят резултатите от тези изследвания (FAIR принципи)

PARTHENOS Project (H2020 project of DARIAH and CLARIN)

Задачи

Проектът КЛаДА-БГ има няколко важни задачи:

  • да създаде мрежа от ресурси и инструменти за българския език, културното и историческото наследство, които да бъдат с публичен достъп
  • да разработи и публикува редица уеб приложения, които да демонстрират потенциала на инфраструктурата по отношение на езиковите и семантичните технологии, както и необходимостта от създаване на езикови ресурси за крайните потребители
  • да тества тези приложения с крайните потребители
  • да организира лекции и информационни дни, с цел подобряване осведомеността на потребителите относно възможностите на инфраструктурата
  • да създаде основата на КЛаДА-БГ общество в България чрез поддържане комуникационни канали като: уеб сайт, уикистраница, блог, мейлинг лист, бюлетини и др.

Кратка история

На идейно равнище България участва в инициативите за изграждане на инфраструктурите CLARIN и DARIAH още при тяхното стартиране през 2005 г. и 2006 г.
България беше участник в проекта „Подготвителна фаза на Европейския КЛАРИН“,  който се реализира в периода от 2008 г. до 2011 г. През 2010 г. КЛАРИН-БГ беше създаден като национална изследователска инфраструктура, но за съжаление дълго време не получи финансиране.
През 2012 г. България подписа Меморандума за разбирателство (Memorandum of Understanding), с което стана една от деветте страни, учредителки на CLARIN ERIC.
През 2014 г. беше подета инициатива за подновяване на картата на националните изследователски инфраструктури в България. Имаше две отделни предложения, свързани съответно с двете национални изследователски инфраструктури CLARIN и DARIAH. След международна оценка Министерството на образованието и науката предложи тези две инфраструктури да бъдат обединени в една обща изследователска инфраструктура. Тя получи името КЛаДА-БГ (CLaDA-BG = CLARIN and DARIAH в България). Пълното ѝ наименование е Национална интердисциплинарна изследователска е-инфраструктура за ресурси и технологии за българското езиково и културно наследство, интегрирана в рамките на европейските инфраструктури CLARIN и DARIAH.

Обединението на двете инфраструктури се базира на наблюдение за типа данните, използвани в областта на СС&Х:

„Language Technology is a core Big Data technology. Growth in the volume and variety of data is mostly due to the accumulation of unstructured text data; in fact, up to 80% of all data is unstructured text data.“ http://roadmap2018.esfri.eu/media/1066/esfri-roadmap-2018.pdf (p. 110)

На тази база двете инфраструктури – CLARIN и DARIAH, обработват един и същи тип данни, използват подобни или идентични технологии.

Освен в България и в други страни (Австрия, Нидерландия, Гърция, Полша, Германия и други) двете инфраструктури са обединени в една обща.

Европейски контекст и финансова подкрепа