Корпуси
Български корпус с имена, събития и роли 0.1 (изтегли)
Синтактичен корпус Бултрибанк с универсални зависимости на българския език 2.10 (изтегли)
Последни версии на ресурсите: https://universaldependencies.org/
Референтен корпус на българския език – BulTreeBank (уеб конкорданс)
Корпус на парламентарната и журналистическата реч (уеб конкорданс)
CHILDES Bulgarian LabLing Corpus – Корпус с данни от детска реч
DOI: 10.21415/PHWH-J834
На платформата CHILDES (ChildLanguageDataExchangeSystem) е публикуван първият български корпус с детска реч BULGARIAN LABLING CORPUS.
BULGARIAN LABLING CORPUS е създаден от изследователите от Лабораторията по приложна лингвистика (LABLING) на Шуменския университет „Епископ Константин Преславски“, която е технологичен партньор в Националния проект CLaDA-BG.
Български корпус със синтактични анализи (Бултрибанк) ISLRN: 761-430-854-533-2
Публикуван от ИИКТ-БАН в каталога на ELRA.
Бултрибанк се състои от 156 149 тоукъна (11 138 изречения), идващи от три основни източника: български граматики по синтаксис (1 391 изречения), вестници с новини (6 698 изречения) и други, сред които административни документи, Конституцията на Република България, закони, българска литература – българска и преводна (3 049 изречения). Корпусът се предоставя заедно със синтактична и морфологична анотация на изреченско равнище в представянето на инициативата за Универсалните зависимости.
Български корпус с анотирани събития и роли ISLRN: 832-960-876-604-2
Публикуван от ИИКТ-БАН в каталога на ELRA.
Българският корпус с анотирани събития и роли е съставен от 324 905 тоукъна. Ресурсът е подходящ за обучение на модул за разпознаване на имена, за свързване на имената от текста с енциклопедично знание и за разпознаване на събития за български език в сферата на хуманитаристиката. Текстовете включват документи от сферата на социалните и хуманитарните науки – научни статии, архивни документи, научнопопулярни статии и статии от Уикипедия в съответните области.
Корпус с парламентарна реч от фаза 1 на проекта ParlaMint
Многоезикови сравними корпуси от парламентарни сесии ParlaMint 4.0: https://www.clarin.eu/parlamint#parlamint-corpora
Европейски контекст и финансова подкрепа


