Новини

Инициатива CLARIN Bazaar по време на CLARIN 2020

Инициатива CLARIN Bazaar по време на CLARIN 2020

В рамките на CLARIN Annual Conference 2020 се проведе дискусионна секция, наречена CLARIN Bazaar, като нейната цел бе участниците и слушателите на конференцията да имат възможността да се запознаят с работата на различните екипи и да зададат своите въпроси към тях. За целта над 20 екипа бяха отделени в специални виртуални „стаи” (т.нар. breakout rooms), които платформата Zoom предоставя, като всеки желаещ можеше да се присъедини към една или съответно последователно към няколко в зависимост от интересите си.

Екипът на ИИКТ-БАН взе участие и в тази секция, като представянето му бе под надслов As You Like It: Event Annotation with INCEpTION. Интерес към представяната информация прояви Valeria Quochi, която в началото предпочете да се запознае накратко с работата в INCEpTION. Valeria Quochi научи за начина, по който се е достигнало до анотационната схема, по която екипът работи. Основен момент по тази тема, който Л. Ласкова засегна, беше изходната точка за създаване на анотационната схема – какво вече съществува като ресурси по света (онтологии - CIDOC-CRM, лексикални ресурси като FrameNet, VerbNet и др.), които да са ориентирани към семантичното анотиране на текстове, каквато е и основната задача на екипа при работата с INCEpTION. За по-голяма яснота в представянето бе използван пример, отнасящ се до събитието (Event) „раждане”, което е едно от основните в повечето анотационни схеми, а и ключово при работата с биографии и исторически текстове. Л. Ласкова представи по какъв начин информацията от проучването на концепциите и ролите, свързани със събитието „раждане”, описани в онтологиите, се обединява с тази, открита във FrameNet – т.нар. сценарий (”Event”_scenario).

Резултатът от сравнението на различните ресурси е изграждането на собствен списък с видовете събития и ролите (главни и второстепенни), свързани с тях, които са необходими за анотирането на конкретния тип текстове, с които работи екипа, като те се прилагат към INCEpTION. Л. Ласкова представи на Valeria Quochi един от по-ранните варианти на работа с програмата за анотиране, при който се е използвала релационна схема (Relational scheme), като обясни разликата ѝ със сегментната (Segmental scheme), която се използва към момента. Чрез нагледен пример бе демонстрирана и на практика разликата между двете анотационни схеми – при релационната анотаторът трябва да посочи единствено събитието, като в резултат, отстрани автоматично се показват ролите свързани с него, които той трябва да попълни. Докато при сегментната схема анотаторът трябва сам да прецени ролите, които се включват в избраното от него събитие. Представени бяха и причините за настъпилата в процеса на работа промяна на анотационната схема, както и предимствата и недостатъците, свързани с нея. Интерес от страна на Valeria Quochi предизвика възможността за сверяване на дадена именувана същност с базата данни, която е вградена в INCEpTION (чрез ID), използваща данни от DBPedia (за български език).

Накратко бяха обсъдени възможностите за модифициране на използваните инструменти, както и бъдещите задачи на екипа.

Презентация (PDF)

Европейски контекст и финансова подкрепа

Image
Image
Image