Това е третото издание на конференцията CLaDA-BG. Тя има за цел да бъде форум за колеги, занимаващи се с езиково обучение, изследователи по лингвистика, дигитални хуманитаристи, учени и всички, интересуващи се от моделиране на знания и свързване на данни.

Езикови технологии и дигитални хуманитарни науки: Ресурси и приложения (LTaDH-RA)

Конференция CLaDA-BG 2024

София, България

26-28 юни 2024 г.

Крайният срок е удължен до 08.05.2024 г.

Съпътстващо събитие: Работилница CLASSLA-Express: Използване на корпуси в езиковите изследвания (Ще се проведе на 26.06.2024 г. сутринта)

Програма

Регистрация

Участието в конференцията е безплатно. Таксата за вечерята на конференцията е 30 евро. Всички участници са поканени да се регистрират за конференцията. Линкът за регистрация е достъпен тук.

Място на провеждане

Конференцията ще се проведе в София, зала „Проф. Марин Дринов“ в сградата на БАН-Администрация (София, ул. „15 ноември“ № 1).

Официалният език на конференцията е английски.

CLaDA-BG е българската национална изследователска инфраструктура за ресурси и технологии за езиково, културно и историческо наследство, интегрирана в рамките на две европейски инициативи – CLARIN-EU и DARIAH-EU. Нейната мисия е да осигури достъп до необходимите ресурси и технологии, които биха подпомогнали изследванията в областта на социалните и хуманитарните науки. Моделирането и свързването на различни видове знания с техните типове контексти е от решаващо значение за успешното изследване в интердисциплинарната област на ресурсите и технологиите в областта на езика, културата и историята.

Теми на интерес

Темите включват, но не се ограничават до следните:

  • Проблеми в социалните и хуманитарните науки – методи на изследване, технологични аспекти
  • Езикови технологии за анализ на настроенията, семантични технологии, надеждност на Мрежите от знания, етични проблеми в дигиталните социални и хуманитарни науки
  • Моделиране и извличане на знания за дигитални социални и хуманитарни науки
  • Специфични езикови ресурси и технологии за исторически текстове, парламентарни записи, речеви и мултимодални корпуси, данни от социалните медии
  • Ролята на дигиталните библиотеки, архиви и музеи в социалните и хуманитарните науки
  • Езиков интерфейс към Мрежите от знания в социалните и хуманитарните науки
  • Моделирани чрез знания и свързани приложения в социални и хуманитарни науки
  • Големи езикови модели в компютърната хуманитаристика
  • Добри практики и нови тенденции в моделирането и свързването на знания за езика, културата и историята

Поканени лектори

Даря Фишер, CLARIN ERIC. ParlaMint: От демокрация към данни и обратно

Мачей Пясецки, CLARIN-PL, Вроцлавски университет за наука и технологии, Полша. Големите езикови модели като двигател на дигиталните социални и хуманитарни науки

Пиа Сомерауер, CLTL, VU University Amsterdam, Нидерландия. Знайте какво моделирате: Защо се нуждаем от интердисциплинарни перспективи, за да разберем големите езикови модели

Резюме: (Големите) езикови модели постигат впечатляващи резултати при различни задачи на естествения език (NLP). Като такива, те са се превърнали в привлекателни инструменти за много хуманитарни области, които изучават въпроси, базирани на (големи количества) текстове. Големите езикови модели обаче се основават на чисто дистрибутивни данни; те все още разчитат на изучаване на (вероятно сложни и детайлни) връзки между думите и техния контекст. Трудно е да се каже до каква степен езиковите модели могат да отразяват човешкото разбиране за семантиката и как се отразява специфичната информация. Достатъчно нюансирани ли са моделите, за да отразяват фините промени в значението на думите с течение на времето? До каква степен моделите отразяват социалните предразсъдъци? Възможно ли е да се премахне специфичната информация, като останалата част от модела остане непроменена? Как трябва да изследваме модела, за да намерим информацията, която ни интересува? Когато се използват автоматични модели за отговор на изследователски въпроси в хуманитарните науки, е важно да се разберат силните и слабите страни на моделите. В тази лекция ще представя работа от две изследователски направления: изучаване на семантичната промяна и изследване на социалните предразсъдъци. И двете направления илюстрират как сложните въпроси, повлияни от хуманитарните изследвания, могат да ни помогнат да постигнем по-добро разбиране на езиковите модели.

Таня Висик, ACDH-CH, Австрийска академия на науките, Австрия. Терминологични практики в институционалните условия на дигиталната ера: предизвикателства и възможности

Важни дати

Краен срок за подаване на доклади: 28.04.2024 г.

Известие за одобрение: 24.05.2024 г.

Окончателно подаване на доклади: 20.06.2024 г.

Конференция: 26-28.06.2024 г.

Подаване на докладите

Приемаме устни презентации или постери (по избор с демонстрация). Възможни са два вида доклади: обикновени доклади (поне 10 стандартни страници) и кратки доклади (5-9 стандартни страници).
Приемаме и разширени резюмета (3-5 стандартни страници) в съответствие със стила CEURART в 2 колони. Те ще бъдат представени на конференцията и ще бъде публикувано в сборник с резюмета в електронен формат.

Моля, изпратете пълния си доклад или разширено резюме в PDF формат на този линк към EasyChair: https://easychair.org/my/conference?conf=ltdhra2024

За връзка с организаторите, моля, използвайте следния имейл: ltadh-ra@bultreebank.org

Председатели на конференцията

Кирил Симов, Институт по информационни и комуникационни технологии, Българска академия на науките, България

Десислава Панева-Маринова, Институт по математика и информатика, Българска академия на науките, България

Димитър Илиев, Софийски университет „Свети Климент Охридски“, България

Програмен комитет

Андреас Вит, Институт за немски език „Лайбниц“, Манхайм, Германия

Агиатис Бенарду, DARIAH EU

Антонио Бранко, Лисабонски университет, Португалия,

Костанца Наварета, Копенхагенски университет, Дания

Десислава Панева-Маринова, Институт по математика и информатика, Българска академия на науките, България

Димитър Илиев, СУ „Св. Климент Охридски“, България

Димитър Попов, Шуменски университет, България

Ерхард Хинрихс, Университет на Тюбинген, Германия

Франческа Фронтини, Институт за компютърна лингвистика, Италия

Ингуна Скадиня, Институт по математика и компютърни науки, Латвийски университет, Латвия

Иван Георгиев, ИИКТ & ИМИ, Българска академия на науките, България

Юргита Вайченониене, Университет „Витаутас Велики“, Литва

Кирил Симов, ИИКТ, Българска академия на науките, България

Коралка Кузман Шлогар, Институт за етнология и фолклорни изследвания, Хърватия

Лоран Ромари, Инрия, Франция

Мария Гавриилиду, Институт за езикова и речева обработка – Athena R.C., Гърция

Мачей Огродничук, Полска академия на науките, Полша

Мачей Пясецки, Вроцлавски технологичен университет, Полша

Магделена Стоянова, CISBI-Università Ca’ Foscari, Венеция, Италия, ще бъде потвърдено

Милена Добрева, Софийски университет „Св. Климент Охридски“, България

Моника Монакини, Институт по компютърна лингвистика, Италия

Петър Станчев, Институт по математика и информатика, Българска академия на науките, България и Университет Кетеринг, САЩ,

Петя Осенова, Софийски университет „Св. Климент Охридски“ и ИИКТ, Българска академия на науките, България

Снежана Петрович, Институт за сръбски език, Сръбска академия на науките, Сърбия

Юра Константинова, Институт по балканистика и Център по тракология, Българска академия на науките, България