Home/BLOG

AILC per un’Intelligenza Artificiale responsabile e aperta

L’Associazione Italiana di Linguistica Computazionale (AILC) è l’organizzazione scientifica che riunisce la comunità di ricerca che opera nel campo della Linguistica Computazionale e delle tecnologie di Intelligenza Artificiale (IA) applicate al Linguaggio. AILC promuove la riflessione metodologica, teorica e sperimentale sul trattamento automatico della lingua e ne cura la divulgazione scientifica, con particolare attenzione alle ricadute sull’economia e la società.

I linguisti computazionali italiani sono scientificamente coinvolti, a livello nazionale e internazionale, nei più recenti sviluppi dell’Intelligenza Artificiale, in particolare dei cosiddetti grandi modelli linguistici, come quello alla base di ChatGPT. AILC mette a disposizione le competenze della sua comunità scientifica per contribuire al vivace dibattito attorno a ChatGPT, troppo spesso fuorviato da interventi disinformati, talora allarmistici, auspicando una formazione adeguata al riguardo, mai quanto oggi necessaria per l’intera società. Solo attraverso una costante attenzione critica e un uso esperto e responsabile di queste tecnologie sarà possibile sfruttare al meglio le opportunità offerte dall’Intelligenza Artificiale nel settore linguistico.
Nella consapevolezza che modelli come ChatGPT rappresentano comunque un importante valore aggiunto per le tecnologie di IA, AILC auspica che la comunità di ricerca nazionale promuova sforzi congiunti al fine di sviluppare simili tecnologie in maniera “open”, nel pieno rispetto della trasparenza scientifica, della
replicabilità dei modelli e degli esperimenti, della libertà di accesso alle risorse tecnologiche, e nella prospettiva di una adeguata formazione al loro utilizzo. Un’opportunità può venire dagli attuali significativi investimenti che l’Italia sta facendo nella ricerca in questo settore, come ad esempio il progetto PNRR dal
titolo “Future Artificial Intelligence Research – FAIR”, che ha la possibilità di offrire innovazioni fondamentali per la nostra comunità scientifica, per la lingua italiana, per il nostro paese.

Di |2023-04-29T23:59:59+02:0029 Apr, 2023|BLOG, NEWS|

Eletti i nuovi organi governativi di AILC

In occasione dell’Assemblea dei soci che si è tenuta a Milano il 30 giugno 2022 nell’ambito di CLiC-it 2021 è stato eletto il nuovo Consiglio Direttivo AILC che guiderà l’Associazione per il triennio 2022-2025 ed è stato nominato il Comitato di Garanzia previsto dallo Statuto con funzioni di guida e supervisione. Buon lavoro al Direttivo neoeletto e al Comitato di Garanzia! Un grazie di cuore ai membri uscenti!

Di |2022-10-07T17:42:29+02:0022 Set, 2022|BLOG, NEWS|

Bid per Lectures on Computational Linguistics 2023

L’Associazione Italiana di Linguistica Computazionale (AILC) sollecita candidature per ospitare
l’edizione 2023 delle “Lectures on Computational Linguistics”.

Le Lectures sono una iniziativa annuale di AILC rivolta alla formazione nel campo della
Linguistica Computazionale, e sono il frutto di una stretta collaborazione con l’alta formazione in
Università, in particolare con le Scuole di Dottorato. Informazioni sul format delle Lectures e
sulle edizioni precedenti sono disponibili qui.
Le sedi che si intendono proporre dovranno presentare un documento contenente le seguenti
informazioni:

  • Gruppo organizzatore locale: indicare le persone coinvolte nell’organizzazione locale
    delle Lectures, inclusa una persona proposta per far parte del Comitato Scientifico delle
    Lectures per due anni; indicare precedenti esperienze dei local organizers
    nell’organizzazione di eventi di formazione.
  • Caratteristiche della Sede: indicare la posizione della sede, numero di sale disponibili
    con la relativa capienza, spazi per sessione poster, presenza di attrezzature audio-video,
    possibilità di pranzo in mensa per i partecipanti.
  • Scuola di dottorato e corsi universitari collegati alla sede: indicare la/le scuole di
    dottorato coinvolte nell’organizzazione, gli eventuali corsi di laurea interessati, e il
    corrispondente numero di studenti potenzialmente interessati alle Lectures.
  • Caratterizzazione scientifica della Sede: indicare la caratterizzazione della sede (sede a
    orientamento umanistico, orientamento informatico o misto); indicare eventualmente
    alcuni temi scientifici che la Sede ospitante intende proporre al Comitato Scientifico delle
    Lectures, nel caso la sede fosse selezionata.
  • Alloggi: indicare la disponibilità di alloggi, in particolare a costi contenuti, per es., se
    presenti, studentati e strutture universitarie di accoglienza.
  • Evento sociale: indicare possibilità e costi per una cena o altro evento sociale.
  • Trasporti: indicare i collegamenti (aereo, treni) per raggiungere la sede; mezzi di
    trasporto urbani con i tempi per raggiungere la sede.
  • Budget: indicare i costi stimati relativi alle sale, i costi della mensa, e eventuali altri costi
    fissi richiesti dalla sede ospitante.
  • Sponsorizzazioni: indicare eventuali sponsorizzazioni da parte di istituzioni universitarie
    (dipartimento, scuola di dottorato).
  • Date: indicare le date possibili delle Lectures (tre giorni) nel periodo maggio-giugno 2023.

La selezione della sede ospitante verrà effettuata, in seduta congiunta, dal Comitato Scientifico
delle Lectures e dal Consiglio Direttivo AILC.
Le candidature dovranno essere inviate per posta elettronica al Presidente AILC (Simonetta Montemagni – simonetta.montemagni@ilc.cnr.it) e al Coordinatore del Comitato Scientifico delle Lectures (Elisabetta
Jezek – jezek@unipv.it) entro il giorno 15 settembre 2022.

Contatti: Simonetta Montemagni (simonetta.montemagni@ilc.cnr.it) e Elisabetta Jezek (jezek@unipv.it)

Di |2022-07-20T23:24:04+02:0020 Lug, 2022|BLOG, EVENTI, FORMAZIONE, NEWS|

Bid per Lectures on Computational Linguistics 2022

L’Associazione Italiana di Linguistica Computazionale (AILC) sollecita candidature per ospitare
l’edizione 2022 delle “Lectures on Computational Linguistics”.

Le Lectures sono una iniziativa annuale di AILC rivolta alla formazione nel campo della
Linguistica Computazionale, e sono il frutto di una stretta collaborazione con l’alta formazione in
Università, in particolare con le Scuole di Dottorato. Informazioni sul format delle Lectures e
sulle edizioni precedenti sono disponibili qui.
Le sedi che si intendono proporre dovranno presentare un documento contenente le seguenti
informazioni:

  • Gruppo organizzatore locale: indicare le persone coinvolte nell’organizzazione locale
    delle Lectures, inclusa una persona proposta per far parte del Comitato Scientifico delle
    Lectures per due anni; indicare precedenti esperienze dei local organizers
    nell’organizzazione di eventi di formazione.
  • Caratteristiche della Sede: indicare la posizione della sede, numero di sale disponibili
    con la relativa capienza, spazi per sessione poster, presenza di attrezzature audio-video,
    possibilità di pranzo in mensa per i partecipanti.
  • Scuola di dottorato e corsi universitari collegati alla sede: indicare la/le scuole di
    dottorato coinvolte nell’organizzazione, gli eventuali corsi di laurea interessati, e il
    corrispondente numero di studenti potenzialmente interessati alle Lectures.
  • Caratterizzazione scientifica della Sede: indicare la caratterizzazione della sede (sede a
    orientamento umanistico, orientamento informatico o misto); indicare eventualmente
    alcuni temi scientifici che la Sede ospitante intende proporre al Comitato Scientifico delle
    Lectures, nel caso la sede fosse selezionata.
  • Alloggi: indicare la disponibilità di alloggi, in particolare a costi contenuti, per es., se
    presenti, studentati e strutture universitarie di accoglienza.
  • Evento sociale: indicare possibilità e costi per una cena o altro evento sociale.
  • Trasporti: indicare i collegamenti (aereo, treni) per raggiungere la sede; mezzi di
    trasporto urbani con i tempi per raggiungere la sede.
  • Budget: indicare i costi stimati relativi alle sale, i costi della mensa, e eventuali altri costi
    fissi richiesti dalla sede ospitante.
  • Sponsorizzazioni: indicare eventuali sponsorizzazioni da parte di istituzioni universitarie
    (dipartimento, scuola di dottorato).
  • Date: indicare le date possibili delle Lectures (tre giorni) nel periodo maggio-giugno 2022.

La selezione della sede ospitante verrà effettuata, in seduta congiunta, dal Comitato Scientifico
delle Lectures e dal Consiglio Direttivo AILC.
Le candidature dovranno essere inviate per posta elettronica al Presidente AILC (Bernardo
Magnini – magnini@fbk.eu) e al Coordinatore del Comitato Scientifico delle Lectures (Elisabetta
Jezek – jezek@unipv.it) entro il giorno 8 ottobre 2021.
Contatti: Bernardo Magnini (magnini@fbk.eu) e Elisabetta Jezek (jezek@unipv.it)

Di |2021-09-21T07:57:53+02:0016 Mag, 2021|BLOG, EVENTI, FORMAZIONE, NEWS|

Computational Linguistics and the COVID-19 Outbreak

This page is maintained by AILC (the Italian Association for Computational Linguistics). It groups some of the initiatives that the Computational Linguistics community is carrying out to contribute to the fight against COVID-19. Everyone is invited to collaborate by reporting new initiatives. Please do so through our contact form

Datasets


  • CORD-19 – The Allen Institute COVID-19 Open Research Dataset, a collection of Covid-19 scientific papers, weekly updated (March 2020)
  • Processed CORD-19 – The Allen Institute corpus processed with Sketch Engine (March 2020)
  • 40wita – A dataset of tweets in Italian collected daily by the University of Turin
  • Corona Corpus – A corpus of texts from online newspapers and magazines in 20 different English-speaking countries and part of the English-Corpora.org suite of corpora

Tools


Shared Tasks and Events


  • CLEF 2020: CheckThat! Lab Task 1 Tweet Check-Worthiness – The task asks to rank a stream of tweets on a number of topics, including COVID-19, according to their check-worthiness (March 2020)
  • Kaggle Tasks – Several tasks on COVID-19  (March 2020)
  • NLP COVID-19 Workshop an emergency workshop at ACL 2020 – Authors are invited to submit papers related to NLP applied to combat the COVID-19 pandemic (July 2020)
  • TREC-COVID program – Launched by NIST and OSTP, the challenge will follow the TREC assessment process to evaluate search systems, based on the CORD-19 documents

Publications


Di |2020-05-20T08:17:11+02:002 Apr, 2020|BLOG, HOME, RISORSE|

COVID-19 Browser: Utilizzo del Natural Language Processing per combattere la pandemia

La nostra società sta affrontando una crisi senza precedenti a causa del recente scoppio di COVID-19 che sta mettendo sotto pressione i sistemi sanitari in tutto il mondo. Recentemente, decine di paesi hanno annunciato la chiusura di tutte le attività non essenziali per il prossimo futuro prevedibile e gli scienziati stanno cercando, in tutto il mondo, di trovare cure e vaccini in grado di fermare la pandemia in corso.

In questi tempi difficili, tutti dovrebbero mettere in gioco le proprie competenze per aiutare a combattere il virus. Per Gabriele Sarti, uno studente di Data Science all’Università di Trieste e un giovane membro dell’Associazione italiana per la linguistica computazionale (AILC), ciò ha significato sfruttare la sua esperienza in Natural Language Processing (NLP) per sviluppare il COVID-19 Browser, un sistema sfruttando tecniche all’avanguardia nella PNL per estrarre informazioni significative e guidare gli scienziati verso una migliore comprensione di COVID-19.

Ad oggi, oltre 32000 articoli scientifici sono stati pubblicati da laboratori di ricerca in tutto il mondo sugli argomenti del nuovo virus corona SARS-CoV-2 e della malattia COVID-19. È molto probabile che in una così grande quantità di testo si perdano molte informazioni utili, rendendo la nostra conoscenza sull’argomento troppo scarsa per essere sfruttata al massimo delle sue potenzialità. Il browser COVID-19 consente agli utenti di sfogliare una vasta raccolta di tali articoli direttamente nella propria console, abbinando gli abstract dell’articolo con le query degli utenti formulate in linguaggio naturale per approfondire le nostre attuali conoscenze sull’argomento.

Il modello alla base di Covid-19 Browser è SciBERT-NLI, un modello linguistico all’avanguardia addestrato dall’AI2 senza fini di lucro americano su un corpus di articoli scientifici di 1,14 milioni e successivamente adattato da Gabriele per essere utilizzato per l’attività di recupero.

Gabriele Sarti è uno studente del Master in Data Science dell’Università di Trieste (https://dssc.units.it/), ed è affiliato con SISSA (https://www.sissa.it) e CNR ItaliaNLP Lab a Pisa (http://www.italianlp.it). È membro dell’Associazione italiana di linguistica computazionale (https://www.ai-lc.it/en/) e svolge un ruolo attivo nel suo team di divulgazione.

Link

Di |2020-04-06T10:37:41+02:0024 Mar, 2020|BLOG, RICERCA|

Lessici affettivi per l’italiano

Un lessico affettivo è un database di parole (o sensi, espressioni, o altri tipi di elementi lessicali), in cui ogni elemento è classificato in base al suo contenuto in termini di soggettività, polarità (positiva o negativa), capacità di provocare particolari emozioni, e così via. Questo tipo di risorse è usato per costruire sistemi in grado di analizzare il linguaggio naturale (per esempio, da siti Web o social media), e “leggere” il sentimento espresso nel testo. Questa attività è chiamata Analisi del Sentimento (anche Sentiment Analysis o Opinion Mining) e sta rapidamente raccogliendo attenzione crescente da parte delle comunità scientifiche e dell’industria, poiché è in grado di rispondere a domande quali “i clienti sono contenti del prodotto X?” oppure “che tipo di persone ha gradito l’iniziativa Y?”.

L’italiano è una lingua relativamente poco rappresentata nel panorama delle risorse linguistiche computazionali. Questo vale anche per i lessici affettivi, ma grazie ad una comunità vivace, lo scenario sta mutando rapidamente. Abbiamo condotto una piccola indagine tra i membri di AILC, chiedendo loro di indicarci lessici affettivi per l’italiano e risorse correlate. Le risposte sono sintetizzate nella lista seguente. Alcuni di questi sono propriamente lessici, altri sono risorse di vario tipo e metologie per l’italiano o comunque legate alla comunità italiana di NLP.

Questa lista è aprta a modifiche ed integrazioni. Chi sia a conoscenza di risorse rilevanti è invitato a contattare AILC, in modo da poterle includere.

 

Di |2017-10-04T16:42:23+02:0028 Set, 2017|BLOG, RISORSE|

Titolo

Torna in cima