Un tuffo nel passato con l’analisi del Sentiment: nell’episodio odierno di Carsten parliamo di “sentiment analysis”, di Ngrams e di come esplorare l’uso delle parole nel tempo; e scopriamo dove trovare le istruzioni per costruirvi uno scansionatore lineare di libri.
Riferimenti dell’episodio:
- Quanti libri abbia indicizzato Google è una domanda che ci siamo già fatti e che ha sollevato qualche interrogativo: un articolo di ben dieci anni fa de L’Inkiesta (2013), https://www.linkiesta.it/2013/11/la-biblioteca-universale-di-google/ e un documentario della BBC visibile su YouTube: https://www.youtube.com/watch?v=1vxIveocxjM
- World Bank “Enlightenment Ideals and Belief in Progress in the Run-up to the Industrial Revolution: A Textual Analysis”: https://docs.iza.org/dp16674.pdf
- Google Ngram Viewer: https://books.google.com/ngrams/
- Science “Quantitative Analysis of Culture Using Millions of Digitized Books”: https://www.science.org/doi/10.1126/science.1199644
- Google. “Syntactic Annotations for the Google Books Ngram Corpus”: https://research.google/pubs/syntactic-annotations-for-the-google-books-ngram-corpus/
- Come funziona Ngram Viewer: https://www.smartworld.it/internet/google-ngram-viewer-cos-e-e-come-funziona.html
- Lo scansionatore lineare di libri: https://linearbookscanner.org/