Mittuniversitetet

miun.sePublikationer
Driftstörningar
Just nu har vi driftstörningar på sök-portalerna på grund av hög belastning. Vi arbetar på att lösa problemet, ni kan tillfälligt mötas av ett felmeddelande.
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
A Distributional Semantic Online Lexicon for Linguistic Explorations of Societies
Mittuniversitetet, Fakulteten för humanvetenskap, Institutionen för humaniora och samhällsvetenskap. Univ Bergen, Bergen, Norway..
Univ Gothenburg, Gothenburg, Sweden..
RISE Res Inst Sweden AB, Borås, Sweden..
RISE Res Inst Sweden AB, Borås, Sweden..
Visa övriga samt affilieringar
2023 (Engelska)Ingår i: Social science computer review, ISSN 0894-4393, E-ISSN 1552-8286, Vol. 41, nr 2, s. 308-329Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

Linguistic Explorations of Societies (LES) is an interdisciplinary research project with scholars from the fields of political science, computer science, and computational linguistics. The overarching ambition of LES has been to contribute to the survey-based comparative scholarship by compiling and analyzing online text data within and between languages and countries. To this end, the project has developed an online semantic lexicon, which allows researchers to explore meanings and usages of words in online media across a substantial number of geo-coded languages. The lexicon covers data from approximately 140 language-country combinations and is, to our knowledge, the most extensive free research resource of its kind. Such a resource makes it possible to critically examine survey translations and identify discrepancies in order to modify and improve existing survey methodology, and its unique features further enable Internet researchers to study public debate online from a comparative perspective. In this article, we discuss the social scientific rationale for using online text data as a complement to survey data, and present the natural language processing-based methodology behind the lexicon including its underpinning theory and practical modeling. Finally, we engage in a critical reflection about the challenges of using online text data to gauge public opinion and political behavior across the world.

Ort, förlag, år, upplaga, sidor
2023. Vol. 41, nr 2, s. 308-329
Nyckelord [en]
distributional semantics, natural language processing, word2vec, comparative surveys, language use, semantic similarities
Nationell ämneskategori
Språkbehandling och datorlingvistik
Identifikatorer
URN: urn:nbn:se:miun:diva-44979DOI: 10.1177/08944393211049774ISI: 000787865700001Scopus ID: 2-s2.0-85130070813OAI: oai:DiVA.org:miun-44979DiVA, id: diva2:1657903
Tillgänglig från: 2022-05-12 Skapad: 2022-05-12 Senast uppdaterad: 2025-02-07Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Dahlberg, Stefan

Sök vidare i DiVA

Av författaren/redaktören
Dahlberg, Stefan
Av organisationen
Institutionen för humaniora och samhällsvetenskap
I samma tidskrift
Social science computer review
Språkbehandling och datorlingvistik

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 130 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf