1 |
Updating the dictionary: Semantic change identification based on change in bigrams over time
|
|
|
|
In: Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave, Vol 8, Iss 2 (2020) (2020)
|
|
BASE
|
|
Show details
|
|
2 |
Numerical orthographic coding: merging Open Bigrams and Spatial Coding theories
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01687304 ; 2019 (2019)
|
|
BASE
|
|
Show details
|
|
4 |
Тематические модели: добавление биграмм и учет сходства между униграммами и биграммами ... : Topic models: adding bigrams and taking account of the similarity between unigrams and bigrams ...
|
|
Нокель, М.А.; Лукашевич, Н.В.. - : Научно-исследовательский вычислительный центр Московского государственного университета им. М.В. Ломоносова, 2015
|
|
Abstract:
Представлены результаты экспериментов по добавлению биграмм в тематические модели и учету сходства между ними и униграммами. Предложен новый алгоритм PLSA-SIM, являющийся модификацией алгоритма построения тематических моделей PLSA (Probabilistic Latent Semantic Analysis). Предложенный алгоритм позволяет добавлять биграммы и учитывать сходство между ними и униграммными компонентами. Исследована возможность применения ассоциативных мер для выбора и последующего включения биграмм в тематические модели. В качестве текстовых коллекций взяты русскоязычная подборка статей из электронных банковских журналов, английские части корпусов параллельных текстов Europarl и JRC-Acquiz и англоязычный архив исследовательских работ по компьютерной лингвистике ACL Anthology. Выполненные эксперименты показывают, что существует подгруппа тестируемых мер, упорядочивающих биграммы таким образом, что при последующем их добавлении в предложенный алгоритм PLSA-SIM качество получающихся тематических моделей значительно повышается. ... : The results of experimental study of adding bigrams and taking account of the similarity between them and unigrams are discussed. A novel PLSA-SIM algorithm based on a modification of the original PLSA (Probabilistic Latent Semantic Analysis) algorithm is proposed. The proposed algorithm incorporates bigrams and takes into account the similarity between them and unigram components. Various word association measures are analyzed to integrate top-ranked bigrams into topic models. As target text collections, articles from various Russian electronic banking magazines, English parts of parallel corpora Europarl and JRC-Acquiz, and the English digital archive of research papers in computational linguistics (ACL Anthology) are chosen. The computational experiments show that there exists a subgroup of tested measures that produce top-ranked bigrams in such a way that their inclusion into the PLSA-SIM algorithm significantly improves the quality of topic models for all collections. A novel unsupervised iterative ...
|
|
Keyword:
bigrams; perplexity; PLSA Probabilistic Latent Semantic Analysis; topic coherence; topic models; word association measures; ассоциативные меры; биграммы; перплексия; согласованность тем; тематические модели
|
|
URL: https://en.num-meth.ru/index.php/journal/article/view/828 https://dx.doi.org/10.26089/nummet.v16r222
|
|
BASE
|
|
Hide details
|
|
7 |
of London, UK Reviewed by:
|
|
|
|
In: ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/10/6f/Front_Psychol_2011_Jun_21_2_136.tar.gz (2011)
|
|
BASE
|
|
Show details
|
|
8 |
When ‘more’ in statistical learning means ‘less’ in language: individual differences in predictive processing of adjacent dependencies
|
|
|
|
In: http://cnl.psych.cornell.edu/pubs/2010-mc-cogsci.pdf (2010)
|
|
BASE
|
|
Show details
|
|
9 |
A Controlled Skip Parser
|
|
|
|
In: ftp://ftp.isi.edu/pub/kyamada/skip.ps (1996)
|
|
BASE
|
|
Show details
|
|
11 |
Word recognition in reading - Doctoral thesis ; L'identification des mots au cours de la lecture - Doctorat de Troisième Cycle en Psychologie
|
|
|
|
In: https://hal.archives-ouvertes.fr/tel-01273401 ; Réseau de neurones [cs.NE]. Université de Provence (Aix-Marseille 1), 1983. Français (1983)
|
|
BASE
|
|
Show details
|
|
12 |
Identifying Urdu Complex Predication via Bigram Extraction
|
|
|
|
In: http://kops.uni-konstanz.de/bitstream/handle/123456789/29101/Butt_0-253654.pdf%3Bjsessionid%3DFB808089C5FA051ABD663CB35F558DA5?sequence%3D2
|
|
BASE
|
|
Show details
|
|
13 |
Identifying Urdu Complex Predication via Bigram Extraction M iriam But t 1 T ina Bögel 1
|
|
|
|
In: http://aclweb.org/anthology/C/C12/C12-1026.pdf
|
|
BASE
|
|
Show details
|
|
14 |
Sentiment Analysis of Movie Reviews using POS tags and Term Frequencies
|
|
|
|
In: http://research.ijcaonline.org/volume96/number25/pxc3897048.pdf
|
|
BASE
|
|
Show details
|
|
|
|