A.Kh. Khakimova

Мера подобия текстов как инструмент оценки интертекстуальности при анализе больших коллекций документов

Title: 
The measure of text similarity as a tool for assessment of intertextuality in large collections of documents
Год/Year: 
2016
№: 
4
Начальная страница/First page: 
62
Краткое описание: 
Предложена методика обнаружения интертекстуальных отношений через нахождение неявных ссылок с помощью лингвистических и статистических методов. Интертекстуальность – это наличие в тексте элементов и идей из других текстов. Продемонстрирована возможность выявления временнóй межъязыковой миграции терминов и идей с целью прогноза и определения идеологических траекторий. Предложена новая мера подобия текстов, апробированная на коллекции научных документов и развиваемая путем максимизации корреляции явных и неявных ссылок. Описана методика кластеризации документов в соответствии с мерой подобия текстов. Продемонстрирована возможность применения предложенной меры для анализа экстремистских текстов из Интернета.
Short description: 
The method for detection of intertextual relations by finding implicit links using linguistic and statistical methods is suggested. Intertextuality is a presence in one text of elements and ideas from other texts. The possibility of identifying of crosslanguage migration of terms and ideas for prognosis and determination of ideological trajectories is demonstrated. A new text similarity measure is suggested. The measure was tested using collection of scientific documents. The measure was improved by maximizing correlation between explicit and implicit links. A method for documents clustering according to the measure of text similarity is suggested. The possible application of the proposed measure for analysis of extremist texts from the Internet is suggested.

Методы оценки качества и влияния (impact) научных статей для повышения объективности индекса научного цитирования

Title: 
Methods of assessing the quality and influence (impact) of scientific articles to improve the objectivity of the science citation index
Год/Year: 
2016
Начальная страница/First page: 
51
Краткое описание: 
Важная современная тенденция в системе оценки работ ученых заключается не только в учете формальных библиографических ссылок на публикуемые статьи, но также в анализе содержания текстов научных работ. Предлагаемый подход к анализу текстов состоит в выявлении неформальных (неявных) ссылок в тексте на авторские идеи. Разработана методика выявления неявных ссылок, которая обеспечивает высокую корреляцию неявных ссылок с формальными. В процессе дальнейших исследований предполагается разработка мер по повышению корреляции явных и неявных ссылок. Это позволит более точно и объективно оценивать не только работы ученых, но и взаимовлияние идей в различных документах, даже в таких, где редко используются формальные ссылки, как, например, в интернет-текстах.
Short description: 
An important current trend in the assessment of the work of scientists is not only to account the formal references in published articles, but also in the analysis of the content of scientifi c texts. The proposed approach to the analysis of texts is to identify the informal (implicit) references in text to the author’s ideas. The developed method of detecting the implicit links provides a high correlation of implicit links with the formal links. In the course of further studies there is planned to develop measures to improve the correlation of the explicit and implicit links. This will allow you to more accurately and objectively assess not only the works of scientists, but also to the interaction between ideas in different documents, even in those that rarely use the formal links, such as, for example, in the online Internet texts.
Subscribe to RSS - A.Kh. Khakimova