Показать сообщение отдельно
Старый 03.04.2020, 00:14   #1
Аликова Ксения
Junior Member
 
Регистрация: 05.03.2019
Сообщений: 15
По умолчанию Сбор данных в интернете (data mining)

Столкнулась с очень интересной проблемой во время своих исследований - не могу выбрать инструмент для сбора данных для контент-анализа.

Идеально было бы найти что-то что может "майнить дату" (упоминания ключевых слов и сочетаний слов) из новостей с периодичностью раз в час, например.

На это дело нашла несколько инструментов от SemanticForce и youscan, которые для мониторинга упоминаний брендов написаны. До Mozdeh, brandwatch, которые, видимо, для соцсетей все-таки.

Вроде нашла что-то, что выглядит почти идеально для моих задач - https://www.clips.uantwerpen.be/pattern это модуль на питоне в котором можно почти все, что может исследователя интернета интересовать.
Но он ищет только на английском. Короче что-то я совсем запуталась...

Как это делают нормальные люди я не знаю.

Мне надо какой-то относительно простой (можно и модуль, прогать я потихоньку учусь) тул найти, которым реально можно пользоваться для задач контент-анализа: собирать упоминания, ключевые слова, сочетания слов в сети.

Посоветуйте, опытные люди. Не я одна хочу исследовать интернет, я уверена, что кто-то уже что-то написал))
Аликова Ксения вне форума   Ответить с цитированием
Реклама