Показать сообщение отдельно
Старый 04.01.2012, 01:16   #14
sergey_shumow
Newbie
 
Регистрация: 03.01.2012
Адрес: Нижний Новгород
Сообщений: 9
По умолчанию

Kayra, вычленить просто беглым просмотром основные мысли (наиболее часто фигурирующие во всём массиве текстов) из 60 статей, скажем 10 страниц каждая - 600 страниц - не очень-то просто, если Вы не обладаете феноменальной памятью и не можете удержать в голове весь этот материал, после чего его структрировать, опять же, не так как вам больше нравится, а объективно, опираясь на принцип частотности (частотность упоминания мыслей, тем в текстах) - то есть идентифицируя те мысли, о которых авторы говорят наиболее часто - значит уделяют им наибольшее внимание. Лично я не в состоянии, это сделать, не уходя проявляя свою субъективность. Кстати, я написал, что 4 дня я НЕ НАПРЯГАЯСЬ, УДЕЛЯЯ ВСЕГО НЕСКОЛЬКО ЧАСОВ В ДЕНЬ, добился результата (кстати, одобренного научным руководителем). Вы пробовали такой объём статей просматривать бегло за несколько дней? ту же самую работу можно сделать, например, и дня за 2.
А если статей не 60? предположим 200. И предположим, часть из них книги. Опять же - я не берусь бегло осмыслить основные мысли этого материала и чётко их структурировать, на выходи получив стройную аннотацию.

Вы спросили про синонимы... Повторюсь - из всего массива текстов выбираются наиболее частотные слова - синонимы к этому не имеют никакого отношения. Если речь идёт о синонимах - можно говорить и категориальном словаре, а не о частотном - единицы счёта задаются на основе заранее выбранных категорий, а не на основе встречаемости в массиве текстов. В этом случае возможно получить информацию по заранее выбранным темам, а не по наиболее важным и часто освещаемым в массиве текстов. Если в словаре присутствуют синонимы они посредством факторизации будут интегрироваться в уникальном факторе, а не разбрасываться по всей факторной модели.
Kayra, извините, не понимаю какое отношение имееет поиск в акробат ридере или поиск в операционной системе к данному типу анализа материала. Поясните пожалуйста, какое отношение это имеет к качественно-количественному контент-анализу?
Степан Капуста и DOCTOR: по поводу скептических высказываний в адрес метода (не программы, а метода - именно об этом речь - ЛЕКТА, просто средство его реализации) - правильно ли я вас понял: для того, чтобы, например, корректно произвести факторный анализ, нельзя использовать какой-либо софт (например, STATISTICA, SPSS и т.д. и т.п.) (ведь за него стоит пожизненно дисквалифицировать, как вы выражаетесь), а делать это необходимо с использованием листа бумаги и ручки?
sergey_shumow вне форума   Ответить с цитированием
Реклама