|
27.01.2016, 10:26 | #1 |
Gold Member
Регистрация: 01.04.2009
Адрес: Москва
Сообщений: 1,291
|
Библиография
Коллеги, вопрос.
Есть у меня библиографический список по теме на большое количество страниц (сколько не суть важно, главное, что руками не перебрать) в Ворде. В нем однозначно есть повторения. Как или чем эту кучу можно превратить в конфетку? |
---------
Мои ВАК журналы: www.nauteh-journal.ru
Повышение квалификации, переподготовка: www.nauteh-dpo.ru |
|
Реклама | |
|
27.01.2016, 10:32 | #2 |
Platinum Member
Регистрация: 12.03.2010
Адрес: Воронеж
Сообщений: 11,828
|
|
---------
Обычно пуська. Но иногда кое-кому доводится увидеть льва в год тигра...
"Экономика и менеджмент систем управления" - новый cписок ВАК |
|
27.01.2016, 10:58 | #3 |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
МЮрий, я бы делал так.
1. Notepad++ отделить названия с помощью регулярных выражений табуляторами Примерно так
## Шаг 1. Выделить все и нажать TAB ## Шаг 2. Отделение авторов. Первая строка, что ищем, вторая на что меняем ## Notepad++ режим регулярные выражения ^\t([\w-]+[\s,]+(\w{1,2}[.]\s*){1,2}([,]\s*([\w-]+[\s,]+(\w{1,2}[.]\s*){1,2})\s*)*) \1\t ## Шаг 3 отделяем названия публикаций ^(.*?)\t(.*?)\s*((/+)|([.]\s+[-]\s?\w+[.])) \1\t\2\t\3\t ## Шаг 4 ищем год публикации и ставим его в конец ([12][90]\d\d)(.*?)$ 2. Выделить все и перетащить в Excel 3. Отсортировать по названию 4. Глянуть глазами А вообще, пользуйтесь библиотечными менеджерами, типа JabRef или Zotero и будет вам Щастье™ |
---------
DNF is not an option
|
|
27.01.2016, 11:04 | #4 |
Gold Member
Регистрация: 08.04.2012
Адрес: Воронеж
Сообщений: 2,046
|
Hogfather, а как думаете - пункт
не получится ли упростить: в соседнем столбце вставить такую функцию (вариант для случая, если названия у нас находятся в столбце А): Код:
=ЕСЛИ(A1=A2;1;0) |
---------
Грамотей-опричникъ
Сварщик я не настоящий, а сюда просто пописать зашел |
|
27.01.2016, 11:07 | #5 |
Заблокирован
Регистрация: 01.10.2010
Сообщений: 3,478
|
А если не маяться дурью и сделать в Ворде упорядочивание по алфавиту, то повторяющиеся названия окажутся рядом друг с другом и их сразу будет заметно - поудалять ручками потом, и все.
|
27.01.2016, 11:17 | #6 | |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
Цитата:
Спасибо за Ваше мнение. Оно офигенно важно для нас. |
|
---------
DNF is not an option
|
||
27.01.2016, 11:21 | #7 |
Заблокирован
Регистрация: 01.10.2010
Сообщений: 3,478
|
|
27.01.2016, 11:29 | #8 |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
|
---------
DNF is not an option
|
|
27.01.2016, 11:32 | #9 | |
Platinum Member
Регистрация: 12.03.2010
Адрес: Воронеж
Сообщений: 11,828
|
Цитата:
|
|
---------
Обычно пуська. Но иногда кое-кому доводится увидеть льва в год тигра...
"Экономика и менеджмент систем управления" - новый cписок ВАК |
||
27.01.2016, 11:38 | #10 |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
kravets, О.Я., приведен как раз рабочий фрагмент парсера, которым я занимался для своих задач. Отловить авторов в начале описания и название самое простое, работает в большинстве случаев. Проблемы начинаются со второй частью разбора, потому как там полная разножопица, решаемая (не на 100%) с помощью тех же регэкспов и элементов нечеткой логики.
|
---------
DNF is not an option
|
|