|
11.02.2016, 22:07 | #1 |
Gold Member
Регистрация: 01.04.2009
Адрес: Москва
Сообщений: 1,291
|
левые символы
Прислали мне на проверку текст.
С виду (в Ворде 2010) проблем нет, только в некоторых местах нахожу оборванные фразы. Попросил пионэра вычитать текст, а он говорит, что у него все нормально. Задумался и скопировал текст в блокнот. И вместо "Федерация" читаю "Фе де рация". Т.е. имеем принудительно добавленные скрытые пробелы. Вопрос - как их в явном виде показать в Ворде или в нем же удалить. Наверное у этого пустого символа есть код, но как его средствами ворда увидеть и удалить по всему тексту? p.s. Было бы только в некоторых словах удалил бы руками, но в 100 страницах текста их по десятку на строку. p.s.s. Показать и удалить символы надо обязательно, т.к. у пионэра папа дохтур (вместе работаем) и возможный наезд надо встретить 100 страницами по морде. |
---------
Мои ВАК журналы: www.nauteh-journal.ru
Повышение квалификации, переподготовка: www.nauteh-dpo.ru |
|
Реклама | |
|
11.02.2016, 22:20 | #2 |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
МЮрий, в почту. Кажется я знаю как.
|
---------
DNF is not an option
|
|
11.02.2016, 22:28 | #3 |
Junior Member
Регистрация: 10.08.2012
Адрес: "Вся в науке. Наружу торчит одна голова" (с)
Сообщений: 21
|
Как вариант-сохранить текст в PDF, потом через Акробат - снова в Word. Это если просто удалить. Если показать-иногда через антиплагиат показывает...
Hogfather, а можно и мне в личку? |
11.02.2016, 22:31 | #4 |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
Все просто: http://apavlov.ru/obhod-antiplagiat-2/
|
---------
DNF is not an option
|
|
11.02.2016, 23:12 | #5 |
Gold Member
Регистрация: 01.04.2009
Адрес: Москва
Сообщений: 1,291
|
|
---------
Мои ВАК журналы: www.nauteh-journal.ru
Повышение квалификации, переподготовка: www.nauteh-dpo.ru |
|
11.02.2016, 23:14 | #6 |
Platinum Member
Регистрация: 12.03.2010
Адрес: Воронеж
Сообщений: 11,828
|
|
---------
Обычно пуська. Но иногда кое-кому доводится увидеть льва в год тигра...
"Экономика и менеджмент систем управления" - новый cписок ВАК |
|
11.02.2016, 23:29 | #7 | |
Platinum Member
Регистрация: 16.06.2014
Адрес: default city
Сообщений: 4,226
|
Цитата:
|
|
---------
к.х.н., 02.00.06
|
||
12.02.2016, 00:06 | #8 |
Advanced Member
Регистрация: 07.04.2012
Адрес: Московская область
Сообщений: 253
|
Года два уже студиозам предлагаю "сделку" с рефреном "если вы обойдете антиплагиат в тексте и я этого не замечу, потом расскажете как -- зачет автоматом" Пока не никто не подходил. Хороших оригинальных текстов так же не приносят, поэтому версию о том что знают, но не говорят, отвергаем.
Спасибо, теперь еще один вариант известен. |
---------
Он грыз гранит, не жалея ни зубов, ни гранита.
|
|
12.02.2016, 08:57 | #9 |
Platinum Member
Регистрация: 16.06.2014
Адрес: default city
Сообщений: 4,226
|
|
---------
к.х.н., 02.00.06
|
|
12.02.2016, 09:25 | #10 |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
На самом деле задачка оказалась весьма интересная. В документе присутствовало 2 вида "электронной борьбы" с антиплагиатом. Представьте себе документ на 200 страниц, содержащий 2 (два) миллиона знаков. Поделили? Ну, и для полноты ощущений представьте, что еще каждое слово разбито форматированием на несколько частей.
Xml фаил (document.xml), находящийся в архиве (для тех кто не в курсе, docx можно распаковать в папку) занимает 80 Мб. Это без рисунков, если что, рисунки и вложения распиханы по папочкам. 1. Word 2016 для Win и MacOS не открывают исходник 2. Word 2013 для Win не открывает исходник 3. Как обычно выручил LibreOffice 5, но при замене албанских символов на машине без SSD диска виснет и вылетает по таймауту. 4. Etxt Антиплагиат разбиение слова форматированием игнорирует, в то же время оригинальность "до обработки" составляла 33%, оригинальность "после обработки" 18%. Антиплагиат.ру тупо показывает оригинальность 86%. Как говорится, хозяйке на заметку. Отсюда возникает простенькая задачка, на которую сейчас, увы, совсем нет времени. Небольшой скрипт на Perl, который в document.xml будет удалять все албанские символы и непонятное форматирование. Посмотрим, если такую ерунду увижу весной у студентов, то точно не поленюсь и напишу. |
---------
DNF is not an option
|
|