Romeo
Цитата:
Загнал туда в несколько заходов обзорную главу
|
Видимо, через быструю проверку и вставку из буфера обмена? Это, кстати, неудобно: ограничение в 5000 символов. Там если зарегистрироваться, можно загружать на сайт прямо документы в текстовом формате (doc прекрасно берет), так что всю главу можно было загрузить в один прием. Плюс в рабочем кабинете результаты сохраняются. Удобно.
Цитата:
Так что БД надо развивать: без нее пока все это - не более чем игрушка.
|
Это безусловно.
Свои впечатления:
Естественно, зарегистрировался и стал развлекаться, проверяя собственные статьи и прочие попавшиеся под руку тексты. Результаты любопытные, система действительно работает, хотя и не без мелких огрехов. Три статьи показали уровень собственного текста в 100, 99 и 99 процентов соответственно, причем в двух последних случаях как раз и проявились огрехи: например, программа посчитала заимствованием часть библиографического описания книги:
М. : Современная экономика и право, 2004. Именно за это был снят один процент. Видимо, потому, что статья в целом очень небольшая. В третьем случае также заимствованием была посчитана строчка с бухгалтерской проводкой (которые на самом деле стандартны). Так что, в целом результат очень хороший и соответствует реальности.
С другой стороны, на специально смоделированном для эксперимента тексте с существенными заимствованиями система показала процент собственного текста 67%, что также примерно соответствует действительности.
В общем, весьма интересно. Рекомендую попробовать. Конечно, нетрудно спрогнозировать появление систем защиты (хотя бы по принципу перетасовки слов в предложениях или что-то в том же роде), но... Посмотрим.