Форум » Материалы (архив2) » Поиск сетевого плагиата » Ответить

Поиск сетевого плагиата

Tomas Baranauskas: http://www.copyscape.com/ В поле поиска вставляете адрес страницы и находите, где в интернете скопировано ее содержание (целиком либо частично).

Ответов - 19

Глюкозa: Tomas Baranauskas пишет: В поле поиска вставляете адрес страницы Попробовала вставить вот это: http://historiae.fastbb.ru/index.pl?1-7-0-00000090-000 CopyScape нашёл все форумы, использующие движок FastBB. Что и требовалось доказать :)

Tomas Baranauskas: Страницы форумов со стандартными текстами, их оформляющими, возможно, составляют исключение. Но система находит даже тексты, в которых из вас взято всего лишь несколько предложений, хотя всё остальное отличается. На пример, если брать страницу с текстом Лютового (Colonel Hunter) http://janaberestova.narod.ru/istmetod.html то сразу обнаружим, что она скопирована здесь: http://www.russiancity.ru/fbooks/f1.htm

Глюкозa: А Вы попробуйте наоборот, поищите вот это: http://www.russiancity.ru/fbooks/f1.htm Я то знаю, кто автор. Зачем мне в этом случае такой сервис? Он же не позволяет определить первоисточник, а только ищет группу похожих текстов.


Tomas Baranauskas: Глюкозa пишет: Я то знаю, кто автор. Зачем мне в этом случае такой сервис? Он же не позволяет определить первоисточник, а только ищет группу похожих текстов. Если ищите плагиат, вы должны знать, кто автор. А думающие компьютеры, способные самостоятельно проводить исследования, пока не изобретены. И слава Богу. А то сделали бы нас своими рабами, как некоторых фантастических фильмах :)

Глюкозa: Если я могу сама проанализировать текст и отличить авторское произведение от оригинала, не зная при этом заранее, кто автор, то почему нельзя формально описать этот процесс и затем составить программу? Не вижу здесь особых трудностей. Но больше бы мне хотелось увидеть программу, которая адекватно, с учётом контекста переводила бы текст с одного естественного языка на другой. Не подстрочник с синонимами в скобках :)

Tomas Baranauskas: Глюкозa пишет: Но больше бы мне хотелось увидеть программу, которая адекватно, с учётом контекста переводила бы текст с одного естественного языка на другой. Не подстрочник с синонимами в скобках :) Не претендуя на большую адекватность, думаю, что можно составить такой топ-3 по адекватности: 1. Переводчик Укр-Рус-Укр http://www.uaportal.com/Translator/ 2. AltaVista Babel Fish Translation http://babelfish.altavista.com/ 3. Online-переводчик (Компания ПРОМТ) http://www.translate.ru/translator.asp?lang=ru

Глюкозa: Tomas Baranauskas пишет: 1. Переводчик Укр-Рус-Укр http://www.uaportal.com/Translator/ «Испробуем перо и чернила, какая в них сила» превратился в «Испробуем перо і чорнило, яка в них сила». При обратном переводе текст восстановился. В Расширенный перевод они указали своё же слово «Испробуем» с пометкой «неизвестное слово». Диагноз - подстрочник, причем весьма примитивный и с ошибками. Чувствуется PROMTовский движок, если не хуже. 2. AltaVista Babel Fish Translation http://babelfish.altavista.com/ Пользовалась когда-то. Французско-английский перевод у них неплох, да тут особых усилий и не требуется. 3. Online-переводчик (Компания ПРОМТ) http://www.translate.ru/translator.asp?lang=ru mouse driver — «погонщик мышей» :). Яркий пример того, о чём я говорила. Модель перевода у них почти не включает семантику, из-за чего получаются довольно смешные тексты на выходе. Набор семантических признаков есть, но очень уж примитивный. Добавление неактивных вариантов перевода в версии 7.0 просто переложило проблему на пользователя, нисколько не облегчив ему работу. Пробовала переводить один и тот же текст разными версиями PROMT. Различий никаких. В итоге получаем: 1. AltaVista Babel Fish Translation 2. Online-переводчик (Компания ПРОМТ) 3. Переводчик Укр-Рус-Укр

Зам-Просто: Немного не понял, почему публикация Лютового на русском городе расценивается как плагиат??? Она сделана с разрешения авторов и вледельцев данного форума, запись в заголовке, что это копия с сайта Яны есть. Какой-то странный пример... ЗЫ - опять забыл свой пароль :((, под старым ником отправить не могу Заметил-Просто

Лена М.: Зам-Просто пишет: странный пример Вы совершенно напрасно забеспокоились - приведён-то как раз пример того, что программа находит "плагиат", коий таковым очевидно не является.

Зам-Просто: На самом деле я по другому поводу. Сейчас права на размещение в Русском городе есть не только у меня, но и еще у двух человек, так что теперь обработка книг должна пойти быстрее (а то у меня сейчас времени не очень много). В связи с этим интересны также мнения о том как и в каких форматах размещать публикации в сети (ну и что размещать тоже), а также было бы интересно возобновить сотрудничество, может у кого что есть уже отсканированное и вычитанное. Наша гостевая http://www.russiancity.ru/cgi-bin/signit2.cgi (Надеюсь хозяйка простит эту рекламу) Уже не помню, когда последний раз писал здесь о новинка, так что проще посмотреть в нашей летописи. Dimich'ем выложено несколько статей о Владимире и Н.Н.Воронине. Из больших работ - книга Косточкина "Русское оборонное зодчество XIII-XVI вв.", но она еще не доделана, только 2 части из трех выложены. На самом деле действительно было бы интересно найти еще людей, занимающихся сканированием научных и научно-популярных работ (робкий взгляд в сторону b-graf'а)

Colonel Hunter: Зам-Просто пишет: В связи с этим интересны также мнения о том как и в каких форматах размещать публикации в сети (ну и что размещать тоже) А вы выносите свои идеи сюда - тут и обсудим. Зам-Просто пишет: (робкий взгляд в сторону b-graf'а) У славного графа сейчас проблемы с доступом на этот форум - какие-то технические проблемы. Удачи, Л.

Зам-Просто: Тут - не так интересно, хотя ничего не имею против. Не так интересно в силу а) - небольшой конкуренции, но главное б) - далеко не каждый осмелится писать тут, критерии высоки - это я- наглый слесарь, а прочие робкие работники металлообрабатывающей промышленности и аналогичных ремесел не рискнут. Если более серьезно: постараюсь за праздники подготовить что-то вроде правил подготовки текста для библиотеки (для отправной точки в спорах). Наброски есть и сейчас, но надо облечь их в литературную форму...

Colonel Hunter: Зам-Просто пишет: постараюсь за праздники подготовить что-то вроде правил подготовки текста для библиотеки 1. Ждем. 2. Работники "металлообрабатывающей промышленности" не должны бояться: к искренним любителям истории никаких претензий никогда не было и быть не может. Удачи, Л.

Зам-Просто: Попробовал написать правила подготовки текста для библиотеки. Достаточно быстро понял, что сам с трудом представляю формат документа. Что требовать в обязательном порядке? Что можно требовать для убыстрения работы над текстом (понятно, что некоторая проведенная в момент вычитки работа может существенно облегчить потом работу по подготовке к HTML-публикации)? Что просто рекомендовать как некий прием (так сказать, поделиться опытом)? Так что вариант получился совсем черновой, тем не менее рискнул выложить, чтобы попросту услышать какие-то мнения по поводу того - в ту ли сторону движемся? Сам "проект" лежит здесь http://www.russiancity.ru/books/pravila.htm (пока никаких ссылок на него не ставил) Я, конечно, прочту все замечания здесь, но большая просьба - разместить их также и на гостевой Русского города. http://www.russiancity.ru/cgi-bin/signit2.cgi Заранее всем спасибо за внимание к работникам металлообрабатывающей промышленности :))

Ibicus: В настоящее время мы не можем автоматически превращать шрифтовое оформление редактора Word в тэги HTML. Это почему? Word 2003 имеет функцию Save As Web page, Filtered. Frontpage 2003 - Optimize.

Зам-Просто: Да уж очень они много мусора оставляют. Надо вникать в VBA, о котором я уже забыл, к сожалению. Пожалуй, после Ворда версии 6.0 и не обращался к VBA.

Зам-Просто: Очень много мусора оставляют. Неэстетично! На саммо деле надо вспомнить мне про VBA и написать что-нибудь простенькое, вопрос во времени

Tomas Baranauskas: Зам-Просто пишет: Она сделана с разрешения авторов и вледельцев данного форума, запись в заголовке, что это копия с сайта Яны есть. Какой-то странный пример... Это пример лишь технических возможностей системы. Никакая программа не будет выяснять, есть разрешение - нет рарешения, и о чем договаривались создатели сайтов и авторы. Программа лишь информирует, что там и здесь имеются одинаковые или частично совпадающие тексты. Если вы автор одного из них - вам знать, появился ли второй с вашего разрешения или нет.

Зам-Просто: Да, в общем-то даже это она не особо находит. Вот если подставить туда Твороговскую Влесову книгу, http://www.russiancity.ru/books/b48.htm то ничего система не находит. А тот же Яндекс выдает Кротовскую библиотеку http://www.krotov.info/lib_sec/19_t/tvo/tvorogov2.html (Который, кстати, никаких ссылок на Русский город не дает и разрешения не спрашивает) Словом, система, скорее прикольная чем полезная и работать ИМХО будет только на не очень больших тестах



полная версия страницы