Портал аспирантов

Портал аспирантов (http://www.aspirantura.spb.ru/forum/index.php)
-   Обсуждение диссертаций (http://www.aspirantura.spb.ru/forum/forumdisplay.php?f=151)
-   -   НИУ ВШЭ диссертация 05.13.18 (http://www.aspirantura.spb.ru/forum/showthread.php?t=9492)

badalek 11.04.2012 11:21

Цитата:

Сообщение от Aspirantfm (Сообщение 235440)
критерий - не количество ссылок. а релевантность, т.е. соответствие запросу и расположение в рейтинге ответов.

То есть по Вашему мнению, по этому критерию разработанная система проигрывает яндексу?

Amok 11.04.2012 11:27

Если честно, по автореферату меня смущает соотвествие требованиям специальности.
Практической пользы от диссерта действительно мало, он вместо 1 запроса генерирует тучу запросов, увеличивая в разы загрузку. Что явно будет не понравиться поисковым машинам.

badalek 11.04.2012 11:31

Цитата:

Сообщение от Amok (Сообщение 235444)
Если честно, по автореферату меня смущает соотвествие требованиям специальности.
Практической пользы от диссерта действительно мало, он вместо 1 запроса генерирует тучу запросов, увеличивая в разы загрузку. Что явно будет не понравиться поисковым машинам.

Ну вот, к примеру я ищу понятие "система":
Разработанный продукт даёт 10 вариантов: http://www.aosengine.ru/
Яндекс даёт вот что: http://yandex.ru/yandsearch?text=%D0...lid=40316&lr=2

Как мне это сравнивать и насколько объективным будет такое сравнение?

Amok 11.04.2012 11:32

Цитата:

Сообщение от badalek (Сообщение 235443)
То есть по Вашему мнению, по этому критерию разработанная система проигрывает яндексу?

Может там что-то сломалось, но проигрывает.

На запрос из диссертации "Каковы успехи компании Intel за 2011 год?" Сумбурная выдача. Нужной ссылки нет, есть куча информации по связанным вопросам.

Яндекс выдает релевантную информацию. 2 ссылка.

Hogfather 11.04.2012 11:33

Aspirantfm, видите ли, десять лет тому назад я решил задачу поиска по номенклатуре запасных частей военных кораблей с учетом возможных ошибок в чертежах, названиях и семантики запросов, но я не видел в этом научной новизны. Может быть, зря...
Сейчас я занимаюсь несколько иным, но функционал, описанный в автореферате, я использую в запросах Google, поэтому и возник вопрос об отличиях от существующего. А что тема бесконечна я прекрасно понимаю, поскольку, например, полного распознавания речи или безошибочных переводов мы пока не имеем.

Amok 11.04.2012 11:34

Цитата:

Сообщение от badalek (Сообщение 235447)
Ну вот, к примеру я ищу понятие "система":
Разработанный продукт даёт 10 вариантов: http://www.aosengine.ru/
Яндекс даёт вот что: http://yandex.ru/yandsearch?text=%D0...lid=40316&lr=2

Как мне это сравнивать и насколько объективным будет такое сравнение?

Есть методики оценки поисковых машин. Есть даже крупные системы, которые этим занимаются.
В данном случае, просто Яндекс стремиться прорекламировать свои новости, как Google стремиться везде впихнуть Google Plus.

http://analyzethis.ru/

badalek 11.04.2012 11:39

В поисковике разработанной поисковой машины указано, что поиск реализован с использованием Яндекс.XML: так что это в работе развивается некая подсистема системы Яндекс? В этом случае происходит сравнение системы с подсистемой? Корректно ли?

Aspirantfm 11.04.2012 11:44

Цитата:

Сообщение от Hogfather (Сообщение 235449)
Сейчас я занимаюсь несколько иным, но функционал, описанный в автореферате, я использую в запросах Google

Как Вы его используете в запросах гугла ?

Добавлено через 2 минуты
Цитата:

Сообщение от badalek (Сообщение 235451)
В поисковике разработанной поисковой машины указано, что поиск реализован с использованием Яндекс.XML: так что это в работе развивается некая подсистема системы Яндекс? В этом случае происходит сравнение системы с подсистемой? Корректно ли?

в работе предлагается осуществить предварительную обработку запросов, разделив на несколько подзапросов к яндексу , затем сшить результат. Сравнить естественно нужно с яндексом. Так как это попытка улучшить релевантность ответов яндекса

Amok 11.04.2012 11:46

Цитата:

Сообщение от badalek (Сообщение 235451)
В поисковике разработанной поисковой машины указано, что поиск реализован с использованием Яндекс.XML: так что это в работе развивается некая подсистема системы Яндекс? В этом случае происходит сравнение системы с подсистемой? Корректно ли?

Да вроде бы корректно.
Там техника такая. Берется запрос, на его основе строятся уточнящие запросы. Затем все эти запросы подаются в существующую поисковую систему. Полученный ответ фильтруется.

Якобы после этого должно быть увеличение релевантности. Однако, поисковая система, такая как Яндекс или Гугл - фактически это черный ящик. Мы не знаем их аглоритмов (или те кто ходят на их конференции отдаленно имеют представление), более того они меняются. А тут попытка построить на основе такого черного ящика свою надстройку.
Ну и даже теоритически увеличение релевантности происходит за счет многократного увеличения числа запроосов.
То есть нагрузка Яндекса в случае перехода на этот алгоритм увеличится в 20-40 раз.
Ценность такой методики кажется мне сомнительной. Работа строится на работах научрука - это видно, может быть, там автор что-то добавил и расширил - лень уж совсем углубляться.

Hogfather 11.04.2012 11:52

Цитата:

Сообщение от Aspirantfm (Сообщение 235453)
Как Вы его используете в запросах гугла ?

Тупо пишу запросы, например, как в автореферате, и получаю результат. Что-то не так? Насколько я знаю, поисковая машина Google уже понимает кое-что и это постоянно развивается [1]


Текущее время: 22:22. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2024, «Аспирантура. Портал аспирантов»