Портал аспирантов

Портал аспирантов (http://www.aspirantura.spb.ru/forum/index.php)
-   Обсуждение диссертаций (http://www.aspirantura.spb.ru/forum/forumdisplay.php?f=151)
-   -   НИУ ВШЭ диссертация 05.13.18 (http://www.aspirantura.spb.ru/forum/showthread.php?t=9492)

Amok 11.04.2012 11:34

Цитата:

Сообщение от badalek (Сообщение 235447)
Ну вот, к примеру я ищу понятие "система":
Разработанный продукт даёт 10 вариантов: http://www.aosengine.ru/
Яндекс даёт вот что: http://yandex.ru/yandsearch?text=%D0...lid=40316&lr=2

Как мне это сравнивать и насколько объективным будет такое сравнение?

Есть методики оценки поисковых машин. Есть даже крупные системы, которые этим занимаются.
В данном случае, просто Яндекс стремиться прорекламировать свои новости, как Google стремиться везде впихнуть Google Plus.

http://analyzethis.ru/

badalek 11.04.2012 11:39

В поисковике разработанной поисковой машины указано, что поиск реализован с использованием Яндекс.XML: так что это в работе развивается некая подсистема системы Яндекс? В этом случае происходит сравнение системы с подсистемой? Корректно ли?

Aspirantfm 11.04.2012 11:44

Цитата:

Сообщение от Hogfather (Сообщение 235449)
Сейчас я занимаюсь несколько иным, но функционал, описанный в автореферате, я использую в запросах Google

Как Вы его используете в запросах гугла ?

Добавлено через 2 минуты
Цитата:

Сообщение от badalek (Сообщение 235451)
В поисковике разработанной поисковой машины указано, что поиск реализован с использованием Яндекс.XML: так что это в работе развивается некая подсистема системы Яндекс? В этом случае происходит сравнение системы с подсистемой? Корректно ли?

в работе предлагается осуществить предварительную обработку запросов, разделив на несколько подзапросов к яндексу , затем сшить результат. Сравнить естественно нужно с яндексом. Так как это попытка улучшить релевантность ответов яндекса

Amok 11.04.2012 11:46

Цитата:

Сообщение от badalek (Сообщение 235451)
В поисковике разработанной поисковой машины указано, что поиск реализован с использованием Яндекс.XML: так что это в работе развивается некая подсистема системы Яндекс? В этом случае происходит сравнение системы с подсистемой? Корректно ли?

Да вроде бы корректно.
Там техника такая. Берется запрос, на его основе строятся уточнящие запросы. Затем все эти запросы подаются в существующую поисковую систему. Полученный ответ фильтруется.

Якобы после этого должно быть увеличение релевантности. Однако, поисковая система, такая как Яндекс или Гугл - фактически это черный ящик. Мы не знаем их аглоритмов (или те кто ходят на их конференции отдаленно имеют представление), более того они меняются. А тут попытка построить на основе такого черного ящика свою надстройку.
Ну и даже теоритически увеличение релевантности происходит за счет многократного увеличения числа запроосов.
То есть нагрузка Яндекса в случае перехода на этот алгоритм увеличится в 20-40 раз.
Ценность такой методики кажется мне сомнительной. Работа строится на работах научрука - это видно, может быть, там автор что-то добавил и расширил - лень уж совсем углубляться.

Hogfather 11.04.2012 11:52

Цитата:

Сообщение от Aspirantfm (Сообщение 235453)
Как Вы его используете в запросах гугла ?

Тупо пишу запросы, например, как в автореферате, и получаю результат. Что-то не так? Насколько я знаю, поисковая машина Google уже понимает кое-что и это постоянно развивается [1]

Aspirantfm 11.04.2012 11:53

Цитата:

Сообщение от Amok (Сообщение 235457)
Однако, поисковая система, такая как Яндекс или Гугл - фактически это черный ящик. Мы не знаем их аглоритмов (или те кто ходят на их конференции отдаленно имеют представление), более того они меняются. А тут попытка построить на основе такого черного ящика свою надстройку.
Ну и даже теоритически увеличение релевантности происходит за счет многократного увеличения числа запроосов.
То есть нагрузка Яндекса в случае перехода на этот алгоритм увеличится в 20-40 раз.

На самом деле это не страшно. ну и что, что черный ящик. Всегда можно на основе импульсной характеристики управлять системой. А ее можно рассчитывать и адаптироваться к ней, даже если она меняется. Так что идея вполне имеет право на существование, возможно, она бы дала неплохой результат, если бы было предложено что-то серьезное. Яндекс и Гугл сами монстры в семантическом поиске и улучшить их результаты можно не стандартным ходом. То, что предложено - не работает. В этом основной недостаток.

Добавлено через 1 минуту
Цитата:

Сообщение от Hogfather (Сообщение 235461)
Тупо пишу запросы, например, как в автореферате, и получаю результат. Что-то не так? Насколько я знаю, поисковая машина Google уже понимает кое-что и это постоянно развивается [1]

ну т.е. вы не поняли идею диссертации.

badalek 11.04.2012 11:53

Цитата:

Сообщение от Amok (Сообщение 235457)
То есть нагрузка Яндекса в случае перехода на этот алгоритм увеличится в 20-40 раз.

А на что это в итоге влияет? На скорость работы компьютера (загрузки сети и т.п.)?
Цитата:

Сообщение от Aspirantfm (Сообщение 235453)
Сравнить естественно нужно с яндексом. Так как это попытка улучшить релевантность ответов яндекса

Понятно, ну что ж интересно (узнаю что-то новенькое).

Amok 11.04.2012 11:56

Цитата:

Сообщение от badalek (Сообщение 235464)
А на что это в итоге влияет? На скорость работы компьютера (загрузки сети и т.п.)?

Понятно, ну что ж интересно (узнаю что-то новенькое).

Поиск очень ресурсоемкая задача, скорей всего понадобиться кратное увеличение мощности поискового кластера.

Hogfather 11.04.2012 11:58

Цитата:

Сообщение от Aspirantfm (Сообщение 235462)
ну т.е. вы не поняли идею диссертации.

Вполне допускаю.

Цитата:

Цель исследования: разработать такой метод семантического
преобразования важных с практической точки зрения естественно-языковых
поисковых запросов в форму (множество производных запросов),
позволяющую традиционным системам поиска обнаружить наиболее
релевантные результаты, который предусматривает применение формальных
средств для описания (а) системы концептуальных единиц первичного
уровня, (б) логической структуры базы знаний для поддержки
преобразования запросов и поиска.
Вы уверены, что это не делается в поисковых машинах сейчас? Не добываем мы изюм из булочек?

Aspirantfm 11.04.2012 12:03

Цитата:

Сообщение от Hogfather (Сообщение 235466)
Вы уверены, что это не делается в поисковых машинах сейчас? Не добываем мы изюм из булочек?

не уверены, само собой. но этого нет смысла обсуждать, так как это ноу-хау. может есть, а может и нет. Применение этого - не улучшает ситуацию, это не значит , что это есть, это значит, что то, что предложено не работает. Почему оно не работает - это надо либо смотреть диссертацию, либо разбираться в ноу-хау Гугла и Яндекса. Никто этим заниматься не будет.

andrewM 07.10.2012 00:34

Aspirantfm,
А чего, так интересная тема.

А как сделали вывод что не работает?
Сколько запросов проверили?

Просто может методика на каких-то примерах и работает.
В поисковиках сейчас уже вроде как за % улучшений стали бороться.

Alarmod 07.10.2012 07:23

Про релевантность. Обратите внимание на http://exactus.ru/ . Вот с чем надо сравнивать.


Текущее время: 21:30. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»