Zametki na polyah (akor168) wrote,
Zametki na polyah
akor168

Categories:

Поиск: несколько схем ответов

После очередного сеанса с поиском изображений по гуглу сформулировалась гипотеза о том, что мешает взлететь методам машинного обучения, которые судя по всему активно пытаются реализовать, но получается то ли плохо, то ли очень плохо. Замечу, что поиск по изображениям это в данный момент лучшая часть текущего поиска у гугла, ибо поиск по ключевым словам находится уже давно ниже плинтуса.

Почему ниже плинтуса, потому что гугл перестал находить именно то, о чем юзеру(в частности) известно, что оно точно было. Нет, конечно, можно предположить отрыжки копирайта, закрытие сайтов и прочая. Но не в таких же количествах? Более того, ранее известная штука, таки как правило находится через пляски с бубном и цепочку запросов. Но вот почему оно не находится сразу как раньше?

И похоже дело в том, что проблема в попытке делать универсальный ответ на пользовательский запрос. Вы скажете, ведь ровно наоборот, типа поисковики наоборот пытаются подсунуть местечковый вариант ответа на запрос. А я скажу здесь нет противоречия - поисковик реально пытается угадать, что я хочу и выдает мне агрегированный, и зачастую совершенно бесполезный ответ. Так вот не надо пытаться сделать ЛУЧШИЙ ответ. Наоборот, надо генерировать много разных ответов с разными весами разных признаков и выдавать пользователю разные картины, если он остался недовольным агрегированной.

Поясню на примере: я ищу ранее известную мне картинку, где я знаю есть точно слова "Анита" и "Понго". Умный алгоритм машинного обучения(или какой другой) понимает, что это про мультфильм 101 далматинец и выдает мне кучу релевантных и самых популярных картинок к этому мультфильму. Но среди нет нужной мне. Ранее, более тупые алгоритмы, которые как раз анализировали слова и подписи на, эту картинку выдавали. Что же произошло - вес наличия этих слов на картинке в настоящем имплементированном алгоритме недостаточен для того, чтобы эта картинка считалась бы близкой к облаку смыслов моего запроса. Потому мне ее и не выдают. Но, представим, что система потом пересчитает веса признаков так, чтобы наличие слов внутри картинки весило гораздо больше и выдает мне другой ответ. А потом еще один, и еще. На тот же самый запрос но с разнми весами. То есть нужна не одна универсальная схема, а много разных(причем каких тоже вполне может и должен решать алгоритм по статистикам использования), и если пользователя не удовлетворяет результат одной схемы он должен иметь возможность попросить альтернативные варианты. Более того, при этой схеме запроса на другую схему результатов поиска, пользователь выступает как представитель тестовой выборки для коррекции того самого универсального основного алгоритма. То есть, когда люди недовольны общим алгоритмом, но берут результаты специальных схем, это повод пересчитать и работу основной схемы. Более того, надо даже угадывать какая схема оптимальна для данного юзера(и данного запроса). То есть, да, результаты у разных людей по тем же самым запросам запросто будут различаться и сильно. Но это будет правильное различие, а не как сейчас.
То есть после того, как я набрал Анита и Понго и не нашел своей ссылки, я нажимаю на попробовать "альтернативные схемы поиска", и поисковик пытается понять, что мне таки нужно, уже с учетом информации, что общая схема не прошла. Повторюсь, это одновременно улучшает и общую схему, и на самом деле вовсе не обязательно должно приводить к большему использованию ресурсов, если такие запросы будут уменьшаться с улучшением генеральной линии. Сейчас же я, сделав один неудовлетворительный запрос, все равно продолжаю бомбардировать поисковик, тратя его ресурсы, а в конце еще и ухожу разочарованным.

Резюмирую - не надо пытаться сделать идеальный ответ - делайте несколько заведомо разных вместо, и предлагайте их пользователю, анализируйте его реакцию, и тем самым улучшайте качество всех используемых схем.
Subscribe

  • 3-0 vs 42-0

    To put the magnitude of the U.S. defeat in context, losing 3-0 in soccer is the equivalent of losing 42-0 in football. Реально улыбнуло, поскольку…

  • Анекдоты: полная потеря смысла при пересказе

    Знаете, когда обсуждается сложность перевода с одного языка на другой, обычно рассказывается пример с круглым столом где каждый знает языки двух…

  • полезность регулярных проф-заметок

    Терри Тао пишет аж в 2013 году(в комментах) про полезность ведения ЖЖ собственного блога, в котором можно записывать прочитанные результаты,…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 25 comments

  • 3-0 vs 42-0

    To put the magnitude of the U.S. defeat in context, losing 3-0 in soccer is the equivalent of losing 42-0 in football. Реально улыбнуло, поскольку…

  • Анекдоты: полная потеря смысла при пересказе

    Знаете, когда обсуждается сложность перевода с одного языка на другой, обычно рассказывается пример с круглым столом где каждый знает языки двух…

  • полезность регулярных проф-заметок

    Терри Тао пишет аж в 2013 году(в комментах) про полезность ведения ЖЖ собственного блога, в котором можно записывать прочитанные результаты,…