 
  Ресурсы Интернета: Поиск в "Яндекс" стал точнее
      Компания "Яндекс" подвела первые итоги применения технологии "Матрикснет", обеспечивающей обучение поисковой машины. Благодаря новой технологии, поисковику удалось вернуть себе прежние позиции на рынке - 62,9% (последний раз такая доля у "Яндекса" была в далеком 2006 году) - и улучшить качество выдачи на 5%.
Технологии обучения машин появились еще в 1950-х гг. прошлого века. В настоящее время такой подход широко применяется для распознавания образов и голоса.
На данный момент в мире существует две самых известных и крупных школы машинного обучения: Support vector machines и Boosting. Первая идет по пути учета и обработки данных о сотнях факторов, характеризующих "разучиваемый" машиной объект. Алгоритмы SVM работают довольно быстро. Второй подход базируется на анализе объектов по тысячам факторов, но и расчеты занимают гораздо больше времени. Поэтому все поисковики до недавнего времени работали именно по системе SVM.
"Яндекс" первым решился использовать Boosting. На разработку новой системы ушло полтора года. В итоге специалистам компании удалось создать технологию "Матрикснет", которая с приемлемой скоростью быстро работает с тысячами факторов. Дело в том, что раньше основными данными для машины были оценки на соответствие между запросом и страницей, выставленные людьми. Из-за небольшого количества оценок поисковая машина начинала искать и находить несуществующие закономерности, опираясь на оценки немногочисленных экспертов-людей. Новая система не опирается на оценки людей и поэтому не допускает ошибки.
По словам генерального директора компании "Яндекс" Аркадия Воложа, благодаря "Матрикснет", поисковая машина стала лучше искать по редким и сложным запросам. Сузилась и поисковая выдача по городам (поисковик работает по 1250 городам России и Украины), что особенно важно, поскольку 20% всех поисковых запросов регионально зависимы. В компании уверены, что на данный момент конкуренты не могут предложить пользователям ничего подобного. Но в ближайший год что-то похожее появится и у них.
 
   
     En
 En Ru
 Ru