Глава Google Research рассказывает о проектах исследовательского отдела.By Kate Greene
Peter Norvig, директор исследовательского отдела Google, является экспертом РІ создании РјР°С?РёРЅ, которые отвечают РЅР° сложные РІРѕРїСЂРѕСЃС‹. Будучи специалистом РІ языках программирования Рё искусственном интеллекте, РѕРЅ написал часто цитируемую РєРЅРёРіСѓ “Р?скусственный Р?нтеллект: Современный Подход” (Artificial Intelligence: A Modern Approach), преподавал РІ Университете Калифорнии, Беркли Рё университете Южной Калифорнии, Рё был главой департамента компьютерных наук NASA. Р’ 2001 РіРѕРґСѓ Norvig переС?ел РІ Google, чтобы стать директором отдела РїРѕ качеству РїРѕРёСЃРєР°. Через четыре РіРѕРґР° РѕРЅ стал директором исследовательского отдела, имея РІ подчинении более 100 исследователей, которые изучали С?РёСЂРѕРєРёР№ РєСЂСѓРі РІРѕРїСЂРѕСЃРѕРІ РѕС‚ сетей РґРѕ РјР°С?РёРЅРЅРѕРіРѕ перевода. Technology Review поговорила СЃ Norvig, чтобы разузнать, что РЅРѕРІРѕРіРѕ РјС‹ можем ожидать РІ поисковых технологиях РІ ближайС?РёРµ РіРѕРґС‹.
Technology Review: Чем занимается Google Research?
Peter Norvig: РћСЃРЅРѕРІР° РЅР°С?РёС… исследований - РїРѕРёСЃРє Рё реклама. Множество исследователей работают над этим. РћРЅРё работают над тем, как повысить качество РїРѕРёСЃРєР° Рё как улучС?ить релевантность рекламных объявлений. Другая область исследований - СЃР±РѕСЂ больС?его количества источников информации, таких как текст РёР· РєРЅРёРі, изображения, видео, Рё теперь СѓР¶Рµ даже звуковая информация РІ целях распознавания речи. РЇ думаю РґСЂСѓРіРѕР№ фокус исследований - понять, как люди взаимодействуют СЃ Google Рё РґСЂСѓРі СЃ РґСЂСѓРіРѕРј РІ сети вообще. Что люди делают РІ социальных сетях? Понимание этого РІРѕРїСЂРѕСЃР° может помочь нам лучС?Рµ обслуживать людей.
TR: Р’ какой области исследований занято больС?Рµ всего людей?
PN: Есть РґРІР° самых крупных проекта: РјР°С?инный перевод Рё голосовой проект (распознавание речи). Сначала этими проектами занимались РѕРґРёРЅ-РґРІР° человека, Р° теперь это наиболее актуальные темы.

TR: РџРѕС…РѕР¶РёРј образом развивается Рё проект Google Labs, названный GOOG-411 (бесплатный сервис, который позволяет людям искать местные компании, РїСЂРѕРёР·РЅРѕСЃСЏ поисковый запрос РїРѕ телефону). Расскажите нам больС?Рµ РѕР± этом проекте.
PN: РЇ думаю это лучС?РёР№ сервис такого СЂРѕРґР° (основанный РЅР° телефонных разговорах бизнес-РїРѕРёСЃРє), РЅРµ имеющий аналогов РІ РјРёСЂРµ. РћРЅ РЅР° 100% автоматизирован, Рё этому есть простое объяснение. Р’ общих чертах, РїРѕС…РѕР¶Рµ РЅР° то, что РІСЃРµ движется Рє мобильности рынка, Рё РјС‹ подумали, что важно уметь работать СЃ таким рынком, даже РєРѕРіРґР° Сѓ вас нет РїРѕРґ СЂСѓРєРѕР№ клавиатуры или вам лень вводить поисковые запросы.
TR: Р? распознавание речи может быть полезно также Рё для РїРѕРёСЃРєР° видео, РЅРµ так ли? Blinkx Рё Everyzing - примеры таких начинаний, которые используют технологию РїРѕРёСЃРєР° видео. Google работает над чем-то РїРѕС…РѕР¶РёРј?
PN: На данный момент люди мало ищут видео. А если ищут, то названия конкретных фильмов. Люди не ищут что-то вроде “Покажите мне разговор, в котором тот-то и тот-то говорят про аспекты средневековой истории”. Но вся информация именно в таком запросе, и благодаря распознаванию речи мы можем до нее дотянуться.
РњС‹ хотели создать голосовую технологию, которая могла Р±С‹ служить нам как интерфейс для телефонов Рё позволила Р±С‹ индексировать аудио текст. Посмотрев РЅР° существующие технологии, РјС‹ СЂРµС?или создать СЃРІРѕСЋ собственную. РњС‹ подумали, что имея доступные нам данные Рё вычислительные ресурсы, РјС‹ могли Р±С‹ сделать еще очень РјРЅРѕРіРѕ РІ данной области. РќР° данный момент РјС‹ разработали новейС?СѓСЋ Рё наиболее соверС?енную технологию, Рё Сѓ нас есть вычислительные мощности для ее дальнейС?его соверС?енствования. Как только РјС‹ получим больС?Рµ данных Рѕ взаимодействии СЃ пользователями Рё Рѕ статистике загрузок видео, РЅР°С?Рё системы станут лучС?Рµ, поскольку новые данные постоянно соверС?енствуют алгоритм.
TR: Поскольку больС?инство исследований РїСЂРѕРёСЃС…РѕРґСЏС‚ Р·Р° опущенным занавесом, то РІРЅРµС?РЅРµ выглядит так, как будто поисковые технологии РЅРµ изменились Р·Р° последние более чем 10 лет. Что меняется РІ пользовательском интерфейсе Google?
PN: РњС‹ находимся РІ такой ситуации, что веб-РїРѕРёСЃРє РЅРµ сбалансирован. Люди дают нам три слова, Рё РІ то Р¶Рµ время РјС‹ возвращаем РёРј множество информации: 10 ссылок СЃ заголовками, текстовым сниппетом Рё РґСЂСѓРіРѕР№ информацией Рѕ странице. РўРѕ есть РјС‹ СЃРїРѕСЃРѕР±РЅС‹ дать РјРЅРѕРіРѕ Рё сразу. Если Сѓ пользователя больС?РѕР№ экран, РѕРЅ может очень быстро использовать ответ Google. Р?так, это взаимодействие быстрое, РЅРѕ очень несбалансированное. Сейчас РјС‹ ищем возможность сделать пользователей более вовлеченными РІ процесс взаимодействия, чтобы РѕРЅРё рассказали нам, чего РѕРЅРё хотят. Люди РІРІРѕРґСЏС‚ запрос “карта”, Рё остаются недовольны, если РІ выдаче РЅРµ та карта, Рѕ которой РѕРЅРё думали. Значит РЅСѓР¶РЅРѕ дать людям возможность больС?Рµ говорить, чем печатать. Р?ли РёРј придется принять то, что предлагаем РјС‹ - РЅРµ то, что РѕРЅРё вводили РІ РїРѕРёСЃРєРµ, Р° нечто похожее.
РќРѕ есть Рё РґСЂСѓРіРёРµ РІРёРґС‹ взаимодействия СЃ РїРѕРёСЃРєРѕРј, РєСЂРѕРјРµ РѕСЃРЅРѕРІРЅРѕРіРѕ веб-РїРѕРёСЃРєР°. Если РІС‹ пользуетесь мобильным телефоном, РІС‹ можете видеть только РѕРґРЅСѓ ссылку одновременно. Рто полностью меняет правила РёРіСЂС‹. Для нас такая ситуация - мощный толчок Рє улучС?ению корректности РїРѕРёСЃРєР°. Поэтому РјС‹ исследуем Рё такие РІРёРґС‹ взаимодействия, Рё то, как применить Р·РІСѓРє для предоставления информации.
TR: А есть какие-нибудь необычные проблемы в поиске?
PN: Есть РґРІР° основных момента. Первый - понимание потребности пользователей. Второй - понимание содержания документов, причем неважно, будет это веб-страница или видео. БольС?Рµ всего внимания РјС‹ обращаем РЅР° то, что пользователь РІРІРѕРґРёС‚ РІ строке РїРѕРёСЃРєР°, разделяем РІРІРѕРґ РЅР° отдельные слова, считаем РёС… количество РЅР° страницах Рё разделяем страницы РїРѕ весу, используя множество факторов. РќРѕ РјС‹ смотрим РЅРµ только РЅР° вводимые слова. РњС‹ также рассматриваем различные варианты РїСЂРѕРёР·РЅРѕС?ения слов, Рё если пользователь РІРІРѕРґРёС‚ длинный запрос, РјС‹ делим его РЅР° части. Р’РѕР·РјРѕР¶РЅРѕ, пользователь имел РІРІРёРґСѓ РѕРґРЅРё слова, Р° РґСЂСѓРіРёРµ совсем неважны.
TR: Похоже на элементы естественно-языкового поиска, когда люди вводят вопрос, например, вместо нескольких ключевых слов. Как Google разрабатывает естественно-языковой поиск?
PN: РЇ думаю, что есть целый РєСЂСѓРі РІРѕРїСЂРѕСЃРѕРІ, которые РІС‹ можете причислить Рє естественно-языковому РїРѕРёСЃРєСѓ. Первой частью этого “круга” РјС‹ занимаемся СѓР¶Рµ долгое время. Например, РјС‹ понимаем СЃРёРЅРѕРЅРёРјС‹ Рё что РґРІР° слова Сан Франциско должны идти РїРѕРґСЂСЏРґ. РќРѕ еще есть Лас Вегас Рё Вегас, которые означают РѕРґРЅРѕ Рё то Р¶Рµ, Рё РќСЊСЋ Йорк Рё Йорк, которые СѓР¶Рµ значат разные вещи. Рти РІРѕРїСЂРѕСЃС‹ РјС‹ СѓР¶Рµ СЂРµС?или. Другая составляющая естественно-языкового РїРѕРёСЃРєР° - разделение длинного запроса РЅР° компоненты. РўРѕ есть удаленный пользователь РїРёС?ет законченное предложение РїРѕ-английски Рё получает законченное предложение РІ ответ. Ртим РІРѕРїСЂРѕСЃРѕРј РјС‹ еще РЅРµ занимались. Р’С‹ можете ввести “население Японии”, Рё РјС‹ вам это покажем. РќРѕ для больС?инства РІРѕРїСЂРѕСЃРѕРІ это РЅРµ то, чего хотят люди. РћРЅРё РЅРµ хотят утруждаться, составляя РІ СѓРјРµ РёР· отдельных данных нормальное предложение.
TR: Р’Р°С?Р° специальность - искусственный интеллект. РќРµ является ли Google РІ своей РѕСЃРЅРѕРІРµ AI компанией, использующей самообучающиеся РјР°С?инные алгоритмы для РїРѕРёСЃРєР° РІ Web, распознавания речи Рё показа рекламы, соответствующей ключевым словам?
PN: РЇ думаю РјРЅРѕРіРёРµ AI специалисты делают РІСЃРµ РІРѕР·РјРѕР¶РЅРѕРµ для СЂРµС?ения РІРѕРїСЂРѕСЃРѕРІ, РЅР° которые нельзя дать определенного ответа. Какая выдача лучС?Рµ всего соответствует введенному запросу? РќР° этот РІРѕРїСЂРѕСЃ нет единственно правильного ответа, РѕРЅ субъективен, Рё именно этот РІРѕРїСЂРѕСЃ пытается СЂРµС?ить Google. Поэтому СЏ думаю, что вполне справедливо сказать, что это проблема искусственного интеллекта. РќРѕ СЃРїРѕСЃРѕР± подачи этого РІРѕРїСЂРѕСЃР° имеет множество разных РїРѕРґС…РѕРґРѕРІ. Рто Рё AI алгоритмы, Рё разработка программного обеспечения, Рё вычислительная техника, Рё сетевые СЂРµС?ения - РІСЃРµ вместе делает СЂРµС?ение проблем быстрым Рё эффективным. РЇ Р±С‹ РЅРµ сказал, что искусственный интеллект - это РІСЃРµ, это скорее часть целого.
Оригинал: Будущее поиска Google

