Google не е готов да превърне търсенето в разговор
Въпреки размитите демонстрации на AI на I / O на Google, търсенето все още се обслужва най-добре чрез текст

Бъдещето на търсенето е разговор - поне според Google.
Това е стъпка, която компанията прави от години и беше в центъра на миналата седмицаI / O конференция за разработчици. Там компанията демонстрира две новаторски системи за ИИ - LaMDA и MUM - които се надява един ден да се интегрира във всички свои продукти. За да покаже своя потенциал, Google разполага с LaMDAговоретекатопланетата джудже Плутон, отговаряйки на въпроси за околната среда на небесното тяло и прелитането му от сондата New Horizons.
Мечтата на Google е да говори и машината ще отговори
С приемането на тази технология потребителите ще могат да говорят с Google: използвайки естествен език за извличане на информация от мрежата или личните си архиви от съобщения, срещи в календара, снимки и др.
Това е нещо повече от просто маркетинг за Google. Очевидно компанията от години обмисля какво би било голяма промяна към основния си продукт. Aскорошна изследователска статияот квартет от инженери на Google, озаглавен „Преосмисляне на търсенето“, пита точно това: време ли е да заменим класическите търсачки, които предоставят информация чрез класиране на уеб страници, с езикови модели на AI, които вместо това доставят тези отговори директно?
Тук има два въпроса. Първото емогада се направи? След години на бавен, но категоричен напредък, наистина ли компютрите са готови да разберат всички нюанси на човешката реч? И второ,Трябвада се направи? Какво се случва с Google, ако компанията остави класическо търсене след себе си? Достатъчно подходящо, нито един от въпросите няма прост отговор.
Това обаче ни отвежда до следващия голям въпрос: дори Googleмогапревърнете речта в разговор,Трябвато? Няма да се преструвам, че имам окончателен отговор на това, но не е трудно да се видят големи проблеми напред, ако Google тръгне по този път.
Първо са техническите проблеми. Най-голямото е, че е невъзможно за Google (или която и да е компания) да провери надеждно отговорите, произведени от вида на езика AI, който компанията в момента демонстрира. Няма начин да разберем какво точно са научили тези видове модели или какъв е източникът на какъвто и да е отговор. Техните данни за обучение обикновено се състоят от значителни части от интернет и, както бихте очаквали, това включва както надеждни данни, така и дезинформация на боклука. Всеки отговор, който дават, може да бъде изтеглен от всяко място онлайн. Това също може да ги накара да произвеждат резултати, които отразяват сексистките, расистките и предубедени представи, вградени в части от техните данни за обучение. И това са критики, които изглежда самата Googleне желае да се съобразява с.
морти рик
По същия начин, въпреки че тези системи имат широки възможности и могат да говорят по широк спектър от теми, знанията им в крайна сметка са плитки. Както изследователите на Google заявяват в своя доклад „Преосмисляне на търсенето“, тези системи учат твърдения като небето е синьо, но не и асоциации или причинно-следствени връзки. Това означава, че те могат лесно да произвеждатлоша информациявъз основа на собственото им неразбиране на това как работи светът.
Кевин Лакър, програмист и бивш инженер за качество на търсенето с Google, илюстрира тези видове грешки в GPT-3 втази информативна публикация в блога, отбелязвайки как можете да накарате програмата с здравословни въпроси като Кое е по-тежко, тостер или молив? (GPT-3 казва: молив) и колко очи има кракът ми? (О: Вашият крак има две очи).
Езиковите модели на ИИ нямат истинско разбиране за светаЗа да цитирам отново инженерите на Google от „Преосмисляне на търсенето“: тези системи нямат истинско разбиране за света, те са склонни към халюцинации и от решаващо значение не са в състояние да оправдаят своите изказвания, като се позовават на подкрепящи документи в корпуса, по който са били обучени.
Тези проблеми се усилват от вида интерфейс, който Google предвижда. Въпреки че е възможно да се преодолеят трудности с неща като източник (можете да обучите модел, който да предоставя цитати, например, като се отбележи източникът на всеки факт, който дава), Google си представя всеки отговорен отговорот трона,сякаш се говори от самия Google. Това потенциално създава тежест на доверие, която не съществува при настоящите търсачки, където потребителят трябва да оцени достоверността на всеки източник и контекста на информацията, която им се показва.
перспективите надолу?
Капаните на премахването на този контекст са очевидни, когато разгледаме представените от Google фрагменти и панели на знанието - карти, които Google показва в горната част на страницата с резултати от търсенето с Google.com в отговор на конкретни запитвания. Тези панели подчертават отговорите, сякаш са авторитетни, но проблемът е, че често не са, проблем, който бившият блогър на търсачките (а сега служител на Google) Дани Съливан наречеедин верен отговорпроблем.
Тези фрагменти иматнаправи заглавиякогато потребителите открият особено груби грешки. Един пример от 2017 г. включваше питане на Google Планира ли Обама военно положение? и получаване на отговора (цитиран от сайт за конспиративни новини), че да, разбира се, че е (ако беше, това не се случи).
В демонстрациите, които Google показа на I / O тази година на LaMDA и MUM, изглежда, че компанията все още се навежда към този един истински формат за отговор. Питате и машината отговаря. В демонстрацията на MUM Google отбеляза, че на потребителите също ще бъдат дадени насоки за задълбочаване на темите, но е ясно, че интерфейсът, за който компанията мечтае, е пряк напред и назад със самия Google.
Това ще работи за някои запитвания, със сигурност; за прости изисквания, които са еквивалент на търсенето да поискам от Siri да настрои таймер на телефона ми (напр. да попитам кога е родена Мадона, която пее Lucky Star и т.н.). Но за сложни проблеми, като тези, които Google демонстрира при I / O с MUM, мисля, че те ще бъдат недостатъчни. Задачи като планиране на почивки, проучване на медицински проблеми, пазаруване на големи билети, търсене на съвети за „направи си сам“ или ровене в любимо хоби, изискват лична преценка, а не компютърно обобщение.
Желанието на Google да даде единствения верен отговор може в крайна сметка да го нараниВъпросът е дали Google ще може да устои на примамката да предложи един верен отговор? Техническите наблюдатели отбелязватза малкоче продуктите за търсене на компанията са станали по-ориентирани към Google с течение на времето. Компанията все по-често погребва резултати при реклами, които са както външни (сочат към трети страни), така и вътрешни (насочват потребителите към услуги на Google). Мисля, че разговорът с Google парадигмата отговаря на тази тенденция. Основната мотивация е същата: става дума за премахване на посредници и обслужване на потребители директно, вероятно защото Google вярва, че е в най-добра позиция да го направи.
В известен смисъл това е изпълнението на корпоративната мисия на Google да организира световната информация и да я направи универсално достъпна и полезна. Но този подход може също така да подкопае това, което прави продукта на компанията такъв успех на първо място. Google не е полезен, защото ви казва какво трябва да знаете, той е полезен, защото ви помага да намерите тази информация за себе си. Google е индексът, а не енциклопедията и не трябва да жертва търсенето на резултати.