Google BERT | A principal atualização do algoritmo de pesquisa

12 de Novembro de 2019

A atualização tem o intuito de melhorar o entendimento do Google sobre o contexto envolvido no uso de determinadas palavras

O Google informou no final do mês de outubro sua principal atualização de algoritmo de pesquisa: o Bidirectional Encoder Representations from Transformers, ou Google BERT.

O nome já acompanha o projeto desde novembro do ano passado, quando o Google lançou um open source de pré-treinamento para o desenvolvimento de modelos capazes de processar a linguagem natural escrita e falada. O projeto, que teve resultados positivos, deu continuidade ao que hoje é um dos updates mais importantes dos últimos tempos!

 

O que é o Google BERT?

O BERT tem o intuito de melhorar o entendimento do Google sobre o contexto envolvido no uso de determinadas palavras, para aproximar ainda mais a inteligência artificial da inteligência humana e, segundo o próprio buscador, é o mais importante update desde o lançamento do RankBrain.

Isso significa que determinadas particularidades da linguagem natural ou palavras que podem mudar de significado de acordo com o contexto agora são melhor compreendidas pelos algoritmos — inclusive as chamadas stop words.

No blog oficial do Google, Pandu Nayak explicou que, muitas vezes, nem mesmo os próprios usuários sabem como procurar o que desejam.

Pandu conta que, seja não sabendo exatamente como escrever uma palavra, seja buscando por um assunto sobre o qual não temos o mínimo conhecimento, o buscador tem o dever de entender o que estamos tentando pesquisar, não importa como escrevemos ou como formulamos essa dúvida. Ele ainda afirma que mesmo com o Google aperfeiçoando seu entendimento sobre diferentes linguagens ao longo dos anos, alguns aspectos mais complexos de conversação e linguagem natural ainda deixavam a desejar. É por isso que, muitas vezes, fazemos buscas usando somente palavras-chave e formulando frases incompletas, e não como faríamos naturalmente ao conversarmos com outras pessoas. As preposições como “to” e “for” também não eram até então muito consideradas, mas graças ao BERT o robô agora é capaz de entender como o sentido de uma expressão pode mudar quando esses termos são utilizados.

Estima-se que 10% do total de buscas feitas em inglês sejam afetadas a partir de agora.

 

Uma atualização focada nas buscas, e não nos sites

A primeira coisa que vem à cabeça dos profissionais de SEO quando surge uma nova atualização no algoritmo é: como posso otimizar o meu site para isso?

Neste ano, a resposta é muito simples: conteúdo objetivo, bem escrito e focado em seres humanos. Ao aperfeiçoar e expandir a competência de assimilação de linguagem humana do crawler, a tendência é que sites cujos conteúdos são escritos de forma mecânica sejam prejudicados na SERP.

A absorção de informação relacionada à linguagem falada que o BERT traz também influenciará positivamente para o voice search e a busca local.

 

Conteúdo ainda essencial

Embora a atenção dos profissionais de SEO tenha se fragmentado entre performance, usabilidade e experiência do usuário, dizer que o conteúdo é o principalnão é ideia passada. Desde o lançamento do Google Panda, em abril de 2012, a importância atribuída ao conteúdo mudou radicalmente a forma como ele era produzido na internet. A qualidade se tornou o foco da análise e quem tinha como objetivo manipular o algoritmo viu seus sites despencarem.

 

Algumas técnicas que podem depreciar ainda mais um conteúdo ruim após o BERT são:

-Uso exacerbado de termos longtail;
-Keyword stuffing (densidade de palavras-chave exagerada);
-Limite mínimo e máximo para a quantidade de palavras no texto;
-“Encheção de linguiça” para aumentar o conteúdo;
-Conteúdo oculto.
-Para as páginas cujo conteúdo é constituído por muitas imagens, a linkagem interna continua sendo fundamental para auxiliar o robô a compreender o assunto abordado e quais os contextos a serem agregados.

 

Este é só o início
Machine Learning é um método de análise de dados que, ao identificar padrões, automatiza o desenvolvimento de modelos ainda mais aperfeiçoados de análise de dados com pouca ou nenhuma intervenção humana. Ou seja, ao executar essa tarefa diversas vezes, a análise vai ficando cada vez melhor e mais rápida, porquê tem a capacidade de aprender com a repetição e corrigir suas próprias falhas, assim como pessoas.

Quando trata-se de evolução, nada do que surgiu até agora foi  — e nem será — deixado para trás. Isso significa que os algoritmos usados hoje não serão descartados, muito pelo contrário, esses algoritmos continuarão trabalhando juntos e, a cada novo update, afinarão suas capacidades para tornarem-se cada vez mais eficientes.

Até o momento, o Google BERT está disponível apenas para buscas em inglês, mas em breve será lançado para outros idiomas.