Gemini Live: Conversar com a IA do Google é Divertido, Estranho e um Pouco Inútil

Gemini Google
© nextpit

Ler em outras línguas:

É legal, é divertido, é estranho, mas serve para quê? Testei o Gemini Live, a IA de conversação do Google, no Pixel 9 Pro XL. Como prova de conceito, a inteligência artificial me convenceu. É divertido discutir com seu smartphone, mesmo que isso signifique ser atacado. Mas será que essa função é realmente útil e, acima de tudo, será que o Gemini Live vale a assinatura mensal de R$ 96,99?

O Gemini Nano é o assistente de IA do Google para smartphones Android. O Gemini Live é um modo do Gemini Nano que permite que você inicie conversas com o assistente, e para isso você precisa pagar a assinatura do Gemini Advanced por R$ 96,99 por mês por meio da sua Conta do Google. Por enquanto, você só pode falar com ele em inglês.

Tive muita dificuldade para escrever este artigo. Me pediram para fazer algo sobre o Gemini Live porque todos estão falando sobre ele. Mas, sinceramente, é como se tivessem me pedido para escrever um ensaio sobre o impacto da função de lanterna nos smartphones, na experiência de usuário de franceses de 18 a 24 anos, desde 2011. Não há muito o que dizer, de fato.

Conversas naturais

A principal atração do Gemini Live é que você pode interromper a IA enquanto ela fala. A ideia é debater e fazer uma troca de ideias sobre conceitos, ideias, opiniões ou temas de forma natural. Essa inteligência artificial ainda não pode interagir com outros aplicativos ou com o conteúdo da sua tela, ao contrário do Gemini Nano.

Quase não há atraso entre o momento em que você faz uma pergunta ao Gemini Live e o momento em que a IA responde. O fato de você poder interrompê-la deixa as discussões mais intuitivas. É fácil corrigir uma consulta ou simplesmente prosseguir com uma pergunta, mesmo que isso signifique mudar de assunto se a resposta não for satisfatória.

Na mesma sessão, o Gemini Live vai relembrar determinados pontos de uma discussão anterior, caso você peça. Você ainda consegue encontrar um registro escrito de suas sessões no aplicativo Gemini e, na resposta, a IA sempre parafraseia o que você pediu. Essa maneira indireta de repetir o que você acabou de dizer garante que a IA entendeu sua solicitação.

O Gemini Live faz isso de forma bastante discreta. Mas, às vezes, eu tinha a impressão de que tinha acabado de fazer uma pergunta à IA e que ela estava simplesmente tentando ganhar tempo para improvisar uma resposta.

Um relacionamento às vezes tóxico

O Gemini Live lida muito bem com as interrupções. A IA nunca se ofende, mesmo que às vezes tenha a tendência irritante de continuar falando ou simplesmente pedir desculpas quando você está prestes a falar. É irritante. Mas também é muito constrangedor.

Pessoalmente, optei por uma voz feminina. E ouvir o Gemini se desculpar por minha grosseria me faz sentir como se estivesse em um relacionamento abusivo. Um pouco como Joaquin Phoenix sendo um machista tóxico e também um incel no filme Her.

O dinamismo das conversas também pode ser uma desvantagem. Muitas vezes tive que pausar o Gemini enquanto organizava meus pensamentos. Isso porque se você hesitar por muito tempo ou fizer uma pausa muito longa, o Gemini Live verá uma oportunidade de te interromper.

E, às vezes, eu tinha a impressão de que a IA estava apenas me dizendo o que achava que eu queria ouvir. Por exemplo, pedi a ela, com base em nossas interações anteriores, que me dissesse o que achava da minha personalidade. No início, ela me encheu de elogios. Tive de insistir e rever o assunto duas vezes antes que o Gemini Live me confessasse os defeitos que ela achava que eu tinha. E realmente era muito parecido com o gaslighting.

Esse papo tá bom mas... onde você quer chegar?

No geral, o Gemini Live me deixou com uma impressão muito boa. Como conceito, a IA de conversação do Google funciona como esperado. Mas qual é o seu objetivo?

Por enquanto, e essa é a minha opinião, nenhum. Acho o Gemini Nano muito mais interessante, por exemplo, e ele pode interagir com o conteúdo exibido na sua tela. Você pode iniciar prompts — escritos ou falados — contextualmente enquanto estiver assistindo a um vídeo no YouTube ou lendo um artigo no seu navegador. Isso é muito útil. O Gemini Nano também pode executar ações em vários aplicativos do Google.

No momento, o Gemini Live não pode fazer tudo isso. O Google promete que isso mudará em algumas semanas, se não em meses. E espero que sim, pois isso daria ao Gemini Live uma relevância totalmente nova.

Também achei as respostas do Gemini Live muito genéricas e vagas. Tive uma constante impressão de que precisava conduzir o debate. Não senti que houve reciprocidade suficiente e, a longo prazo, isso foi desgastante. Principalmente quando passei vários minutos esclarecendo minha solicitação, adicionando gradualmente mais detalhes e elementos. Sempre fiquei bastante decepcionado com a falta de valor agregado que o Gemini Live traz para nossas conversas.

O Gemini Live fala com muita naturalidade, isso não há como negar. Mas ainda acho que a IA carece de personalidade. Há dez vozes diferentes para escolher, e cada voz é acompanhada de uma descrição de seu tom e timbre. Eu teria gostado mais se a diferença de tom entre uma voz "calma" e uma "comprometida" fosse mais perceptível.

E, acima de tudo, eu teria gostado se o conteúdo ou a forma das discussões também tivesse variado de acordo com a voz escolhida. Mas, além da entonação, não notei nenhuma diferença suficientemente gritante. A IA, definitivamente, precisa de mais tempo para treinar e desenvolver uma personalidade real. E a introdução de variações nas respostas dadas de acordo com a "personalidade" da voz também poderia se mostrar tendenciosa. Portanto, essa não é uma falha "objetiva" do Gemini Live.

Gemini Live e o hype

Durante minha pesquisa, me deparei com o conceito do ciclo de hype da Gartner. Esse modelo, proposto pela empresa de consultoria americana Gartner, tem a forma de uma curva que descreve a evolução do hype, ou interesse, em uma nova tecnologia.

Essa evolução pode ser dividida em cinco fases. O sucesso inicial do lançamento de uma tecnologia gera grandes expectativas entre o público. Essas expectativas, então, se tornam irreais e exageradas. É inevitável que a tecnologia não atenda a essas expectativas. Após esse pico de entusiasmo, começamos a cair em um poço de desilusão. Todos percebem que o hype foi exagerado.

Então, nos tornamos mais realistas. Alguns persistiram, propondo novas versões mais racionais da tecnologia. A ladeira é lentamente escalada de volta e, finalmente, um patamar de produtividade é alcançado. A tecnologia seguiu seu curso e está cumprindo suas funções e as demandas/necessidades do público.

Representação do ciclo do hype da Gartner.
A curva do ciclo do hype da Gartner. / © By Jeremykemp on Wikipedia, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=10547051

O Gemini Live está atualmente no auge do hype. Inevitavelmente, teremos que voltar para baixo e aceitar algumas decepções, como a que descrevi na parte anterior deste artigo.

Mas também acho que o Google parece determinado a voltar a subir a ladeira para alcançar o famoso patamar de produtividade. O que ela está oferecendo com o Gemini Nano já me parece estar indo nessa (boa) direção, e a concorrência da Apple Intelligence só pode fortalecer esse impulso na corrida da IA.

No dia em que o Gemini Live puder identificar a hora e o local de um compromisso a partir de uma mensagem de texto e, em seguida, criar um evento em minha agenda, o Google terá me convertido às assistentes de IA.

O que você acha do Gemini Live? Já teve a chance de experimentar a IA de conversação do Google?

Notificação por push Artigo seguinte
Sem comentários
Escreva um comentário:
Todas as mudanças foram salvas. Não há rascunhos salvos no seu aparelho.
Escreva um comentário:
Todas as mudanças foram salvas. Não há rascunhos salvos no seu aparelho.