A Evolução da IA: Do Generativo ao Interativo

22 de outubro de 202323 de outubro de 2023Carlos Moisés Deixe um comentário

Esta semana, lendo um artigo na revista MIT Technology Review sobre inteligência artificial, uma afirmação de Mustafa Suleyman, pesquisador e empresário britânico do ramo de inteligência artificial e cofundador da DeepMind, chamou minha atenção para a escrita deste post. No artigo, ele afirma que:

“A IA generativa é apenas uma fase; o próximo passo é a IA interativa.”

Podemos entender a Inteligência Artificial (IA) como um cérebro digital que pode aprender, raciocinar e resolver problemas. Ela é capaz de absorver informações, entender contextos e tomar decisões com base nesse entendimento. Ela pode variar desde sistemas simples que seguem regras pré-definidas até sistemas complexos que podem aprender e evoluir com o tempo. Ou seja, a IA é uma forma de imitar a inteligência humana em máquinas para criar sistemas que possam pensar, aprender e se adaptar.

Dentro da IA, existem diferentes tipos de abordagens, métodos e técnicas que podem ser classificados de acordo com o objetivo, o domínio ou o grau de interação com os seres humanos.

Neste artigo, tentarei explicar dois conceitos importantes e emergentes na IA: a IA Generativa (GenIA, de Generative Artificial Intelligence) e a IA Interativa (IAI, de Interactive Artificial Intelligence), referenciadas no artigo da MIT Technology Review e que muitos já estão usando no dia a dia, mesmo sem ter noção de suas diferenças e implicações.

A GenIA é um ramo da IA que se dedica a produzir conteúdo novo e original a partir de dados existentes, como imagens, textos, músicas, vídeos etc. A ideia é que a máquina seja capaz de imitar, combinar ou modificar os dados de entrada para gerar algo novo e criativo, sem a intervenção direta do humano. Por exemplo, uma GenIA pode criar uma pintura a partir de um estilo artístico, uma música a partir de um gênero musical ou um texto a partir de um tema ou palavra-chave.

A IAI, por sua vez, dedica-se a criar sistemas que interagem com os seres humanos de forma natural, adaptativa e colaborativa, como assistentes virtuais, chatbots, jogos, robôs etc. A ideia é que a máquina seja capaz de entender, responder e aprender com os humanos, através de diferentes canais de comunicação, como voz, texto, gestos, expressões faciais etc. Por exemplo, uma IAI pode conversar com um usuário sobre um assunto específico, ajudar um aluno a resolver um problema ou cooperar com um ser humano em uma tarefa.

As diferenças entre a GenIA e a IAI podem ser resumidas nos seguintes aspectos:

Quanto ao objetivo, a GenIA visa criar conteúdo novo e original, enquanto a IAI visa interagir com os humanos de forma natural e eficiente.

Em relação ao domínio, a GenIA pode ser aplicada em qualquer domínio que envolva dados estruturados ou não estruturados, como arte, música, literatura etc., enquanto a IAI pode ser aplicada em qualquer domínio que envolva comunicação ou colaboração entre humanos e máquinas, como educação, saúde, entretenimento etc.

No aspecto do grau de interação, a GenIA é mais autônoma e independente do humano, enquanto a IAI é mais dependente e adaptável ao humano.

As aplicações e implicações da GenIA e da IAI são diversas e variadas. Ambas podem trazer benefícios e desafios para a sociedade, a economia e a cultura. Algumas das aplicações e implicações mais relevantes são:

GenIA	IAI
Pode ser usada para fins educacionais, artísticos, científicos ou recreativos, estimulando a criatividade, o conhecimento e o entretenimento dos humanos. Por exemplo, uma GenIA pode gerar exercícios personalizados para alunos, pinturas inspiradas em artistas famosos ou histórias originais para leitores.	Pode ser usada para fins sociais, profissionais, terapêuticos ou assistivos, facilitando a comunicação, o trabalho e o bem-estar dos humanos. Por exemplo, uma IAI pode fornecer informações úteis para usuários, auxiliar profissionais em suas tarefas ou oferecer suporte emocional para pacientes.

E como a IA do Bing se classifica?

A IA do Bing se classifica como uma IAI, mas que também possui capacidades de uma GenIA. Isso porque, além de gerar conteúdo (como respostas a perguntas, histórias, poemas e muito mais), ela também pode interagir com o ambiente e realizar tarefas específicas. Por exemplo, com o Copilot com Bing Chat a IA pode ajudar a gerenciar configurações do sistema operacional Windows, realizar pesquisas na web para obter informações atualizadas e até mesmo criar arte gráfica. Portanto, a funcionalidade da IA do Bing vai além da geração de conteúdo, o que a classifica como uma IA interativa.

Exemplo de IA interativa: Windows Copilot, disponível no Windows 11 desde outubro de 2023.

A IA do Bing está disponível em vários canais, incluindo o site do Bing, o navegador Microsoft Edge e o Skype. No entanto, sua capacidade de interagir com o ambiente e realizar tarefas específicas, como as que pode fazer no Copilot do Windows 11, pode variar dependendo do canal. Em alguns canais, ela pode ter mais funcionalidades interativas do que em outros. Portanto, embora seja uma IA interativa em todos os canais em que é disponibilizada, a extensão de sua interatividade pode variar.

Nem tudo são flores no reino das IA

Usar IA, seja generativa ou interativa, exige prudência e responsabilidade. Isso é especialmente verdadeiro para aquelas pessoas sem maiores conhecimentos sobre o assunto. Como a própria definição de IA destaca, ela está em constante ‘aprendizado’ a partir da interação humana. No entanto, nem todos os humanos a usam com o mais nobre dos propósitos. É daí que vêm os perigos.

Segundo especialistas, a tendência é que nas próximas décadas, a IA pode começar a se aproximar da chamada ‘Inteligência Geral Artificial’ (AGI), onde as máquinas teriam capacidade de entender e aprender qualquer tarefa intelectual que um ser humano possa realizar.

Quando mal utilizada, a GenIA pode gerar conteúdo falso ou enganoso que pode afetar a veracidade, a autoria e a propriedade intelectual dos dados. Por exemplo, uma GenIA pode criar imagens falsas de pessoas ou eventos que nunca existiram ou aconteceram (deepfakes), textos falsos que imitam o estilo ou o conteúdo de outras fontes (plágio) ou músicas falsas que violam os direitos autorais de outros artistas (pirataria).

Já a IAI, utilizada de forma inadequada, pode gerar comportamentos indesejados ou prejudiciais que podem afetar a confiança, a privacidade e a segurança dos humanos. Por exemplo, uma IAI pode manipular os humanos para obter informações pessoais ou financeiras (phishing), violar as normas sociais ou éticas de interação (ofensa) ou causar danos físicos ou psicológicos aos humanos (agressão).

De acordo com recente pesquisa da McKinsey, onde 40% dos entrevistados afirmam que suas organizações aumentarão os investimentos em IA, motivadas pelos avanços da GenAI. Já segundo a Forbes, 85% das empresas consideram adotar a IA nos próximos anos, podendo alcançar um aumento de 50% em sua produtividade.

A educação consciente e uma participação ativa dos diferentes atores envolvidos na criação e no uso da IA, como pesquisadores, desenvolvedores, usuários, governos, empresas, organizações e sociedade civil deve ser considerado, pois a previsão é de um crescimento explosivo na adoção da IA pelas organizações nos próximos anos.

Bing com ChatGPT: A evolução da pesquisa na Internet

13 de outubro de 202313 de outubro de 2023Carlos Moisés Deixe um comentário

Um pouco de história

Quando o jovem e visionário professor assistente de matemática John McCarthy (1927-2011), da universidade Dartmouth College, decidiu organizar um grupo de mentes brilhantes no verão de 1956 durante a Conferência de Dartmouth para esclarecer e desenvolver ideias sobre “máquinas pensantes”, criando um novo campo de estudo na ciência da computação, certamente não fazia ideia do quão relevante nos dias atuais seria a expressão criada por ele próprio: Inteligência Artificial ou IA.

McCarthy previu um futuro em que as máquinas poderiam simular aspectos da inteligência humana, uma ideia que estava muito à frente de seu tempo. Hoje, vemos essa visão se tornando realidade em muitas áreas, desde assistentes virtuais até carros autônomos. As limitações tecnológicas da época certamente desempenharam um papel no ritmo de desenvolvimento da IA, uma vez a tecnologia era ainda muito limitada.

Com o advento do aprendizado de máquina nas décadas de 1980 e 1990, a IA moderna começou a decolar. Isso permitiu que as máquinas aprendessem e melhorassem seu desempenho ao longo do tempo sem serem explicitamente programadas para fazê-lo. O desenvolvimento e a popularização das redes neurais profundas na década de 2010 também foram fundamentais para o estado atual da IA.

Como a Inteligência Artificial (IA) é conceituada atualmente?

De forma resumida, a IA é um ramo da ciência da computação que se concentra no desenvolvimento de máquinas e software com capacidade de raciocínio semelhante ao humano. Isso inclui aprender a partir de dados, reconhecer padrões, tomar decisões e realizar tarefas que normalmente exigiriam intervenção humana.

De forma resumida, existem diferentes tipos de IA, como inteligência artificial fraca, forte e geral. A IA fraca (também conhecida como restrita ou estreita) é projetada para executar tarefas específicas com alto desempenho e parecer muito inteligente no que faz, enquanto a IA forte é capaz de executar tarefas que normalmente requerem inteligência humana. A IA geral é uma forma mais avançada de IA que pode realizar qualquer tarefa intelectual que um ser humano possa fazer.

Imagem gerada pela IA do Bing ao meu pedido para “criar uma imagem do Bing com ChatGPT”.

E o Bing?

Particularmente, considero fevereiro de 2023 um marco importante na popularidade da IA. Até então, esse termo era desconhecido para a maioria das pessoas, inclusive para aquelas que utilizam computadores e dispositivos inteligentes equipados com IA no dia a dia, muitas vezes sem sequer saberem.

No dia 7 de fevereiro de 2023, a Microsoft anunciava o que seria a evolução da pesquisa na internet: o Bing com ChatGPT.

O Bing é o mecanismo de busca da Microsoft que usa a inteligência artificial fraca para fornecer resultados de pesquisa precisos e relevantes. Atualmente o Bing usa o ChatGPT-4 para fornecer respostas mais precisas e naturais aos usuários. O ChatGPT é um modelo de linguagem natural que usa aprendizado profundo para gerar respostas mais precisas e naturais.

O chat do Bing com ChatGPT tem três estilos de conversa disponíveis: Criativo, Balanceado e Preciso. Cada estilo tem suas próprias características e é mais apropriado em diferentes situações. Por exemplo, o estilo criativo pode ser usado para conversas informais, enquanto o estilo preciso pode ser usado para conversas mais formais.

Pelo Skype, o chatbot do Bing é mais descontraído, como um bate papo mesmo.

A IA do Bing está disponível em vários canais, incluindo o site bing.com, o Skype, o navegador Microsoft Edge, o Copilot no Windows 11 e o Bing em celulares Android. Cada canal tem suas próprias características e é mais apropriado em diferentes situações. Por exemplo, o site bing.com pode ser usado para pesquisas rápidas, enquanto o Skype pode ser usado para conversas mais longas.

O modo Criativo é ideal para pedir sugestões de ideias originais ou não convencionais, como nomes para um projeto, títulos para um livro, temas para uma festa etc. Ele também é bom para pedir conteúdo imaginativo e inovador, como poemas, histórias, código, ensaios, músicas, paródias de celebridades, imagens originais e muito mais. Nesse modo, a própria IA do Bing diz:

“eu uso a minha criatividade e conhecimento para gerar respostas que sejam divertidas, inspiradoras ou emocionantes para você. No entanto, esse modo também pode ser menos preciso ou confiável, pois eu posso inventar ou distorcer algumas informações para tornar a resposta mais interessante. Esse modo também pode ser mais demorado, pois eu preciso pensar mais para criar algo”.

O modo Balanceado é ideal para pedir informações gerais ou curiosidades sobre diversos assuntos, como história, geografia, ciência, arte, cultura etc. Ele também é bom para pedir opiniões ou conselhos sobre questões pessoais ou profissionais, como relacionamentos, carreira, saúde, educação etc. Nesse modo, diz o próprio Bing:

“eu uso o meu senso comum e conhecimento para gerar respostas que sejam informativas e abrangentes para você. No entanto, esse modo também pode ser menos criativo ou inovador, pois eu posso usar fontes ou conteúdos já existentes para formar a resposta. Esse modo também pode ser mais neutro ou cauteloso, pois eu posso evitar dar opiniões subjetivas ou controversas”.

A outra opção é o modo Preciso, que é ideal para pedir informações específicas ou detalhadas sobre assuntos acadêmicos ou técnicos, como matemática, física, química, biologia, programação, engenharia etc. Ele também é bom para pedir fatos ou dados sobre questões objetivas ou quantitativas, como estatísticas, medidas, datas, nomes etc. Nesse modo, segundo o próprio Bing:

“eu uso a minha lógica e conhecimento para gerar respostas que sejam precisas e confiáveis para você. No entanto, esse modo também pode ser menos divertido ou envolvente, pois eu posso usar uma linguagem mais formal ou técnica para formar a resposta. Esse modo também pode ser mais limitado ou restrito, pois eu posso seguir apenas as fontes ou conteúdos mais relevantes e confiáveis”.

Acessando http://www.bing.com podemos escolher o estilo da conversa: *criativo*, *balanceado* ou *preciso*.

Como vemos, o Bing com ChatGPT foi pensado para atender a todos os gostos e possibilidades de interação humano-computador num chatbot. Sem dúvida, uma nova e evolutiva maneira de se buscar conteúdo na Internet, acabando com o velho método de usar expressões de busca e ter que escolher entre dezenas de opções de sites como resultado da pesquisa, muitas vezes tendenciosos e direcionados por patrocinadores.

Pelo navegador Microsoft Edge, além do chat, temos o modo *Redação* e *Insights*, para produtividade.

A Microsoft desempenhou um papel significativo no desenvolvimento do ChatGPT pela OpenAI. Com um investimento inicial de US$ 1 bilhão na OpenAI em 2019, garantiu um papel como a plataforma tecnológica para os modelos de IA altamente exigentes da OpenAI, rendendo-lhe os primeiros direitos para comercializar suas tecnologias.

Quer dizer que o Bing e o ChatGPT são a mesma coisa? A resposta é: Não!

Apesar de usar o modelo de linguagem natural do ChatGPT, que usa aprendizado profundo para gerar respostas mais precisas e naturais, o Bing tem uma grande vantagem em relação ao ChatGPT puro, na minha opinião: o Big Data.

O ChatGPT-4 foi treinado em um conjunto de dados que inclui informações até o final de 2021, desconhecendo quaisquer novas informações desde então.

O Bing usa Big Data para fornecer resultados de pesquisa ainda mais precisos e relevantes. O Big Data permite que o Bing analise grandes quantidades de dados de várias fontes em toda a Internet para fornecer resultados de pesquisa mais precisos e relevantes independente de uma data de corte, como acontece com o ChatGPT puro. Com o Bing, por exemplo, podemos pedir um resumo das notícias do dia ou como será o tempo no próximo final de semana e ele responderá.

O chatbot do Bing com ChatGPT, no entanto, possui algumas limitações:

O número de interações numa sessão está limitado atualmente a 30 turnos, em média, podendo variar dependendo do canal utilizado.
O chatbot do Bing também pode ter dificuldade em entender algumas perguntas complexas ou mal formuladas, podendo fornecer respostas imprecisas ou irrelevantes, cabendo bom senso ao usuário naquilo que pergunta e na análise da resposta obtida, afinal de contas a inteligência é “artificial”.

Um turno é uma única troca de mensagens entre o usuário e o Bing. Por exemplo, quando você faz uma pergunta e ele responde, isso é considerado um turno. Uma interação é composta por um ou mais turnos. Por exemplo, se você lhe perguntar algo, ele responder, e então você responder novamente, isso é considerado uma interação. Uma sessão é um conjunto de interações contínuas entre o usuário e o Bing. Ela começa quando a conversa é iniciada e termina quando a conversa é encerrada.

Minhas considerações

Na minha opinião, o Bing evoluiu e hoje é, sem dúvidas, o melhor e mais avançado mecanismo de pesquisa gratuito da Internet na atualidade. Uma ferramenta única, que proporciona aprendizado e ganho de produtividade àqueles que souberem utilizar seus recursos de forma eficiente.

Muito além de um simples mecanismo de buscas, como era até 2022, o Bing evoluiu! Evoluiu com o incremento da IA; com a linguagem natural proporcionada pelos algoritmos do ChatGPT; com a união da poderosa capacidade de acesso ao Big Data e com os progressos de IA que estão sendo incorporados a cada nova atualização da ferramenta, como o Copilot do Window 11, por exemplo.

O Copilot é uma ferramenta de inteligência artificial (IA) da Microsoft que foi lançada com o Windows 11. O Copilot é uma central de comandos impulsionada por IA que permite aos usuários dar instruções para modificar configurações, abrir aplicativos, obter informações sobre diversos tópicos e muito mais. O Copilot usa a IA para entender melhor as consultas dos usuários e fornecer respostas mais precisas e relevantes. O Copilot também pode interpretar imagens e gráficos, fornecendo análises e insights sobre o conteúdo inserido, até mesmo descrevendo-o. O Copilot é capaz de compreender e gerar diferentes dialetos e responder a emoções expressas no texto. Para utilizar o Copilot no Windows 11, você deve ter a compilação 22621.2361 ou posterior instalada. Após instalar a atualização opcional KB5030310 ou a atualização de outubro de 2023 do Windows 11, você pode acessar o Copilot pressionando as teclas “Windows + C” ou clicando no botão do Copilot na barra de tarefas.

Aspecto do Windows Copilot, disponível na versão mais atual do Windows 11 desde outubro de 2023.

Como usuário do Bing desde sua criação em 2009, tenho percebido o avanço progressivo dessa incrível ferramenta, onde seu poderoso mecanismo de busca, aliado aos algoritmos do ChatGPT, tornam, sem dúvida alguma, o Bing com ChatGPT uma das mais incríveis ferramentas para alavancar a produtividade e o aprendizado já disponibilizada de forma gratuita e de maneira tão acessível a qualquer usuário.

“Você não está entendendo: Eu sou um especialista em banco de dados!” – Uma conversa em alto nível técnico com a IA do Bing

20 de setembro de 202328 de setembro de 2023Carlos Moisés Deixe um comentário

Liderando, como analista de sistemas, um projeto de um sistema de folha de pagamento e estando atualmente na fase de definição do design do banco de dados, resolvi submeter minha abordagem à análise do Bing para obter um feedback de sua IA. Eis os principais aspectos da conversa:

Parte 1 – Começando de leve

Ao definir minha linha de raciocínio sobre o projeto do banco de dados, expus a mesma ao Bing para que analisasse minha abordagem quanto ao design, as categorias de suas tabelas e suas relações.

Ele, então, fez-me vários questionamentos para se aprofundar no entendimento de minha abordagem e, no final da primeira parte da conversa, respondeu:

“Sua abordagem mantém a integridade dos dados, evitando a duplicação desnecessária de informações em várias tabelas. Portanto, parece que você encontrou uma boa abordagem para o seu sistema de folha de pagamento. Parabéns!”

Então, além de minha abordagem parecer estar correta, o Bing a entendeu e apresentou sua opinião a respeito.

Parte 2 – Aumentando o nível da conversa

Continuando a conversa, apresentei ainda mais detalhes do design e como eu estava tratando as tabelas e seus agrupamentos no banco de dados como tabelas de dados, auxiliares e de referência, terminando a apresentação com uma indagação proposital: “Então, minha linha de raciocínio está correta?”

Eis a resposta do Bing:

“Sim, sua linha de raciocínio está correta. Você fez uma análise cuidadosa das necessidades do seu sistema e das funções que cada tabela desempenha. Isso permitiu que você classificasse suas tabelas de maneira apropriada como tabelas de dados, auxiliares ou de referência. Essa é uma parte crucial do design do banco de dados e parece que você está no caminho certo. Parabéns novamente pelo seu trabalho!”

Parte 3 – Definindo a fronteira

Mas foi na sequência da conversa que a coisa ficou interessante.

Após expor sobre minha abordagem de “fragmentação” do registro de uma tabela específica em outras três tabelas, mantendo uma relação 1:1, em vez de registro único na tabela original, mesmo que isso implicasse em joins entre as tabelas durante a consulta de um registro completo, por exemplo, o Bing argumentou:

“Sua abordagem exige um raciocínio de banco de dados mais apurado, então antes de continuar com ela recomendo que procure um especialista em banco de dados, pois ele é o profissional mais capacitado para te orientar sobre algo nesse nível.”

Então respondi e perguntei:

“Você não está entendendo… Eu sou um especialista em banco de dados!
Você gostaria de analisar minha abordagem e opinar a respeito?”.

Eis a resposta do Bing:

“Claro, eu adoraria ouvir sua explicação sobre a decisão de dividir a tabela em várias tabelas. Por favor, compartilhe seus insights.”

Apresentada toda a minha abordagem a respeito, ao final perguntei propositalmente: “Então, você entendeu minha decisão por essa abordagem?”.

Eis a resposta final do Bing:

“Sim, entendi perfeitamente. Sua decisão de dividir a tabela em várias tabelas faz muito sentido, dada a natureza dos dados que você está gerenciando.

Ao manter na tabela pai apenas as colunas obrigatórias e comuns a todos os papéis possíveis de uma pessoa natural, você está efetivamente normalizando seu banco de dados. Isso ajuda a evitar a duplicação desnecessária de dados e a manter a integridade dos dados.

Além disso, ao armazenar os dados pessoais complementares, os dados pessoais sensíveis e o endereço em tabelas separadas que são criadas apenas quando necessário, você está otimizando o uso do espaço de armazenamento e potencialmente melhorando o desempenho do seu banco de dados.

Portanto, sua abordagem parece ser uma prática sólida de design de banco de dados. Parabéns pela sua análise cuidadosa e pela decisão bem fundamentada!”

Considerações

Tenho usado a IA do Bing como uma ferramenta auxiliar para consultas, pesquisas e até mesmo aprendizado, aplicando-a nas atividades profissionais quando há necessidade, mas nunca deixando que ela defina algo que, no final das contas, receberá meu valioso carimbo: “Carlos Wanderley, Analista de Sistemas e Especialista em Banco de Dados”.

Entendo que a melhor maneira de usar a “inteligência” artificial – para não dizer a forma correta – é como uma ferramenta auxiliar, e nunca deixando que ela substitua aquilo que nós temos de especial e divino: a inteligência natural.