Recentemente, a inteligência artificial (IA) fez avanços notáveis ​​no processamento de linguagem natural (NLP). Isso se deve principalmente à sua capacidade de treinar modelos em larga escala usando dados textuais. Com o desenvolvimento desses modelos de linguagem, a IA se torna proficiente em tarefas como análise de sentimentos, tradução automática, geração de texto e resumo.

    No entanto, apesar desses avanços, a IA continua lutando com suas habilidades cognitivas quando se trata de lidar com tarefas de raciocínio em várias etapas, como problemas de palavras matemáticas e raciocínio simbólico e de senso comum.

    Este artigo apresenta o desenvolvimento mais recente conhecido como raciocínio de cadeia de pensamento (CoT), uma técnica baseada em prompt que permite que modelos de IA exibam habilidades cognitivas.

    O que é um prompt?

    O prompt é uma instrução para o modelo gerar uma resposta. É semelhante a pedir a alguém para escrever um ensaio sobre um tema específico. Semelhante aos escritores humanos, os modelos de IA empregam prompts como base para escrever ensaios ou gerar respostas.

    Podemos solicitar modelos de linguagem como ChatGPT com consultas simples como “Quem é o rei do Reino Unido?” a problemas complexos com descrições detalhadas de tarefas. Mesmo um pedido como “Conte-me uma piada” pode ser visto como um prompt aberto.

    Como funciona a engenharia de alertas?

    Engenharia de alerta lida com a criação e o design de prompts que permitem que os modelos de IA executem tarefas específicas. Durante esse processo, é crucial escolher cuidadosamente os dados e o formato do prompt para garantir que o modelo possa aproveitá-lo efetivamente para executar a tarefa.

    Por exemplo, se pretendemos determinar o sentimento da crítica do filme “Não assista”, podemos adicionar o prompt “É” à frase, tornando-a “Não assista. Isso é ____.” Nesse caso, anteciparíamos uma probabilidade maior do modelo de linguagem gerar “terrível” em vez de “ótimo”.

    O objetivo da engenharia de prompts de IA é gerar prompts de alta qualidade que permitam que o modelo de IA faça previsões precisas.

    Aprendizagem Baseada em Prompt

    Os prompts também podem ser usados ​​para ensinar um modelo de IA a produzir os resultados desejados. A técnica, conhecida como aprendizado baseado em prompt, envolve fornecer ao modelo consultas e respostas corretas antes de solicitar que ele responda a outras perguntas.

    Por exemplo, podemos solicitar ao modelo algumas questões numéricas e suas respostas, solicitando que ele resolva outras questões:

    P: O refeitório tinha 23 maçãs. Se eles usaram 20 para fazer o almoço e compraram mais 6, quantas maçãs eles têm?
    R: 9P: Há 15 alunos em uma classe. Se mais 7 alunos entrarem na turma, quantos alunos haverá no total?
    A: ______

    No entanto, observou-se que prompts simples, consistindo apenas em uma pergunta e sua resposta, geralmente levam a resultados incorretos em tarefas cognitivas, como problemas matemáticos, raciocínio simbólico e raciocínio de senso comum.

    Para enfrentar esses desafios, o raciocínio em cadeia de pensamento é uma nova técnica promissora projetada especificamente para permitir que os modelos de IA lidem com sucesso com essas tarefas cognitivas.

    Raciocínio em Cadeia de Pensamento

    Na solicitação padrão, o modelo aprende com exemplos de perguntas e respostas e, em seguida, prevê respostas para novas perguntas. Por outro lado, a orientação da cadeia de pensamento trata de instruir o modelo a dividir problemas complexos em etapas menores e fornecer as etapas intermediárias de raciocínio e a solução final.

    A cadeia de pensamento inspirou-se no raciocínio aritmético, em que a lógica da linguagem natural é usada para construir um argumento, levando à produção da resposta final. Isso ajuda o modelo a lidar com problemas de várias etapas com mais eficiência porque permite que o modelo divida problemas complicados em etapas menores e convenientes que podem ser resolvidas facilmente.

    Além disso, como a cadeia de pensamento depende da linguagem, ela pode ser aplicada a qualquer tarefa que uma pessoa possa resolver usando a linguagem. Um exemplo de um prompt padrão versus um prompt de cadeia de pensamento é mostrado abaixo.

    Exemplo de um prompt padrão Exemplo de um prompt de cadeia de pensamento
    Pergunta Imagine que você está planejando uma viagem com seus amigos. Você deseja calcular o custo total do combustível para a viagem. A distância entre o ponto de partida e o destino é de 500 milhas e a eficiência média de combustível do seu carro é de 30 milhas por galão. O preço atual do combustível é de $ 3,50 por galão. Calcule o custo total estimado de combustível para a viagem. Imagine que você está planejando uma viagem com seus amigos. Você deseja calcular o custo total do combustível para a viagem. A distância entre o ponto de partida e o destino é de 500 milhas e a eficiência média de combustível do seu carro é de 30 milhas por galão. O preço atual do combustível é de $ 3,50 por galão. Calcule o custo total estimado de combustível para a viagem e explique seus cálculos passo a passo.
    Responder $ 59,50.
    1. Para calcular o custo total do combustível, precisamos determinar o número total de galões de combustível necessários para a viagem.
    2. Primeiro, vamos calcular quantos galões de combustível são necessários para cobrir toda a distância. Dividimos a distância total de 500 milhas pela eficiência média de combustível do carro de 30 milhas por galão: 500 milhas / 30 milhas por galão = 16,67 galões.
    3. Como não podemos ter uma fração de galão, precisamos arredondar para o número inteiro mais próximo. Portanto, o carro exigirá aproximadamente 17 galões de combustível para toda a viagem.
    4. Em seguida, multiplicamos o número total de galões (17) pelo preço por galão ($ 3,50) para encontrar o custo total do combustível: 17 galões * $ 3,50 por galão = $ 59,50.
    5. Portanto, o custo total estimado de combustível para a viagem é de $ 59,50.

    Benefícios da Técnica da Cadeia de Pensamento

    A cadeia de pensamento oferece várias vantagens quando se trata de aprimorar as habilidades cognitivas dos modelos de IA:

    • Decomposição do Problema: A cadeia de pensamento permite que os modelos de IA dividam problemas complicados em etapas intermediárias fáceis de manusear, levando-os a resolver problemas complexos de raciocínio em várias etapas.
    • Interpretabilidade do modelo: Ao permitir que o modelo de IA gere etapas intermediárias de raciocínio com soluções, uma cadeia de pensamento nos fornece uma maneira de interpretar o comportamento do modelo; como o modelo alcançou uma solução particular. Isso nos permite identificar e depurar possíveis erros no caminho do raciocínio.
    • Ampla Aplicabilidade: o raciocínio em cadeia de pensamento mostra-se útil em várias tarefas, incluindo problemas de palavras matemáticas, raciocínio de senso comum e manipulação simbólica. Em essência, pode ser potencialmente aplicado a qualquer tarefa que os humanos possam resolver usando a linguagem, tornando-se uma abordagem versátil.
    • Fácil Integração: O raciocínio da cadeia de pensamento pode ser facilmente integrado aos modelos de IA baseados em linguagem existentes. Não requer recursos extras de computação para retreinar ou ajustar os modelos. Tudo o que precisa são alguns exemplos de cadeia de pensamento instruindo o modelo sobre como decompor os problemas.

    Foi demonstrado que o uso do raciocínio em cadeia de pensamento melhora efetivamente as habilidades cognitivas dos modelos de IA nas áreas mencionadas abaixo.

    raciocínio aritmético é uma habilidade cognitiva que envolve a habilidade de resolver problemas de palavras matemáticas realizando cálculos de várias etapas. Essa habilidade ajuda os alunos a desenvolver estratégias de resolução de problemas necessárias para resolver problemas matemáticos. Os pesquisadores demonstraram que a cadeia de pensamento ajuda os modelos de IA a aprender essa capacidade cognitiva.

    Raciocínio de bom senso é uma habilidade cognitiva crucial que lida com a resposta a perguntas relacionadas a cenários cotidianos por meio de inferências de conhecimentos gerais. Os cientistas estabeleceram que a cadeia de pensamento permite que os modelos de IA incorporem essa capacidade, permitindo que eles entendam situações comuns.

    raciocínio simbólico é uma habilidade cognitiva fundamental que envolve a manipulação e avaliação de expressões simbólicas. Os pesquisadores relataram que a cadeia de pensamento capacita os modelos de IA com essa capacidade, o que lhes permite realizar um raciocínio simbólico eficaz em vários domínios.

    Conclusão

    A cadeia de pensamento é uma abordagem promissora para aprimorar as habilidades cognitivas dos modelos de IA, especialmente em áreas como raciocínio aritmético, raciocínio de senso comum e raciocínio simbólico.

    Em contraste com um prompt simples, um prompt de cadeia de pensamento instrui o modelo a dividir problemas complexos em etapas menores para produzir um raciocínio intermediário junto com a solução final.

    A cadeia de pensamento não apenas resolve tarefas cognitivas, mas também fornece insights sobre o funcionamento interno do modelo. Ele também pode ser facilmente implantado em várias tarefas, sem exigir recursos de computação extras.

    Ao explorar e refinar ainda mais o raciocínio da cadeia de pensamento, podemos capacitar modelos de IA para demonstrar efetivamente habilidades cognitivas aprimoradas.

    Share.

    Comments are closed.