Poucos laboratórios de inteligência artificial (IA) fizeram tantas descobertas revolucionárias quanto a startup britânica DeepMind. O laboratório, fundado por Demis Hassabis, Shane Legg e Mustafa Suleyman em 2010, sempre esteve na vanguarda do desenvolvimento de IA no domínio do aprendizado profundo, aprendizado não supervisionado, aprendizado por reforço e neurociência.
Depois de ser adquirida pelo Google por US$ 500 milhões em 2014, a empresa também passou a desempenhar um papel fundamental no desenvolvimento de serviços, incluindo Google Search, YouTube e Gmail. Em 2023, a DeepMind fundiu-se com o Google Research para formulário do Google Deepmind.
Embora a DeepMind tenha demorado até 2021 para obter lucro pela primeira vez, por anos, ela desempenhou um papel crítico em dar vida a projetos de alto nível, incluindo AlphaFold, AlphaGo e WaveNet, e descobrindo novas maneiras de usar IA. para melhorar a tomada de decisão humana.
Os 5 principais avanços da IA da DeepMind
Desde a sua formação há mais de uma década, a DeepMind contribuiu para um número substancial de inovações na pesquisa de IA. Alguns dos mais significativos são discriminados abaixo.
1. AlphaFold
Um dos maiores avanços da DeepMind na última década foi um programa de IA chamado AlphaFold, lançado em 22 de julho de 2021. AlphaFold usa IA para processar a sequência de aminoácidos de proteínas e prevê a forma das proteínas gerando um modelo 3D.
Antes do lançamento do AlphaFold, os cientistas conheciam apenas as estruturas 3D de apenas 17% das proteínas do corpo. Agora, após o lançamento do AlphaFold, os cientistas têm acesso a mais de 200 milhões de previsões de proteínase 98,5% das estruturas 3D para proteínas humanas podem ser previstas.
Fundamentalmente, o AlphaFold ajudou a aumentar a visibilidade sobre a estrutura das proteínas humanas, que tradicionalmente permaneciam opacas como um dos maiores problemas da biologia. Antes do AlphaFold, os cientistas teriam que fazer experimentos independentes para descobrir a estrutura subjacente de uma proteína.
Hoje, mais de 1,2 milhão de pesquisadores em 190 países usam o banco de dados AlphaFold Protein Structure e usaram a solução para ajudar a desenvolver uma vacina contra a malária e descobrir novos tratamentos para o câncer de fígado.
Ao usar a IA para automatizar o mapeamento de proteínas, a DeepMind não apenas ajudou os cientistas a visualizar as estruturas das proteínas, mas ajudou ativamente a acelerar a pesquisa biológica e a futura descoberta de medicamentos.
2. AlphaGo
Outro projeto de pesquisa que atraiu interesse internacional significativo é o AlphaGo. O AlphaGo é um programa baseado em IA que usa aprendizado de máquina e redes neurais profundas para jogar o jogo de tabuleiro Go. O AlphaGo analisa os jogos anteriores e as configurações do tabuleiro para prever o próximo movimento a ser feito ao jogar Go.
Ao contrário de outros programas Go de IA, que usavam árvores de busca para testar todos os movimentos e posições possíveis, o AlphaGo recebeu uma descrição do tabuleiro Go como entrada e depois treinou para jogar contra si mesmo milhares de vezes para melhorar suas capacidades de tomada de decisão.
Esta abordagem foi um sucesso tão grande que o programa não só conseguiu derrotou o três vezes campeão europeu Go, Fan Hui, em outubro de 2015mas em março de 2016 passou a venceu Lee Sedol, 18 vezes campeão mundial de Go. AlphaGo também alcançou uma classificação profissional de 9 dan, a certificação mais alta do jogo.
De forma mais ampla, o AlphaGo demonstrou uma estrutura de como a IA pode ser aplicada para dissecar um processo complexo de tomada de decisão, aprendendo padrões comuns e prevendo a resposta ou resultado mais eficaz.
3. WaveNet
O WaveNet, lançado em 2016, é outra das principais criações do DeepMind. É um modelo generativo para áudio bruto que é treinado em um grande volume de amostras de fala e tem a capacidade de gerar fala com som natural com base em texto ou entrada de áudio.
Em vez de cortar e recompilar gravações de voz como outros sistemas de conversão de texto em fala, o WaveNet usou uma rede neural convolucional treinada em imagens, vídeos e sons para aprender e emular a estrutura da linguagem humana.
Isso significava que ele poderia compor formas de onda a partir do zero e gerar fala que imita o som de uma voz humana. Agora, o WaveNext é usado em uma variedade de aplicativos populares, incluindo Google Assistant, Google Search e Google Translate.
A principal conquista do DeepMind com o WaveNext foi que a organização conseguiu criar uma solução que tornou o som da fala gerado por computador mais natural e menos robótico do que as soluções tradicionais de conversão de texto em fala.
4. Bardo do Google
Na era da IA generativa, uma das contribuições mais importantes do Deepmind foi seu trabalho no chatbot Google Bard, lançado em parceria com o Google AI em março de 2023.
O Bard é construído no Pathways Language Model 2 (PaLM), um modelo de linguagem treinado em dados disponíveis publicamente, incluindo páginas da web, código-fonte e outros dados, e permite que os usuários processem consultas e respostas em linguagem natural dos usuários em linguagem natural.
O lançamento do Bard ocorreu apenas alguns meses depois que o OpenAI se estabeleceu como líder do setor de Large Language Model (LLM) com o lançamento do ChatGPT em novembro de 2022 e foi fundamental para permanecer competitivo na corrida armamentista de IA.
Nesta fase, o principal diferencial entre o Bard e o ChatGPT é que o primeiro pode pesquisar na Internet sob demanda e gerar respostas, enquanto o ChatGPT depende de dados de treinamento anteriores a 2021.
Vale a pena notar que, embora Bard tenha tido um começo difícil, perdendo para o Google US$ 100 bilhões em valor de mercado após alegando incorretamente que o telescópio James Webb Space tirou as primeiras fotos de um planeta fora do sistema solar durante uma demonstração. Desde então, no entanto, tornou-se um concorrente importante do OpenAI, atingindo 142,6 milhões de visitantes em maio.
5. RT-2
Apenas alguns meses depois de trabalhar com o Google AI para lançar o Bard, a DeepMind lançou o RT-2 em julho de 2023, o primeiro modelo de transformador robótico de ação de linguagem de visão (VLA). O RT-2 processa texto e imagens tiradas da web e os usa para produzir ações robóticas.
O RT-2 pode ser usado para controlar equipamentos de robótica, ensinando os robôs a realizar tarefas básicas, como identificar um pedaço de lixo e jogá-lo fora. Ele também tem a capacidade de responder aos comandos do usuário com raciocínio na forma de categorias de objetos ou descrições de alto nível.
Também tem a capacidade de realizar raciocínio semântico, como identificar se um objeto poderia ser usado como um martelo improvisado (por exemplo, uma pedra) e que tipo de bebida seria melhor para uma pessoa cansada (uma bebida energética).
Como um modelo VLA, o RT-2 é inovador no sentido de fornecer aos usuários uma nova maneira de interagir com os robôs, ensinando-os a realizar determinadas tarefas e ações de saída específicas. Isso abre toda uma nova gama de casos de uso para IA em robótica.
Conclusão
Durante anos, a DeepMind manteve a reputação de um dos melhores laboratórios de IA do mundo. Com seu histórico em dar vida a projetos de alto perfil AlphaFold, AlphaGo, WaveNet, Google Bard e RT-2, a DeepMind continuará sendo um participante importante na pesquisa de IA nos próximos anos.
Se há algo a ser aprendido com a pesquisa da DeepMind, é que a IA pode ser usada para resolver praticamente qualquer problema que você possa imaginar, não importa quão complexo seja o cenário ou requisito.