A jogada discreta da Apple: revelando o Ferret, um LLM multimodal de código aberto

- Em outubro passado, pesquisadores da Apple e da Universidade Cornell lançaram discretamente o Ferret, um modelo de linguagem multimodal de código aberto para grandes linguagens, chamando a atenção da comunidade de IA.
- O Ferret utiliza imagens como consultas, examinando regiões específicas,dentelementos e respondendo a perguntas do usuário, demonstrando a inesperada abertura da Apple no domínio da IA.
- O lançamento indica uma mudança estratégica para a Apple, que enfrenta dificuldades para competir com os rivais devido a limitações de infraestrutura, sendo forçada a escolher entre parcerias com empresas de nuvem ou a adoção de uma abordagem de código aberto.
Em uma revelação discreta que repercutiu nos corredores da tecnologia mais do que qualquer anúncio orquestrado, a Apple Inc. e pesquisadores da Universidade Cornell apresentaram o Ferret ao mundo em outubro passado. Este modelo de linguagem de código aberto e multimodal (LLM) quebra a tradição de sigilo da Apple, marcando um salto significativo no campo da inteligência artificial. Utilizando imagens como consultas, a estreia silenciosa do Ferret no GitHub despertou considerável interesse entre entusiastas e pesquisadores de inteligência artificial.
Em meio aos corredores silenciosos da inovação, pesquisadores da Apple e da Universidade Cornell, em uma jogada inesperada, apresentaram em outubro passado um modelo de linguagem de código aberto e multimodal (LLM, na sigla em inglês) conhecido como Ferret. Esse lançamento não anunciado no GitHub passou despercebido, mas desde então cativou a atenção da comunidade de IA.
A engenhosa operação do Ferret – Uma análise mais detalhada
O modo de operação do Ferret envolve examinar regiões específicas dentro de uma imagem,dentelementos valiosos e encapsulá-los em uma caixa delimitadora. Essa abordagem inovadora permite que os usuários usem esses elementos como consultas, fazendo com que o Ferret responda de maneira tradicional.
Por exemplo, quando um usuário destaca a imagem de um animal e pergunta ao Ferret sobre sua espécie, o modelo odente responde de acordo. O Ferret pode até mesmo aproveitar o contexto de outros elementos na imagem para fornecer respostas mais detalhadas, oferecendo uma amostra de suas capacidades multimodais exclusivas.
O modelo Ferret, de código aberto, caracterizado pela capacidade de referenciar e estabelecer conexões entre diversos elementos em diferentes níveis de granularidade, representa uma mudança significativa para a Apple, conforme indicado pelas informações compartilhadas por Zhe Gan, cientista de pesquisa de IA da Apple.
Conhecida por seu caráter reservado, a disposição da empresa em compartilhar seus avanços em IA com a comunidade de código aberto é vista como uma atitude surpreendente. Essa nova abertura posiciona a Apple como um player importante no espaço da IA multimodal, desafiando as expectativas do setor.
A mudança estratégica da Apple: navegando pelo cenário da IA
O lançamento do Ferret não apenas marca a entrada da Apple na IA de código aberto, mas também reflete a resposta estratégica da empresa aos desafios do setor de IA. Como observado pelo blogueiro de tecnologia Ben Dickson, a Apple enfrenta forte concorrência de rivais como a Microsoft Corp. e o Google LLC devido às limitações de seus recursos computacionais. Ao contrário de modelos como o ChatGPT, a infraestrutura da Apple não está equipada para atender grandes modelos de linguagem (LLMs) em escala.
Essa situação coloca a Apple numa encruzilhada, com duas opções viáveis. A primeira envolve a formação de parcerias estratégicas com provedores de nuvem hiperescaláveis para reforçar suas capacidades de IA. A segunda, como indicado pelo lançamento do Ferret, é adotar uma abordagem de código aberto, semelhante à estratégia empregada pela Meta Platforms Inc. A escolha entre colaboração e compartilhamento com a comunidade reflete o compromisso da Apple em manter-se competitiva no cenário de IA em rápida evolução.
Enquanto a Ferret explora silenciosamente territórios desconhecidos no campo da IA multimodal, a Apple se encontra numa encruzilhada que transcende a mera inovação tecnológica. O lançamento dessa maravilha de código aberto levanta uma questão complexa sobre o futuro da Apple na área da IA.
Será que o Ferret vai impulsionar a Apple para a vanguarda da IA multimodal, desafiando as normas da indústria e fomentando avanços colaborativos? Ou simboliza uma mudança mais ampla no cenário da IA, onde gigantes da indústria equilibram o domínio proprietário com a inovação colaborativa? Os ecos da chegada discreta do Ferret ainda persistem, convidando à especulação sobre o papel em evolução da Apple na definição do futuro da inteligência artificial. A resposta se revela na interseção entre tecnologia, colaboração e a dinâmica em constante transformação da narrativa da IA.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.
Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Aamir Sheikh
Aamir é um jornalista de tecnologia com quase seis anos de experiência nos setores de criptomoedas e tecnologia. Ele se formou na MAJ University com um MBA em Finanças e Marketing. Atualmente, trabalha na Cryptopolitan, onde reporta sobre os últimos acontecimentos nos mercados de criptomoedas e previsões de preços.
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)















