Decifrando o viés em conjuntos de dados: o aprendizado de máquina revela divergências nas escolhas humanas de risco

Por

Aamir Sheikh

Tempo de leitura: 3 minutos - 19 de janeiro de 2024

Pesquisadores da Universidade Técnica de Darmstadt revelam viés em conjuntos de dados nas escolhas de risco humanas usando aprendizado de máquina.
O estudo aborda as diferenças entre as escolhas online e em laboratório, introduzindo um modelo híbrido para contrariar o aumento do ruído decisório.
Os desafios decorrentes da utilização de grandes conjuntos de dados online exigem um equilíbrio cuidadoso entre teoria e análise de dados na compreensão da tomada de decisões humanas.

Pesquisadores da Universidade Técnica de Darmstadt e do Centro Hessiano de Inteligência Artificial, na Alemanha, investigaram a complexa relação entre conjuntos de dados e modelos na compreensão das escolhas humanas de risco.

Suas descobertas, publicadas na revista Nature Human Behaviour, revelam a presença de viés nos conjuntos de dados, esclarecendo as diferenças sutis nos comportamentos de decisão entre participantes envolvidos em experimentos online e em laboratório. Empregando técnicas avançadas de aprendizado de máquina, os pesquisadores não apenasdento viés, mas também propõem um novo modelo híbrido para preencher a lacuna criada pelo aumento do ruído de decisão em conjuntos de dados online.

A interação entre conjuntos de dados de decisão e modelos de aprendizado de máquina

Compreender a interação entre conjuntos de dados de decisão e modelos de aprendizado de máquina (ML) é crucial para desvendar as complexidades da tomada de decisão humana. A pesquisa conduzida pela equipe alemã examinamaticessa relação, utilizando três conjuntos de dados distintos: Choice Prediction Competition 2015 (CPC15), Choice Prediction Competition 2018 (CPC18) e Choices13k.

Esses conjuntos de dados representam um espectro de escolhas feitas pelos participantes tanto em ambientes de laboratório controlados quanto em experimentos online de grande escala. A equipe de pesquisa empregou diversos modelos de aprendizado de máquina, incluindo métodos classicde inteligência artificial e arquiteturas de redes neurais, treinando-os com esses conjuntos de dados para obter insights sobre as variações de desempenho e os vieses.

Aprofundando a análise, o estudo descobriu que os modelos treinados no conjunto de dados Choices13k, representativo de experimentos online, apresentaram baixa generalização quando aplicados a conjuntos de dados de laboratório menores (CPC15 e CPC18). Da mesma forma, os modelos treinados no CPC15 não transferiram seu poder preditivo para o conjunto de dados Choices13k sem problemas, revelando um viésmatic do conjunto de dados.

Esse viés apontou para diferenças notáveis nos comportamentos de escolha entre os participantes envolvidos em experimentos de laboratório e aqueles que participaram online. Essas descobertas ressaltam a importância de reconhecer e abordar o viés nos conjuntos de dados, especialmente ao lidar com contextos e fontes de dados diversos.

Desvendando o viés do conjunto de dados

A revelação do viés no conjunto de dados motiva uma investigação mais aprofundada sobre suas origens e implicações. O estudo descobriu que os modelos treinados no conjunto de dados Choices13k demonstraram uma relutância em prever proporções de escolhas extremas, indicando um padrão de tomada de decisão distinto nos participantes online em comparação com seus pares em laboratório.

Para analisar a origem desse viés, os pesquisadores examinaram meticulosamente as características das apostas que previam a diferença no comportamento de escolha entre os conjuntos de dados. Utilizando técnicas como regressões lineares e SHapley Additive exPlanations (SHAP), eles quantificaram a importância de cada característica. Surpreendentemente, características da literatura de psicologia e economia comportamental, como dominância estocástica, probabilidade de ganho e diferença no valor esperado, desempenharam um papel fundamental na influência do viés.

Essas características, todas relacionadas ao grau em que se esperava que uma aposta gerasse um retorno maior em comparação com outra, ressaltaram a complexidade da tomada de decisão humana. É importante destacar que o estudo evidenciou que o comportamento de escolha no conjunto de dados Choices13k pareceu menos sensível a essas características do que no conjunto de dados CPC15, sugerindo que os participantes online demonstraram mais ruído ou indiferença em suas decisões. Essa compreensão mais aprofundada do viés do conjunto de dados e suas origens prepara o terreno para o desenvolvimento de estratégias que mitiguem seu impacto e aprimorem modelos preditivos em diversos contextos de tomada de decisão.

Analisando características e propondo um modelo híbrido

Com uma compreensão abrangente do viés em conjuntos de dados e suas implicações, os pesquisadores propuseram uma solução inovadora: um modelo híbrido. Esse modelo visava lidar com o aumento do ruído de decisão observado em conjuntos de dados online, introduzindo um modelo generativo probabilístico juntamente com uma rede neural treinada no conjunto de dados CPC15. O modelo generativo probabilístico pressupunha que uma parcela dos participantes no experimento online fazia palpites aleatórios, enquanto os demais seguiam os padrões de decisão aprendidos com o conjunto de dados de laboratório.

A integração desse modelo híbrido melhorou significativamente a precisão da previsão e reduziu as diferenças observadas em relação à rede neural tradicional treinada exclusivamente no conjunto de dados CPC15. Essa abordagem inovadora não apenas forneceu uma solução prática para o problema do viés do conjunto de dados, mas também destacou a importância de se considerar as características únicas dos conjuntos de dados online no desenvolvimento de modelos preditivos precisos e robustos para a tomada de decisões humanas.

A pesquisa demonstrou a relação complexa entre modelos de aprendizado de máquina e conjuntos de dados de decisões humanas, enfatizando a presença e o impacto do viés nos dados. O estudo destacou os desafios impostos pela dependência exclusiva de grandes conjuntos de dados online para a compreensão de teorias gerais sobre a tomada de decisões humanas.

Isso ressaltou a necessidade de uma abordagem equilibrada, combinando técnicas de aprendizado de máquina, análise de dados e raciocínio baseado em teoria para lidar com as complexidades das escolhas humanas arriscadas. À medida que a pesquisa abre caminhos para futuras explorações, surgem perguntas: como podemos refinar e validar modelos de aprendizado de máquina para levar em conta a variabilidade e o ruído inerentes aos dados online, pavimentando o caminho para uma compreensão mais robusta da tomada de decisão humana em diferentes contextos e configurações experimentais? A busca por respostas continua, incentivando os pesquisadores a explorar, refinar e integrar estruturas teóricas e analíticas para desvendar os mistérios da tomada de decisão humana em uma era cada vez mais digital.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Aamir Sheikh

Aamir é um jornalista de tecnologia com quase seis anos de experiência nos setores de criptomoedas e tecnologia. Ele se formou na MAJ University com um MBA em Finanças e Marketing. Atualmente, trabalha na Cryptopolitan, onde reporta sobre os últimos acontecimentos nos mercados de criptomoedas e previsões de preços.

ÍNDICE

1. A interação entre conjuntos de dados de decisão e modelos de aprendizado de máquina

2. Desvendando o viés do conjunto de dados

3. Analisando características e propondo um modelo híbrido

Compartilhe este artigo