Viés de gênero na ordenação alfabética de nomes [Digital]
Dissertação
Português
681.3.025:007
Fortaleza, 2019.
Nós investigamos empiricamente, se uma população, quando ordenada alfabeticamente pelo
nome, mostra um desequilíbrio de seus Top-k indivíduos em relação ao gênero. Nossa motivação é que, para melhorar a usabilidade, os sistemas de informação geralmente ordenam listas de nomes de indivíduos para que... Ver mais Nós investigamos empiricamente, se uma população, quando ordenada alfabeticamente pelo
nome, mostra um desequilíbrio de seus Top-k indivíduos em relação ao gênero. Nossa motivação é que, para melhorar a usabilidade, os sistemas de informação geralmente ordenam listas de nomes de indivíduos para que usuários tomem decisões (e.g. escolhendo crianças para adoção ou oferecendo uma oportunidade de trabalho aos trabalhadores). Se a ordenação alfabética mantiver uma baixa representação de pessoas de um determinado gênero entre os Top-k indivíduos, oportunidades podem estar sendo negadas a pessoas desse gênero. O trabalho de pesquisa foi realizado com a exploração de nove conjuntos de dados de primeiros nomes de populações de diferentes países. Cada conjunto de dados tem a frequência de adoção do primeiro nome no país. Os resultados obtidos a partir de amostras desses conjuntos de dados mostram que a ordenação alfabética de nomes implica em desequilíbrios significativos da população em relação ao gênero. Tipicamente, para as amostras, os Top-10 indivíduos têm uma proporção menor de mulheres do que homens em comparação com a proporção de todo o conjunto. Uma medida de justiça também foi usada para quantificar o risco de que uma amostra de n pessoas, quando ordenada alfabeticamente pelo nome, tivesse um desequilíbrio de gênero nos Top-k indivíduos. A
aplicação desta medida mostrou que amostras de indivíduos com os primeiros nomes espanhóis, quando ordenadas alfabeticamente, são mais propensas a desequilíbrios entre os gêneros do que os exemplos de indivíduos com o primeiro nome em outros idiomas. Como consequência, essas amostras são mais propensas a induzir viés na tomada de decisão. Além disso, foi desenvolvido um portal colaborativo em que os usuários poderão compartilhar listas com nomes de diversas nações, possibilitando assim que pesquisadores possam aprofundar o estudo deste problema. Outra utilidade da ferramenta é que qualquer pessoa pode carregar uma lista de indivíduos e o sistema irá averiguar o nível de viés que a mesma apresenta de acordo com a medida de justiça. As listas carregadas pelos usuários também são posicionadas em relação as listas dos outros países e informações sobre elas também serão apresentadas.
Palavras-chave: Viés de Gênero | Medida de Justiça | Ordenação Alfabética Ver menos
nome, mostra um desequilíbrio de seus Top-k indivíduos em relação ao gênero. Nossa motivação é que, para melhorar a usabilidade, os sistemas de informação geralmente ordenam listas de nomes de indivíduos para que... Ver mais Nós investigamos empiricamente, se uma população, quando ordenada alfabeticamente pelo
nome, mostra um desequilíbrio de seus Top-k indivíduos em relação ao gênero. Nossa motivação é que, para melhorar a usabilidade, os sistemas de informação geralmente ordenam listas de nomes de indivíduos para que usuários tomem decisões (e.g. escolhendo crianças para adoção ou oferecendo uma oportunidade de trabalho aos trabalhadores). Se a ordenação alfabética mantiver uma baixa representação de pessoas de um determinado gênero entre os Top-k indivíduos, oportunidades podem estar sendo negadas a pessoas desse gênero. O trabalho de pesquisa foi realizado com a exploração de nove conjuntos de dados de primeiros nomes de populações de diferentes países. Cada conjunto de dados tem a frequência de adoção do primeiro nome no país. Os resultados obtidos a partir de amostras desses conjuntos de dados mostram que a ordenação alfabética de nomes implica em desequilíbrios significativos da população em relação ao gênero. Tipicamente, para as amostras, os Top-10 indivíduos têm uma proporção menor de mulheres do que homens em comparação com a proporção de todo o conjunto. Uma medida de justiça também foi usada para quantificar o risco de que uma amostra de n pessoas, quando ordenada alfabeticamente pelo nome, tivesse um desequilíbrio de gênero nos Top-k indivíduos. A
aplicação desta medida mostrou que amostras de indivíduos com os primeiros nomes espanhóis, quando ordenadas alfabeticamente, são mais propensas a desequilíbrios entre os gêneros do que os exemplos de indivíduos com o primeiro nome em outros idiomas. Como consequência, essas amostras são mais propensas a induzir viés na tomada de decisão. Além disso, foi desenvolvido um portal colaborativo em que os usuários poderão compartilhar listas com nomes de diversas nações, possibilitando assim que pesquisadores possam aprofundar o estudo deste problema. Outra utilidade da ferramenta é que qualquer pessoa pode carregar uma lista de indivíduos e o sistema irá averiguar o nível de viés que a mesma apresenta de acordo com a medida de justiça. As listas carregadas pelos usuários também são posicionadas em relação as listas dos outros países e informações sobre elas também serão apresentadas.
Palavras-chave: Viés de Gênero | Medida de Justiça | Ordenação Alfabética Ver menos
We empirically investigate, whether a population, when alphabetically ordered by name, shows an imbalance of its Top-k individuals in respect to gender. Our motivation is that, to improve usability, information systems often order individuals¿ names for users to make decisions (e.g., in choosing...
Ver mais
We empirically investigate, whether a population, when alphabetically ordered by name, shows an imbalance of its Top-k individuals in respect to gender. Our motivation is that, to improve usability, information systems often order individuals¿ names for users to make decisions (e.g., in choosing children for adoption or offering a job opportunity to workers). If alphabetic ordering maintains a low representation of people of a particular gender among the Top-k individuals, opportunities may be denied to people of this gender. The research was carried out with the exploration of nine datasets of populations first names. Each dataset has the frequency of adoption of the first name in the country. The results obtained from samples of these datasets show that the alphabetical ordering of names implies significant imbalances of the population in
respect to gender. Typically the Top-10 individuals have a lower proportion of women than men compared to the proportion of the whole set. A fairness measure was also used to quantify the risk that a sample of n people, when placed alphabetically by name, would have an imbalance in the Top-k individuals of the sample population in relation to gender. The application of this measure has shown that samples of individuals with Spanish first names when alphabetically ordered, are more prone to gender imbalance among their Top-k individuals than samples of individuals with
first name in other languages. As a consequence, these samples are more likely to induce bias in decision making. In addition, a collaborative plataform has been developed where users are able to share lists with names from different nations, thus enabling researchers to further study this problem. Another usefulness of the tool is that anyone can upload a list of individuals and the system will check the level of bias it presents according to the fairness measure. Lists uploaded by users are also ranked relative to lists in other countries and information about them will also be displayed.
Keywords: Gender Bias | Fairness Measure | Alphabetical Order Ver menos
respect to gender. Typically the Top-10 individuals have a lower proportion of women than men compared to the proportion of the whole set. A fairness measure was also used to quantify the risk that a sample of n people, when placed alphabetically by name, would have an imbalance in the Top-k individuals of the sample population in relation to gender. The application of this measure has shown that samples of individuals with Spanish first names when alphabetically ordered, are more prone to gender imbalance among their Top-k individuals than samples of individuals with
first name in other languages. As a consequence, these samples are more likely to induce bias in decision making. In addition, a collaborative plataform has been developed where users are able to share lists with names from different nations, thus enabling researchers to further study this problem. Another usefulness of the tool is that anyone can upload a list of individuals and the system will check the level of bias it presents according to the fairness measure. Lists uploaded by users are also ranked relative to lists in other countries and information about them will also be displayed.
Keywords: Gender Bias | Fairness Measure | Alphabetical Order Ver menos
Furtado, João José Vasco Peixoto
Orientador
Furtado, João José Vasco Peixoto
Banca examinadora
Caminha Neto, Carlos de Oliveira
Banca examinadora
Paixão, Matheus Henrique Esteves
Banca examinadora
Reis, Saulo Davi Soares e
Banca examinadora
Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada
Dissertação (mestrado)