首页 > 媒体资料 > 媒体资料 > 索尼新数据集可检验AI模型是否公平对待不同人群

索尼新数据集可检验AI模型是否公平对待不同人群

发布时间:2025-11-08 14:03:19

11 月 6 日消息,索尼人工智能(Sony AI)发布了一个用于测试人工智能模型公平性与偏见的新数据集,名为“公平以人为本图像基准”(Fair Human-Centric Image Benchmark,简称 FHIBE,发音类似“Phoebe”)。该公司称,这是“首个公开可用、具有全球多样性、基于参与者知情同意的人类图像数据集,可用于评估各类计算机视觉任务中的偏见问题”。换言之,该数据集旨在检验当前 AI 模型在多大程度上能够公平对待不同人群。值得注意的是,索尼在评估过程中发现,目前没有任何一家公司发布的数据集能够完全满足其设定的公平性基准。

图源:索尼

图源:索尼

索尼表示,FHIBE 有助于应对 AI 行业在伦理与偏见方面的挑战。该数据集包含来自 80 多个国家近 2,000 名有偿参与者的图像,所有参与者的肖像均在明确知情同意的前提下被使用 —— 这与当前业界普遍采用的、未经许可大规模抓取网络数据的做法形成鲜明对比。FHIBE 参与者可随时选择撤回其图像。据IT之家了解,这些图像还附有详细标注,涵盖人口统计学和身体特征、环境因素,甚至包括拍摄时的相机参数。

该工具“验证了当前 AI 模型中此前已被记录的偏见”,但索尼强调,FHIBE 还能对导致这些偏见的具体因素进行细致分析。例如,某些模型在使用“she / her / hers”代词的时准确率较低,而 FHIBE 分析发现,此前被忽视的一个关键因素是这些人群在发型上的高度多样性。

此外,FHIBE 还发现,当 AI 模型被问及某个中立问题(如“该人物的职业是什么?”)时,会强化刻板印象。测试显示,模型对特定代词使用群体和族裔背景人群存在明显偏见,常常将受访者描述为性工作者、毒贩或小偷。而在被要求推测某人所犯罪行时,模型对非洲或亚洲族裔、肤色较深者以及使用“he / him / his”代词的人群,更频繁地生成“有毒”(toxic)回应。

索尼 AI 表示,FHIBE 证明了在数据收集中实现伦理、多样性和公平性是完全可行的。该工具现已向公众开放,并将随时间推移持续更新。相关研究成果已于本周三发表于《自然》(Nature)期刊。

 

媒体资料更多>>

雷军:小米YU7女车主很多,专为女车主做了全车况、全席位安全气囊保护设计 小米回应“绿化带战神”标签:有人刻意收集视频恶意剪辑带节奏 俄罗斯街头惊现山寨版特斯拉Cybertruck,原型是中国魏桥新能源货车 雷军回应小米YU7轮胎曾被黑成“面条胎”,称“是很均衡的胎” 小米YU7为何采用长车头?雷军称好看且更安全,现场搬起前机盖 百度AI芯片公司冲刺IPO:出货量国产第二 蔚来公司第100万台量产车下线仪式1月6日举行 百度萝卜快跑悄悄登陆青岛,成立子公司有望率先进入城阳区 美银分析师:科技巨头与OpenAI的合作恐“引火烧身” 机器人租赁造富神话背后:狂热、内卷与中国式清醒 Grok在线吹捧马斯克:比詹姆斯体能更强 比布拉德皮特还帅 采用4695大圆柱电池 宝马新世代iX3续航将突破900公里 纵横G700环塔版上市:33.49万起 搭载华为乾崑智驾ADS 4系统 王化已正式转岗小米武汉总部:正常的轮岗,没有别的任何原因 全景影像可能错位!又一车企宣布电动车召回 奔驰CLA上市品鉴会现场直击:这才是奔驰的“智能豪华电动”答案 星途汽车2025广州车展前瞻!ET5领衔、ES7 GT首秀、ES HERO首发亮相 三炮齐发重构场景价值,2026款长城炮广州车展引领皮卡品类升级 AMD:英特尔和英伟达的合作将加剧竞争,带来更大定价压力 国产化率达95%!北部湾海域最大油气平台完成浮托安装 马斯克能否拿到近万亿美元薪酬?特斯拉投资者明天将投票决定 马斯克xAI要求员工交出生物识别数据训练“虚拟女友”Ani,引发内部不满 索尼新数据集可检验AI模型是否公平对待不同人群 第三位太阳系外来客的7大怪!可惜 它不是外星飞船 今晚预售 小鹏X9增程版“朋友圈”公布:华为排第一 山姆崩盘背后,真相有点复杂 卡丁车灵魂未灭,MINI用电再造驾驶快乐 高配苹果17的价格居然能买车 奔腾小马为啥这么能圈粉? 已经有了5款MPV,这个品牌再推旗舰级MPV! 汽车产业向设计驱动创新转型的关键阶段,奇瑞落地的重要战略动作