一个神秘的新图像生成模型在众包人工分析基准测试中击败了 Midjourney、黑森林实验室和 OpenAI 的模型。这个名为”red_panda“的模型在人工分析的文本到图像排行榜上领先排名第二的黑森林实验室的 Flux1.1 Pro 约 40 个 Elo 分数。 Artificial Analysis 使用 Elo(一种最初开发用于计算棋手相对技术水平的排名系统)来比较其测试的各种模型的性能。
图片由 red_panda 生成。图片来源:Deedy Das
与社区人工智能基准Chatbot Arena类似,Artificial Analysis 通过众包的方式对模型进行排名。 对于图像模型,Artificial Analysis 会随机选择两个模型,并向它们提供一个独特的提示。 然后,它会展示提示和生成的图像,用户选择他们认为更能反映提示的图像。
当然,这个投票过程存在一定的偏见。 Artificial Analysis 的投票者大多是人工智能爱好者,他们的选择可能无法反映广大生成式人工智能用户的偏好。
不过,就生成速度而言,red_panda 也是排行榜上表现较好的模型之一。 该模型生成图像的时间中位数约为 7 秒,比 OpenAI 的 DALL-E 3 快 100 多倍。
另一张图片据说来自 red_panda。图片来源:Neuralithic
那么,red_panda 从何而来? 是哪家公司生产的? 什么时候能发布? 这些都是很好的问题。 不过,人工智能实验室越来越多地使用社区基准来在发布前鼓动人们的期待。
暂无评论内容