谷歌最新的人工智能图像生成模型Imagen 3现在在美国公开可用,你只需要一个免费的谷歌账户就可以试用它。据VentureBeat报道,该公司本周悄悄开放了自己的模式,并于周二在一篇论文中发表了研究结果。两个月前,该公司在5月份的Google I/O大会上首次宣布了这款新机型。
谷歌研究人员在机器学习平台“拥抱脸”上发表的一篇文章中表示:“我们推出了Imagen 3,这是一种从文本提示生成高质量图像的潜在扩散模型。我们描述了我们的质量和责任评估。在评估时,imagen3优先于其他最先进的(SOTA)模型。此外,我们还讨论了有关安全和代表性的问题,以及我们用来尽量减少模特潜在危害的方法。”
从我最初的一些业余测试来看,这个模型似乎相当可靠。当要求获得逼真的图像时,结果是相对高质量的,有一些像样的现实主义尝试,第一眼可能会欺骗人们。(当我要求模特拍摄35mm胶片时,我对照片的质量印象特别深刻。)Imagen 3还突出显示了提示符中影响输出的特定部分,因此如果您不喜欢图像输出的方式,您可以调整这些部分。
图片来源:Jake Peterson/Google
然而,Imagen 3的产品仍然显示出人工智能生成图像的迹象。在一些照片中,手有太多的手指,脸是扭曲的,文字也没有意义。(尽管该模型能够准确地复制“可口可乐”和“佳能”的商标,但这侵犯了商标。)
图片来源:Jake Peterson/Google
谷歌并不是本周唯一一家发布新图像模型的科技公司。X最近推出了该公司的人工智能聊天机器人Grok的新测试版,并附带了一个似乎几乎没有限制的图像生成器。用户(特别是Lifehacker的米歇尔·埃尔哈特)已经用Grok生成了从戴着MAGA帽子的泰勒·斯威夫特到拿着AK-47的皮卡丘的各种东西。
另一方面,图3显示了明显的护栏。当我试图用任何有争议的内容提示谷歌的图像生成器时,它会自动停止并礼貌地引导我到imagen3的FAQ,以了解为什么我的提示不合适。它还拒绝生成受版权保护的内容,但可以通过正确的提示进行欺骗。如上所述,我能够生成徽标,甚至能够让它吐出马里奥和皮卡丘等商标角色,即使我无法让它们参与枪战。
图片来源:Jake Peterson/Google
谷歌新推出的人工智能图像生成器可供任何拥有谷歌账户的美国用户免费试用。要做到这一点,请前往谷歌人工智能测试厨房中的ImageFX。用你的Google帐户登录,然后得到提示。
2025-03-13 17:34:41
2025-03-13 17:33:46
2025-03-13 17:25:25
2025-03-13 17:22:59
2025-03-13 17:17:03
2025-03-13 17:11:18
2025-03-13 17:08:42
2025-03-13 17:00:21
发表评论