刚刚发布的 Pixel 9,将手机拍照卷到了一个新高度
今年的 Google,貌似有些着急。
先是奥运会上发布的 AI 广告弄巧成拙,引起了巨大的舆论危机,一度被喷到关闭评论区;又被哥伦比亚特区法院判决为垄断企业,深陷垄断囹囵。
▲ 翻车的 Gemini 广告
双重打击下,Google 几乎处于有史以来最尴尬的境地,此时的 Google,急需一场漂亮的翻身仗来找到落脚点。
于是,按惯例应该在每年十月召开的 Made by Google 全球发布会,现在来了。
Pixel 9,全系登场
在这场提前了两个月的年度盛典上,Pixel 9 系列登场。
今年,Google Pixel 系列迎来了四位成员,分别是 Pixel 9、Pixel 9 Pro、回归的 Pixel 9 Pro XL 以及 Pixel 9 Pro Fold,这四台手机均搭载了 Google 自研的 Tensor G4 处理器。
Tensor G4 处理器使用 1+3+4 的内核配置,由一颗 Cortex-X4、三颗 Cortex-A720 与 四颗 Cortex-A520 组成,与 Pixel 8 上的 Tensor G3 处理器相比(或更以前的芯片),Tensor G4 中新的 Cortex-X4 提升了约 11% 的单核性能,但由于缺少一个内核(Cortex-A720),所以与 Tensor G3 相比,多核结果预计只会上升约 3%。
▲ Google Pixel 9 Pro XL 与上一代 Pixel 8 Pro 跑分对比
不过,芯片的短暂停滞并没有影响 Google 使用 AI 的决心:这是第一台搭载了 Gemini Nano Multimodality 多模态模型的手机,Google 宣称这个模型比去年推出的模型要强大 3 倍,复杂程度也提高 3 倍。
除了新芯片,Google 为影像也做足了准备。
虽然 Pixel 9 标准版与上代 Pixel 8 标准版的变化不大,只是将超广角摄像头从 IMX 386 提升到 IMX 858,但在 Pixel 9 Pro 与 Pro XL 上,Google 选择「一致强大」的方案:除了主摄使用三星 GNK 五千万像素传感器外,其他所有摄像头都使用索尼 IMX 858 传感器。
IMX 858 是目前影像旗舰中最常见的传感器,1/2.51 英寸足以在适当的影像模组大小中担任超广角镜头与长焦镜头的成像任务——这与小米 14 Ultra 的相应焦段配置相同。
Pixel 从单摄「硬刚」双摄的时代一路走来,终于在今天赶上了影像旗舰手机应有的硬件配置。
在这两年的 Made by Google 中,硬件已经不再是传统看点,风头正盛的 AI 功能才是大家更关心的话题,
AI 影像,由「实」入「虚」
在 AI 浪潮袭来的时候,Google 企图踏浪而行——去年的 Made by Google 与今年 Google I/O 2024 大会上,Google 公布了大量 AI 技术,从生成式模型到自然语言处理、从独立 app 到系统集成,这是一种行为上的「All in AI」。
乔布斯最认可的计算机科学家艾伦·凯(Alan Kay)有句名言:
真正认真对待软件的人,就应该自己做硬件。
Google 推出的 AI 新功能的第一位接棒者,自然是「亲儿子」Pixel,而影像,便是手机 AI 的大展拳脚之处。
Google 将 Pixel 9 系列的相机称呼为「世界上第一款 AI 相机」,足以见证除了旗舰级别的摄影模组外,Google 对全新 AI 的加持抱有同样的信心。
在 Pixel 8 中,有一个专为合照准备的功能:Best Take
在拍照时,有时难免会拍下不符合当时情景的表情和姿态,Best Take 会拍摄多张照片,通过 AI 选择出这些照片中每个人最好的一部分自动合成,如果你对 AI 选择的不满意,也可以手动进行选择,最后合成在一张照片中。
而在 Pixel 9 中,为了帮助你更好的合照,Google 又搞了新花样:Add me
这个新功能企图解决你在没有外人的帮助下进行「非自拍合影」的困难——你只需要将 Pixel 9 举起来拍摄朋友,再让朋友在同样位置将 Pixel 9 对准你,Add me 会自动帮你们合成在一张照片中。
这有些像摄影中常用的手法——堆栈:将相机稳定后,拍摄同一场景下不同位置的人物,再将这些拍摄的照片放入 Photoshop 或其他后期软件中进行对齐,最后合成在一起,将不同的人物呈现在同一张照片上。
▲ 使用相机进行堆栈拍摄的照片
现在,在 AI 的加持下,Pixel 9 在抬手之间就能完成这个复杂流程。
如果说 Add me 只是「堆栈」技术的自动化,那么「Magic Editor」的新功能,则是将手机影像真正带到了「真实」与「虚假」的交汇点。
升级后的「Magic Editor」成为了真正的「魔术编辑器」:除了前代的改变画面曝光、去除背景与移动画面元素外,只需要输入相应的文字,就能创造出根据用户脑海中的画面。
简而言之,这就是我们常说的文生图模型。
文生图,已经不算是 AI 技术中的「新鲜」家伙了,例如 OpanAI 开发的 DALL-E 与开源的 Stable Diffusion 等模型都早已是我们熟悉的作图帮手,经过多次迭代,各类创作可以说是信手拈来。
▲ 使用 Midjourney 生成的图片
不过,传统的模型都需要我们使用网页或是 Discord 等渠道才能访问,更有甚者需要自己配置本地的操作界面,才能顺利使用,而 Pixel 9 系列则简单多了——你只需要解锁手机后输入文字,Magic Editor 就可以帮你完成这一切。
这离不开 Google 对于生成式 AI 的技术储备——Google 旗下的 Imagen 从 2022 年 5 月开始,就为使用者提供 AI 图像生成服务,例如我们最讨厌的人机验证程序。
作为 Android 阵营的嫡长子,Pixel 一直以来都比较低调,但谁也不能忽视它的存在——Google 有任何新技术,总是第一时间交给它,久而久之,Pixel 变成了一种指路标:Add me 与 Magic Editor 两个新功能,也许会是未来一段时间内 Android 对于 AI 摄影技术运用的方向。
虚与实的路口,是记录与创作的分界线
Pixel 9 为 AI 影像指明了方向,同时也带来了争议:从摄影后期到 AI 介入,人们始终对「失去真实」这件事耿耿于怀。
的确,不知道什么时候起,照片好像被冠上了「真实」的紧箍咒:每张照片都必须是客观的「证据」,一旦经过修改或是创造,就会被打上「P 图」标签,仿佛我们的生活也作了弊。
但照片不该如此——谁会为了百分之百的真实去按下快门呢?除了新闻与纪实摄影师很少有人这样做。
▲哪怕是新闻摄影,也通过构图规避了一些「真实」
对于大部分人而言,照片更多是一个载体,就像 Google 所说的:
通过我们的 AI 技术,照片不仅仅是一张图像,而是捕捉和重现生命中重要时刻的方式。
这些重要时刻,总是充满情绪与主观——对于绝大多数人而言,能引动我们按下快门的,常常是引起悸动、喜悦与惊奇的瞬间。
于是这些浓缩着我们所思所想的照片,成为了宝贵回忆的载体。
▲ 手机的白平衡不能帮我留住金色的余晖,AI 可以
但照片太过客观,往往与我们脑海中的回忆「对不上号」,这时候,使用 AI 修改或是创作照片,正如那句经典的摄影言论:
我不是在 P 图,只是还原当时眼里看到的美景。
虽然这只是一句摄影论坛上常用于应对后期指责的找补言论,但恰恰命中了 AI 技术对照片的意义:使用工具,让人们的照片,更轻松地贴近回忆。
在 19 世纪末,随着摄影的出现,写实的任务开始由绘画过渡到摄影,印象派这种脱离完全写实的绘画新理念开始抬头,并引领风潮。
现在,随着 AI 的出现,摄影也进一步扩展了自己的边界,越来越多的人开始「创作」照片,无论你反对还是支持,摄影,已经走上了这么一条不会回头的道路。