最先倒下的 AI 明星公司,可能是它
潮水退去,才知道谁在裸泳。
3 个月前,全球最大 AI 开源社区 Hugging Face 首席执行官,对 2024 年的 AI 行业做了 6 条预测,其一是:
某个当红的 AI 公司会破产,或者以极低的价格被收购。
不知道当时他的心里有没有具体的人选,但开年没多久,现实真的如剧本一样上演。
技术团队集体出走,当红 AI 独角兽的垮掉
谈到文生图模型,跳不过三个产品: DALL-E、Midjourney 以及 Stable Diffusion。
DALL-E 内置于 GPT-4,召唤方便。Midjourney 因为创业团队只有 11 人而成了传奇,画风更加艺术。
Stable Diffusion 出名更多是因为产品本身,开源、自由、免费,背后的公司 Stability AI 反而名不见经传。
最近,Stability AI 又陷入了麻烦:Stable Diffusion 开发者之一 Robin Rombach,从公司辞职。
▲ Robin Rombach.
强调「又」是因为,一年来,这家公司的技术团队动荡不断,首席技术官换人,首席信息官、工程副总裁、产品副总裁、研发副总裁、研究主管、大语言模型负责人等陆续离职。
2022 年 8 月,Stability 向公众发布了 Stable Diffusion,日活很快达到 1000 万。当年 10 月,Stability 完成约 1 亿美元的融资,估值达到 10 亿美元,加入「独角兽」的行列。
不过 1 年多,Stability 怎么就从神坛跌落?
离职原因并未对外公布,福布斯认为,人才外流无非一个原因:公司已经入不敷出了,又赚不到钱和融不到资。
闭源的 DALL-E 和 Midjourney 用订阅模式赚钱很好理解,Stable Diffusion 作为开源项目,供所有人免费下载和使用,但一样可以做大做强。
就像开源界的楷模红帽公司,基于免费的开源操作系统 Linux,以订阅模式向 B 端出售优质的企业级软件服务,并于 2019 年被 IBM 以 340 亿美元收购。
Stability 的盈利方式则主要分为两种:文生图 Web 应用 DreamStudio 的 API 访问,以及面向企业的 AI 咨询和模型服务。
2023 年 12 月,Stability 为商业用户推出了每月 20 美元起的付费套餐。个人和研究需要的非商用,依然是免费的。
然而,身处生成式 AI 的寒武纪大爆发,如同参与大逃杀,个人能力、人脉资源和场外因素缺一不可。
Stability 不像 Meta、Google 根基深厚,也不像 OpenAI 有微软投喂算力和资金,而是和亚马逊的云计算部门按行业规矩签了合同,拿 4000 多个英伟达芯片训练模型。
AI 模型训练烧钱,业务铺得不够大,虎视眈眈的竞争对手又在抢夺市场份额。去年 10 月,Stability 从英特尔拿到 5000 万美元补血,但再多的钱也经不起一直亏损。
彭博社报道,Stability 在 2023 年 10 月的训练和工资支出约 800 万美元,同年 8 月的软件和服务收入却只有 120 万美元。
福布斯从另一个角度说明了 Stability 的困难,打工人应该更能共情。公司不仅涉嫌拖欠员工工资、欠商业伙伴的钱,甚至因为不按时给钱逼得亚马逊威胁断掉 GPU 权限,但 Stability 否认了此事。
AI 图片的版权争议,让本不富裕的初创公司雪上加霜。图库 Getty Images 以及艺术家们主张,Stability 窃取了艺术品和图库照片来训练其模型,诉讼仍在进行中。
巧合的是,Stability 和竞争对手 Midjourney 的关系,也在最近掉入了冰点。
3 月初,Midjourney 拉黑了 Stability 所有员工,因为调查到疑似 Stability 员工的两个付费账户试图窃取数据,导致服务器长时间中断。
Stability 的 CEO 在 X 回应,这只是一个员工的个人行为,再次证明,高端的商战,往往采用最朴素的方式。
做实事的人,讲故事的人
Stable Diffusion 和 Stability 之间的关系,并非像 ChatGPT 和 OpenAI 那样纯粹。
Stable Diffusion 源于一个学术项目,前身是 Latent Diffusion 模型,由慕尼黑的路德维希-马克西米利安大学、纽约的 AI 公司 Runway 主导研究。
Runway 就是文生视频赛道的那个 Runway,原来命运的齿轮早已开始转动,科技行业也是个熟人圈子。
▲ 图片来自:arxiv
项目的研究论文发布 7 个月后,2022 年 6 月,Stability 以金主的身份加入,为其提供了计算资源,Stability 自己的生成式 AI 团队也参与了研究。
这次辞职的 Robin Rombach,是慕尼黑研究团队领导和论文一作,后来被 Stability 纳入麾下。论文署名紧随其后的两位慕尼黑同僚,疑似也随其离开。
Stability 今年 2 月发布了 Stable Diffusion 3,3 月发布了新的 3D 视频模型 SV3D,这些技术人员,颇有站好最后一波岗再卷铺盖走人的感觉。
▲ SD3 在多主题提示词、图像质量和文字拼写方面都进化了.
过去的一年,Stability 可谓勤勉,升级 Stable Diffusion,并开发新模型:文生图模型 SDXL、大语言模型 StableLM、音频生成模型 Stable Audio、视频生成模型 Stable Video,代码生成模型 Stable Code、3D 对象生成模型 Stable Zero123……
但竞争对手们也没闲着,比如被 GPT-4、Gemini、Claude 几座大山压着,StableLM 几乎没有什么水花。Meta 也开源了 Llama 2,更是和 Stability 直接竞争。
如今,草创时期的多名核心人才出走,虽然不至于人去楼空,但军心势必会被动摇,类似的例子近在眼前。
最近,初创公司 Inflection AI 联合创始人 Mustafa Suleyman 接了微软的 Offer,领导微软面向消费者的 AI 业务,他同时也是 Google 旗下 DeepMind 的联合创始人。
▲ Mustafa Suleyman.
Inflection 最主要的产品是聊天机器人 Pi。和同行比较,Pi 的情商尤其突出,更有同理心,更加关心你,喜欢加 emoji 疑似患了聊天讨好症,和它聊天的时候,会不自觉放松下来。
一同加入微软的,还有 Inflection 联合创始人兼首席科学家 Karén Simonyan,以及部分 Inflection 工程师和研究人员。
OpenAI 宫斗期间,纳德拉招揽 Sam Altman 和几百名誓死追随的员工,从而无痛收购 OpenAI 的计划落空了。莞莞类卿,如今他的愿望在 Inflection 身上代偿。
这次微软把 Inflection 高管团队打包带走,将其模型集成到微软的云计算业务 Azure,花的钱远低于估值,虽然不是收购,本质接近收购,Inflection 和 Pi 名存实亡。
不难看出,当 AI 行业卷生卷死,人才仍然是关键。只要有人的地方就有恩怨,有恩怨就会有江湖,科技行业也不免俗,内斗不止,商战不休。
人才出走,这剧情 Google 再熟悉不过。同时,Stability 的高层管理风格也和多次翻车的 Google 一样,受到了质疑。
▲ Emad Mostaque.
Stability 首席执行官 Emad Mostaque 的上份职业是对冲基金经理,大部分时间在搞石油交易,虽然拥有计算机科学学位,但之前从未创办或入职科技公司,还有说大话和抢功劳的毛病,自上而下影响着企业文化。
一些现任和前任员工爆料,Mostaque 经常言过其实。他在融资时将亚马逊称为「战略合作伙伴」,其实两者只是普通的甲乙方。他说 Stability 正在为数十家客户构建定制 AI 模型,但被问到具体的名字时,只透露了一家印度控股公司和一个非洲国家。
更加过分的是,明明公司已经资金困难,Mostaque 和他曾经担任公关主管的妻子,与公司财务之间的关系还不清不楚。
2023 年 7 月,前 Google 研究员 David Ha 在担任 Stability 研究主管 8 个月后辞职,他接受媒体采访时说,尽管入局得早,推动了 AI 行业的发展,但 Stability 仍然需要找到自己的护城河保持竞争力,似乎话里有话。
多位人才出走之后, Stability 自己的技术能力如何,确实是个等待解答的问题。
宣布融资的新闻稿里,Stability 不知有意还是无意,模糊了 Stable Diffusion 研究人员的存在,只说 Stable Diffusion 是一款功能强大、免费且开源的文本到图像生成器,自己是这款产品背后的公司。
话留一半也是事实,但在论文留名的教授 Björn Ommer 对此很是不满:「在科学研究中,如果你从某个地方拿走了一些东西,你应该归功于某人、引用某人。」
目前担任 Stability 首席研究员的,是从 Google Brain 跳槽的 Varun Jhampani,他能够被留住多久,恐怕只有他自己知道。
贩卖想象的阶段结束,见血的洗牌期到来
Stable Diffusion 的免费开源对于 AI 社区意义非凡。
它的许可证十分宽松,只要求道德、合法地使用模型,允许商业和非商业用途,让任何人可以自由地创作、开发产品甚至推出自己的项目。
比如 AI 生成图片的角色稳定性问题,Midjourney 给出了 Character Reference 的方案,开源社区则为 Stable Diffusion 推出了附加组件 IP Adapter。
同时,开源模型也更容易成为 Deepfake 的武器,用来生成暴力和色情内容。更有甚者,一些基于 Stable Diffusion 的初创公司不标注许可证和技术来源,套个壳就以崭新的面貌出道骗钱了。
开源的倡导者们往往认为,当人们无需付费访问模型时,AI 的开发效果会更好,并且模型的训练方式更加透明。
但开发模型的公司们未必这么觉得,因为担心「竞争和安全问题」,OpenAI 从 GPT-4 开始不再分享研究成果,取而代之的是技术报告。
从商业的角度,OpenAI 的决定可以理解。开源的两面性,以及开源和闭源的冲突,也如同当下 AI 竞争的缩影。
2023 年,生成式 AI 的发展如烈火烹油、鲜花着锦,巨头和初创竞相发布模型和商业化的产品,但一派欣欣向荣的景象不仅孕育着成功,也包容着谎言、危害、浑水摸鱼和夸大其词。一时风光无限的陪跑者,小心翼翼地等待泡沫破裂的瞬间。
身为前基金经理的 Mostaque,其实对水温的变化非常敏锐,很早就嗅到了 AI 行业竞争的加剧,曾经警告员工:「2023 年你们都会死去。」
市场已经有太多的选择,一时的估值只是镜花水月。如何自力更生站稳脚跟,是 AI 公司们接下来的课题。
Inflection 去年 6 月才融了 13 亿美元,但接到微软的橄榄枝,高管和骨干说走就走,也是因为看不到未来。
接受彭博社采访时,Mustafa Suleyman 谈到,Pi 的每日用户数量已达到 100 万,然而还没有找到有效的商业模式。
Pi 虽然态度友好、招人喜欢,但面向消费者的纯聊天机器人撑不起那么高的估值,不如转头去做企业定制服务和被巨头委以重任。
虽然 Inflection 承诺,Pi 的服务「不会立即变化」,但也有人觉得,它的死亡不过早晚。同样,开发模型的大佬出走,用户们不免担心,尚在邀请测试的 Stable Diffusion 3,还能不能开源。
回应 Robin Rombach 的离职消息时,Stability 发言人感谢他的付出,祝福他有美好的未来,同时强调了公司的发展重心:将技术商业化。
说到 AI 的商业化,家家有本难念的经。今年 2 月,亚马逊云计算服务 CEO Andy Jassy 在和分析师的电话会议里谈到,生成式 AI 的收入「仍然相对较小」。
但他补充道,亚马逊的几乎所有消费者业务都已经或将拥有生成式 AI 产品,预计未来几年带来数百亿美元的收入。
微软不想被称为「OpenAI 的 IT 部门」让投资者不满,所以一边开发内部的 AI 项目,一边琵琶别抱,到处挖人,向 OpenAI 的竞争对手 Mistral AI 投资。
这一方面,OpenAI 也很有发言权,2015 年刚成立时是非营利组织,以最有可能造福全人类的方式开发 AGI,2019 年转变为有限利润(limited profit)公司,拉微软入伙投资,原因其实很简单:AI 实在太烧钱了。
OpenAI 去年的年化收入超过 16 亿美元,赚钱主要靠三板斧:会员订阅、对开发者的 API 接口调用收费、与微软产品的收入分成。
马斯克多次批评 OpenAI 的「堕落」,称其成了一家由微软控制的闭源、追求利润最大化的公司,Sam Altman 不痛不痒,表示想念以前的那个马斯克。
2024 年是生成式 AI 的第二年,热点从聊天机器人、文生图转变到文生视频、机器人具身智能。
参赛选手们的情绪也变得更加紧张,如果还没有脱离融资的供血,还没有找到商业化的落地场景,或许无需很久,就能看到很多所谓的明星公司倒闭。
3 月 23 日早上,Stability 突然公告,CEO Emad Mostaque 也不干了,辞去了首席执行官的职务以及公司董事会的职务,首席运营官和技术官临时接过担子。
Emad Mostaque 称,AI 的权力集中对所有人都没有好处,将为去中心化 AI 全力以赴。
HuggingFace 首席执行官也来围观,表示或许可以考虑买下 Stability,再把 Stable Diffusion 3 开源了。
AI 发展的初期,市场的乐观情绪高涨,会容忍贩卖梦想、粗糙的体验和对未来的想象。
但人工智能的价值必须在实践中体现出来,游说投资者的热情应当转化为消费者愿意买单的产品,技术的诗歌还是要写在互联网的大地而非虚空。
福布斯 2024 年 10 大 AI 预言之一是:Stability 将会倒闭。它或许说对了,问题是,接下来还会有多少 Stability。