本文来自微信公众号:AI前线 (ID:ai-front),作者:Tina,题图:由Stable Diffusion生成
Stability AI 是开源图像生成器 Stable Diffusion 背后的初创公司。最近有媒体报道称,该公司正在以惊人的速度烧钱,但却没有明确的盈利途径。此外,Stability AI 还面临来自一众初创企业和科技巨头的竞争。
目前,该公司现在正在寻找新的高管人才,希望他能在对手环伺的条件下帮助销售并给公司带来收入,以解决当前“疯狂烧钱、营收可怜”的窘况。
疯狂烧钱
Stability AI 成立于 2019 年,是生成式 AI 行业中最知名的公司之一。
与 ChatGPT、DALL-E 和 Midjourney 等项目不同,Stable Diffusion 是开源的,这意味着任何人都可以查看或下载代码,配置一张家用中高端显卡,就能在本地训练和部署 AI 模型。从开源角度来说,Stable Diffusion 更像是回到了 OpenAI 的初衷。
去年底,Stability AI 宣布融资 1.01 亿美元,并宣称 Stable Diffusion 已被全球超过 200000 名开发者下载和授权,成为当前可用性最高的开源模型。而据《福布斯》报道,每天有 1000 万人使用 Stable Diffusion——比使用 OpenAI 的 DALL-E 2 的人数还要多。同时,Stability AI 提供面向消费者的产品 DreamStudio, 该产品目前拥有来自 50 多个国家 / 地区的 100 万注册用户,总共创建了超过 1.7 亿张图像。
目前,Stability AI 还在探索商业模式,但公司实现的营收,完全覆盖不了巨额的服务器和人才招募的费用。
关于训练模型所需的计算资源和成本,Stability AI 的 CEO Emad Mostaque 曾在 Twitter 上回复一位用户时说:“我们实际上为此每个模型卡使用了 256 个 A100,总共 150000 小时,因此市场价格为 600000 美元。”
可对比 GPT-3 的单次训练成本的 460 万美元,总而言之,模型训练是一个相当烧钱的事情。据透漏,公司去年融到的 1 亿美元至今已经“烧”掉大半。另外,在上个月,Stability AI 还斥资收购了成像工具 Init ML。
而且在过去的几年里,为了形成自己的生态,Stability AI 一直在资助几个人工智能研究社区,社区人数从一千到五万不等。其中很多是来自不同领域的 3D 游戏开发人员、图形工程师或博士生,也有一些是业余爱好者。根据之前采访的说法,Stability AI 对他们提供经济支持和计算能力,“我们的首席执行官 Mostaque 与这些社群取得了联系,并为每个社区的两三名主要研究人员提供资金和计算能力。”
彭博社报道称 Stability AI 正在谋求新一轮融资,希望能将公司的估值翻 4 番至 40 亿美元。不过也有不具名 VC 表示,并不太认可这个估值,两位不愿透露姓名的风险投资者正在重新考虑是否参与新一轮的融资。
管理混乱
另外,部分 Stability AI 的雇员也对 Mostaque 的领导风格“失去信心”。Mostaque 今年 39 岁,此前主要的职业生涯是对冲基金分析师,虽然他有计算机科学的学位,但并没有科研经验,更不用说 AI 研究了。但 Mostaque 倾向于给 AI 研究人员非常大的自由度,例如在没有监管的情况下不限时地随意使用昂贵的云服务。
一位前雇员表示,Mostaque 有时也会突然介入接管一个项目。知情人士透露,伊马德将会继续担任 CEO,他倾向于引入一名专门帮助公司实现扭亏为盈的专家,类似于 Facebook 时期的首席运营官雪莉·桑德伯格。
另外,Stability AI 也有别于竞争对手,首先 OpenAI 背后有微软,Midjourney 选择与谷歌合作,面对微软和谷歌这样的“钞能力”玩家,Stability AI 并没有深不见底的金钱口袋,也没有金主承担训练模型的巨额费用。
更为关键的是,Stable Diffusion 并不是公司完全独立开发出来的商品。Stable Diffusion 结合了两种形式的人工智能,可将文本提示转换为图像,由众多合作者创建,合作者包括德国慕尼黑大学的研究人员以及一众商业公司。数年前,这些研究人员已经开始研究如何将自然语言描述绘制成图片,Stability AI 找到并资助他们搞 AI 开源大模型等其他研究。
据知情人士透露,对冲基金经理出身的 Mostaque 还自掏腰包,亲自资助了构建稳定扩散模型所需的昂贵计算能力,为公司购买 AWS 的算力提供价值 7500 万美元的担保。这些人说,当 AWS 的巨额账单到期时,Stability 在 10 月份刚刚结束其风险投资回合。
竞争加剧,但商业模式还不够清晰
虽然 Stable Diffusion 在去年 8 月发布后获得了不错的反响。但短短几个月后,差不多同期登场的 Midjourney 已经能击败 OpenAI 的 DALL-E,在文字生成图像的赛道上处于领跑位置。举例而言,近些日子非常火的“特朗普被捕照”就是作者使用这款产品生成的。
今年 2 月,据报道,作为 OpenAI 的竞争对手,这位 Stability AI 的首席执行官警告员工,随着竞争的加剧,他们“都将在 2023 年死去”。
为了应对竞争,Mostaque 招募了该领域的一些顶尖研究人员,包括 Andreas Blattmann、Dominik Lorenz 和 Robin Rombach。据悉,除了为 Stable Diffusion 开发升级服务外,也在开发自营大模型,以与 ChatGPT 竞争,不过该产品已被推迟,并不清楚何时能看到成品。
据曾在该公司工作的人士和了解该公司计划的投资者称,他还追求一种非正统的商业模式和公司结构。
为了获得营收,Mostaque 想出了两个思路,一个是向那些有意整合 AI 工具的公司提供咨询服务,另一个是通过向主权财富基金的所在国设立卫星办公室,换取他们的投资承诺。不过短期内看上去 Stability 似乎已经放弃了主权财富基金的战略。
写在最后
据了解 Mostaque 并与他共事过的人说,尽管他的领导方式混乱,但 Mostaque 深受大部分员工和人工智能行业人士的喜爱。也有很多人希望 Mostaque 能取得成功。
如果 Stability 现在不是一团糟,可能更会令人惊讶。毕竟许多新兴的科技公司都很混乱,Mostaque 也从未创立过科技公司,不是该行业的资深人士。他没有遵循任何熟悉的硅谷模板,但他的公司发展速度与任何热门初创公司一样快。
这并不是说 Stability 注定会失败,它具有知名度和看上去算是成功的产品。如果它能够度过这个成长阶段,还是极有可能变得更强大。而且作为开源 AI 模型,Stability AI 将从中受益。
有一种观点认为,开源人工智能模型是大公司和政府机构唯一可以真正信任的模型。开源将允许他们定制模型并在自己的计算机系统上运行,因此能有效管理潜在敏感数据。
正如 Mostaque 4 月 5 日发送的推文中所说:“算法和数据集的透明度,实际上开放的 AI(.com) 将对我们的发展至关重要。”“大型黑匣子系统并不适合社会关键系统等任务。”
参考链接:
https://www.semafor.com/article/04/07/2023/stability-ai-is-on-shaky-ground-as-it-burns-through-cash
https://www.businessinsider.com/stability-ai-ceo-employees-going-die-openai-google-meta-report-2023-2
https://innovationorigins.com/en/ai-software-from-stability-ai-is-genuinely-open-source-anyone-can-join-in-discussions/
https://www.prnewswire.com/news-releases/stability-ai-acquires-init-ml-makers-of-clipdrop-application-301764600.html
https://venturebeat.com/ai/stable-diffusion-creator-stability-ai-raises-101m-funding-to-accelerate-open-source-ai/
本文来自微信公众号:AI前线 (ID:ai-front),作者:Tina