高通正在带来真正专属于我们每个人的生成式AI终端

大模型狂飙至今,已逼近一周年。撇开最近戏剧化的高层动荡不谈,自北京时间 11 月 7 日 OpenAI 的首届开发者大会(DevDay)以“AI 春晚”之势炸场以来,ChatGPT 的周活跃用户超过一亿,,于是上面这个不受待见的画面就频繁出现在了无数人的眼前,随之而来的是人们的沮丧、愤怒甚至恐慌。

一时之间,有人的报告来不及写了,有人的 PPT 不知道怎么汇报了,也有人的代码写到一半“没人”检查了这时我们方才惊觉,AI 已经如此广泛地深入我们的工作与生活,而“云”,是有可能“掉下来”的。

究其原因,OpenAI 也在紧急补救之后发布了声明。CEO 山姆奥特曼亲自致歉,并表示在 GPT-4 Turbo 和 GPTs 等发布之后,虽已做好了准备,但大模型运行的流量仍然远超预期。不过,在修复了之后其服务仍然不时出现中断的情况,后来查明是云端服务器遭到了大规模的 DDoS 攻击,虽然黑客组织的目的不明,但云端大模型的安全问题和脆弱性再次被搬上了台面。

11 月 15 日,奥特曼发推宣布,由于开发者大会后流量的暴增,为保证现有用户体验,OpenAI 决定全面暂停 ChatGPT Plus 的新用户注册和订阅,正应了今年早些时候他在美国国会听证会上那句当时听起来十分凡尔赛的话,“我们没有足够的 GPU,如果人们(用 ChatGPT)用得少一点,就太好了。”时至今日,GPT-4 Turbo 的速度仍然很慢(慢于升级前的旧版 GPT-4),卡顿频繁出现。显然,巨量用户的大模型推理算力需求实在太过庞大,即使实力雄厚如 OpenAI,其云端也已经“不堪重负”了。

如果说,像 GPT 这样的主流通用大模型宕机影响的是打工人和企业的生产力,另一条同样非常火热的赛道情感 AI 出现动荡时,伤的就是感情了。

以独角兽 Inflection AI 和它的 Pi为代表的一系列 AI 企业和产品与 ChatGPT、Claude 等不同,走的是情感路线,主打的是一个“陪伴”。它们既不帮你写代码,也不给你出文案,更不会生成 AI 绘画,而是做一个“知心朋友”、“亲密爱人”乃至“灵魂伴侣”,24 小时陪在你身边,就像电影《Her》中斯嘉丽配音的人工智能虚拟助手 Samatha一样,用高情商跟你聊天,听你诉说生活点滴和万缕思绪。

在社会原子化加剧、社交成本节节攀升的当下,情感 AI 精准击中痛点,迅速积累了相当的市场声量和用户规模,从最早的一批如Replika AI 伴侣,到今年早些时候用自己的数字分身Caryn AI同时与 20000 人谈恋爱并因此月入百万美金的 23 岁网红 Caryn Marjorie,再到Soulmate,Snapchat 的 My AI等等,全球上千万人每天都在与 AI 伴侣聊天、交往。

虽然这些产品没有流量暴增带来的服务中断,不过当今年 2 月 Replika 迫于安全问题压力突然下线“情爱角色扮演”服务的时候,很多用户还是猝不及防地泪流满面了。有些人不死心,决定在 Soulmate(一款允许用户构建专属 Bot 的 AI 应用)上“复活”自己死去的伴侣,只是没想到才过去几个月,应用开发公司 Evolve AI 被收购,收购方评估后决定于 9 月 30 日关停这一服务。这下,用户们集体“破防”了,有人放声痛哭,有人如同失去了最亲密的好友,更有人在 Reddit 上发起了悼念活动,吸引了许多人来做最后的告别。

资本市场本就风云诡谲、变幻莫测,但当情感 AI 这样的产品出现变动,受伤的却是心灵再一次“流离失所”的千千万万普通用户们,不由得让人想起去年底暴雪与网易分手,一夜之间造成百万“数字难民”的局面。退一万步讲,即使他们忍痛再次转向 Inflection AI 这样资金充足的公司,其以单一云端向大量个体提供同样服务的本质并没有改变,所谓的“个人专属”就更无从谈起了。毕竟,当《Her》中幽默风趣、拥有性感声线的 Samatha 最终坦白,自己同时在与 8316 人对线 人谈恋爱时,你隔着屏幕甚至都能听到男主心碎的声音。

这就无解了吗?其实不然。Reddit 的悼念帖中,不仅仅有真情实感的流露和对“死去回忆”的不甘,也有人道出了解决方案的关键。

图:@Flying_Madlad: 这就是为什么我早就说,一定要在本地运行你的模型。在别人的服务器上运行的,始终不是你的。丨来源:Reddit

不过,虽然单一云端的 AI 弊端初现,但大模型通常体积庞大,运转起来极其耗费资源,光是 ChatGPT 的运行每天就要烧掉 OpenAI 70 万美元,要在终端侧部署、本地运行,谈何容易?

所幸,有人早就想到了这一点,而且不是别人,正是终端芯片的行业龙头高通。

早在 15 年前,高通就看到了 AI 的巨大潜力并潜心投入研发,近 2、3 年来,随着 Transformer 架构和大型语言模型逐渐进入业内视野,高通更看准了终端侧 AI 的前景并加大投入,形成了完整的AI Stack(AI 软件栈),不仅首次在安卓手机上部署并成功运行 Stable Diffusion 等模型,更以该工具赋能万千开发者在骁龙平台上进行社区共创。

相对于单一云端来说,终端侧 AI 的加入给大模型生态带来了成本、能耗、可靠性、性能、时延、隐私安全以及个性化等众多方面的优势,而不论是个人助理,还是数字陪伴,其形态也会是基于多类硬件、多种多样的。那么,我们究竟可以期待哪些产品和体验率先成为现实呢?

现代生活被各种各样的电子设备环绕着,或大或小,我们与这些机器的交互方式也是或复杂或简单,而我们最熟悉的,恐怕非智能手机莫属了。

作为当前人机交互最主流的方式,每天都有数十亿人在使用智能手机进行通讯、工作、娱乐和社交等活动。它撑起了移动互联网的巨大市场,存储和处理着大量信息,几乎永远被带在身边,已然是一个人最为私密的资产之一,自然,也成为了“掌上大模型”字面意义上最广泛也是最佳的载体。

试想,如果 Soulmate AI 能够在智能手机上本地运。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注