大模型带来的 Web 复兴,会是昙花一现吗?
大家是不是对 GPT、对话式 AI、生成式 AI 之类的话题,已经有点审美疲劳了?
写这篇文章之前,我有点犹豫,究竟还要不要接着讨论 GPT 了。最终决定写,是觉得个人用户、开发者,以及正在紧锣密鼓训大模型的 AI 公司和云厂商,还是有必要提前琢磨一下这个事情——大模型能力要从云入端,究竟什么时候做、怎么做?
AIGC 热潮带来 Web 复兴
(资料图)
但大众更爱移动端
我们看到,大多数基于大模型的 AIGC 应用,都选择了 Web 端接入。
微软第一时间推出了带有对话(Chat)功能的必应(Bing),更新了 Edge 浏览器,嵌入到 Microsoft 365 应用中。国内,高校机构推出的 MOSS(复旦大学)、SegGPT(智源),企业推出的文心一言(yiyan.baidu.com)、通义千问(tongyi.aliyun.com),都要从官网入口访问。
图像和视频类的生成式 AI,比如 Midjourney、Stable Diffusion、DALLE2,以及视频平台 Make-A-Video(Meta)、Imagen Video(谷歌)等,也是如此。
有业内人士认为,生成式 AI 带来了 Web 的复兴。
当然 , 市面上也有通过小程序、App 等访问的 AIGC 产品,大多通过调用基础模型的 API 来提供服务。
但受限于网络传输、算力等,领先的技术能力都不得不打折扣,比如只能生成很短的一句话文本,手机 app 的作图效果一般,加载速度很慢经常排队掉线卡顿……
这是因为大模型的大量计算,还是要通过云服务来完成,Web 页面的承载能力比较大,加载速度快,还不用考虑流量损耗。
所以,想体验大模型强大的能力,目前还是以 PC Web 端 + 云服务更佳。
但是,大模型的商业化潜力,还是在移动端。
大家可能都记得,去年底 AI 作图就火爆过,意间 AI 绘画、YUAN 初等多款具有 AI 作图功能的移动端小程序,用户量和付费激增。意间 AI 绘画的官方数据显示,上线不到两个月,用户量增长了 117 万人。大部分人也都更希望,便捷、低门槛地体验 AIGC。要使用 GPT-4、New bing、DALLE 等应用,注册、登录、付费的一系列操作,都非常麻烦,劝退了不少人。
国内的大模型应用,移动端也明显很受期待。比如就有人抓住了 " 官方没有 app" 这个 " 时间差 ",造出了 " 文心一言 " 盗版 App,吓得百度赶紧出来声明:凡是在 App Store 和各种应用商店看到的 " 文心一言 "App 都是假的,凡是 " 文心一言 " 收费下载、付费会员都是骗子!
显而易见,场景化、轻量化的移动端应用,用户又喜欢,又能付费赚到钱,如果官方不搞,投机客 / 骗子都要来搞。
无论是从用户体验的角度,还是大模型服务普及化的需要,以及回收训练成本的商业化考量,移动端应用都是一块不能轻言放弃的阵地。
既然如此,为什么各大基础模型服务商,就是不早点抓住这个机会呢?我们什么时候才能用上和 Web 版一样强大的移动 AI 应用呢?
千呼万唤不出来
基础模型服务商在想啥?
基础大模型的服务商,比如 OpenAI、谷歌、百度、阿里以及各类研究院所,就是不去吃移动端应用这块蛋糕。
除了大家都知道的移动端侧计算能力限制之外,还有其他考量:
1. 产品。基础模型往往技术和能力比较超前,产品化不是最优先考虑的,尤其移动端应用要适配各种系统、机型、配置,更不可能投入太大的人力、物力。
OpenAI 的联合创始人 Sam Altman 就说过,ChatGPT 是一个糟糕的产品,只是这个产品蕴含着很大价值,所以人们愿意忍受。觉得 Web 不好用?那你先忍忍吧。
2. 用户。别看全民热议生成式 AI,但真正坚持使用并愿意付费的,还是一小撮早期客户,包括技术狂热者和专业人士,比如程序员、插画师。
他们大多会将生成式 AI 当作生产力工具,用于研究、编程、办公、设计、游戏制作、软件开发等,还要跟其他专业软件相结合来使用,比如生成图片之后再通过 Photoshop 增强,还是要用到 PC、一体机等设备,PC Web 端比移动 App 有更强的可编辑性,更能满足这部分群体的需求。
3. 商业化。目前基础大模型的商业模式,以 API 为主,需要一定的开发经验,更适合极客和开发者,深度开发集成部署等工作,很少会通过移动端来完成,所以模型服务商自然也就没有紧锣密鼓去适配移动端的动力。
大模型千帆竞渡移动端是商业化必争之地
既然如此,为什么还要做移动端呢?一个很表层的答案是:大众需要。
能够真正引发全民体验热潮的,还是那些能够通过社交软件分享、小程序、App 等形式,低成本快速触达的能力,不需要什么 " 智能涌现 ",更在乎有趣、好玩。
往深了说,大模型技术被视为 " 新工业革命 " 的引擎,要发挥效应,必须将技术能力更好地集成到产品和服务中去。此时,移动端能够提供至少三重价值:
第一,规模落地。
中国互联网络信息中心发布第 51 次《中国互联网络发展状况统计报告》中,我国 10.67 亿网民,使用手机上网的比例为 99.8%,移动端用户已经远远超过了 PC 端的用户,要提升生成式 AI 的应用范围,移动端应用必不可少。
第二,商业潜力。
高科技行业的主流市场,是由 " 实用主义者 " 组成的,相比技术的前沿性、炫酷感,他们更看重技术解决方案的可靠、稳定、性价比、配套服务等。移动端的广泛普及度、即时访问、便捷低成本的优势,可以让 AI 以更短的路径触达用户,在移动端应用 AI 技术是大势所趋。
开发者眼中的 AIGC 应用是这样的:
(OpenAI 发布会演示的编程能力)大众眼中的 AIGC 应用是这样的:
(某 GPT 类应用平台截图)第三,市场壁垒。
大模型的商业化路径之一,是走向产业,走向 ToB,将大模型能力封装为 AI 解决方案,参与到千行百业的数字化、智能化进程中。
如今头部科技公司、云厂商都在炼大模型,很多直接对标 GPT-3.5,没有显著的差异化价值,很难与业界领先水平拉开差距。
云厂商要打开 ToB 市场,移动端应用工具与能力是非常有吸引力的。近年来,不仅消费类、服务型企业,在不断加强移动端侧的布局和产品能力,一些传统的企业和机构,比如工业制造、政务银行等,无论是在内部生产管理中移动化,也推出了更多移动应用来更好地服务终端用户。如果直接在云上端到端用好大模型,比如训练开发环节直接调用云端的大模型和 AI 算力资源,完成后,一键分发到智能手机等终端上,可以大大减少工作量。
(某 GPT 类应用开发平台)互联网的演进之路,已经说明,无论 To B 还是 To C 行业,都在追求越来越集约精简的终端硬件、越来越低门槛的交互入口、越来越轻盈的软件应用。
所以说,大模型从云入端,是模型服务商实现商业化的必争之地。
从云入端,一条天路
高瞻远瞩如 OpenAI 和 DeepMind,照样有商业化的要求。赚钱嘛,不寒掺。可是,大模型由云入端,这个钱还真没那么好赚。非不为也,实不能也。
云计算、AI 能力要进入移动终端设备,所面对的是一条天路:
首先,一些大型的生成式 AI 应用,运行环境在云上,要经过网络传输,而移动端的设备能力、网络环境,是很多样且不稳定的,比如从 5G 蜂窝网络转移到室内宽带,或者在高架桥、地铁等特殊环境,都有可能让生成过程中断或失败,影响到端侧体验。
其次,生成式 AI 应用的计算量比较大,在端侧加载渲染运行时,比如智能手机 CPU 会有比较高的负载,出现卡顿、发热、电量损耗等情况,如果让 AI 改一篇文档画一张图就咔咔掉电,当然不能接受。
此外,把 AI 深度集成到业务中,必须通过云计算,而云端开发环境和端侧是不同的操作系统。这意味着,开发者要进行二次开发或迭代开发,完成之后才能进行不同终端下的触达,同事要考虑不同终端的兼容性,这就提升了 AI 云应用的风险成本、人力成本、时间成本。要保证集成之后的应用效果,需要云平台有一整套完整的产品服务和工具来支撑快速搭建、验证、部署分发。另外,云侧和端侧的架构不同,也导致算力割裂,云端一体的 AI 应用开发要充分结合端侧算力和云上算力,一部分应用场景搭建在端,一部分搭建在云,这就给云厂商带来了比较大的技术难题:如何提供稳定一致的底层环境?
天路难行亦需行。大家都知道,云计算靠基础设施 IaaS 层是很难赚到钱的,云厂商炼大模型,本质上是希望提升软件的先进性,进而调动 SaaS 服务的商业价值。
要让个人用户和企业,都得到简单、易用、低门槛的大模型能力,云厂商不仅要训练基础模型,还需要在产业链上游,就解决 AI 应用从云到端的一系列技术难题,为开发者和产业用户提供移动 AI 开发能力,才能让大模型在端侧爆发。
各种形态的大模型应用百花齐放,这个新技术才能真正迎来商业化的奇点。