开年抢跑AI赛道,Sora“截胡”字节
撰文/ 黎炫岐
编辑/ 黎文婕
排版/ Annalee
来源/ 锌刻度
最近,国内的大公司在AI赛道上被Sora抢占了风头。
在2024年2月初,此前在大模型领域保持低调的字节跳动终于有了新动作,上线了“Coze扣子”AI Bot开发平台,据Coze官方介绍,Coze可以让用户快速创建各种由AI提供支持的问答Bot,且可以将Bot发布到各种应用程序,从而促进与这些应用程序上的用户的动态交互。
简单来说,Coze的特点是,可以让用户创建个人定制版Bot,实现“0代码”开发。
这倒也并非创新之举。早在2023年末,OpenAI发布的GPTs也是旨在“每个人都可以定制自己的ChatGPT,从而让GPT成为一个家族。”但对于字节跳动而言,这多少算个大动作,毕竟此前它在大模型领域沉寂已久。
不过,还未等Coze掀起太大的水花,OpenAI发布的Sora直接“王炸”,抢走风头,引发热议。
定制Chatbot,从求职到小红书文案
“Coze是一个一站式AI机器人开发平台。”
据Coze官网,为了促进和简化AI机器人的开发过程,Coze目前集成了60多个插件,增强了Bot在信息检索、旅行协助、生产力、图像理解等领域的功能,“你可以直接将这些插件添加到Bot中,丰富Bot能力。例如使用新闻插件,打造一个可以播报最新时事新闻的AI新闻播音员。”用户也可以通过指定现有API的输入和输出来快速创建自定义插件。
此外,Coze支持为Bot创建定时任务。Coze官网介绍称,用户无需编写任何复杂的代码,只需一个简单的描述,Bot就可以按需完成工作。例如,可以配置为:每天早上 9:00 向您发送个性化新闻。提醒您每天早上7:00查看今天的天气预报和日程。
锌刻度体验Coze时发现,目前Coze的Bot商店内已有各种场景的预置Bot,其中包括女生头像生成器、小红书文案输出大师、求职助手等,而根据官网介绍,选择预生成Bot后,用户会被引导到该Bot的配置页面。在这里,你可以查看这个Bot的配置信息,与这个Bot进行交互,体验它提供的能力。
经体验,锌刻度留意到,目前的预置Bot多搭载云雀大模型。其中,“求职助手”可以提供求职建议、推荐工作机会。
Coze Bot商店内的“求职助手”界面
而部分Bot或许还有一定完善和提升空间。比如,在体验“小红书文案输出大师”时,锌刻度分别提出“帮我列出送妈妈的礼物清单”和“帮我列出送奶奶的礼物清单”的需求,但得到的回答基本相同。这一问题在“春联大王”这一Bot也出现,据钛媒体,要求bot帮助写一个关于雪的春联,经过两次追加不一样的提示词(Prompt),最后生成的两副春联竟是一模一样的,并未如预期出现不同的回答。
值得一提的是,除了可以体验这些预置Bot,用户也可复制一个预置的Bot,并根据你的具体需求对其进行修改。
至于Coze背后的开发团队,据界面新闻报道,Coze由2023年11月字节跳动成立的AI创新业务部门Flow研发而成的,该部门业务主要聚焦于AI应用层,由字节跳动技术副总裁洪定坤担任技术负责人,原今日头条CEO朱文佳担任字节大模型团队业务负责人。
不过,Coze官网链接的企业为“北京春田知韵科技有限公司”,天眼查显示,该公司成立于2023年7月,由北京抖音信息服务有限公司100%持股。
字节猛追进度
在发布Coze之前,字节跳动在AI赛道上一度“掉队”。
在字节跳动2024年全员会上,字节跳动CEO梁汝波表示,字节跳动存在低效和迟钝现象,并直言,“字节对于大模型领域的反应过于迟钝,直到2023年中才出现跟GPT相关的讨论,而GPT-1在2018年就发布了,且业内做得比较好的大模型创业公司也基本在2018-2021年间创立。”
回顾此前,直到去年8月,字节跳动基于云雀大模型开发的AI聊天机器人“豆包”才开始公测,面向C端市场发力AI应用。与此同时,还在国外发布了基于CPT模型训练的Cici,后者目前已经在超过30个国家和地区上线。
字节跳动“豆包”
与此同时,国内大公司纷纷在这个赛道发力:从2023年的3月到9月,从百度的大语言模型“文心一言”、360的智脑大模型,到阿里巴巴的“通义千问”大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,国内传统的三大互联网巨头“BAT”悉数下场。
手机厂商也未缺席,华为、小米、OPPO、vivo、荣耀都先后在赛道亮相;五科研院所和初创企业不甘示弱,北京智源人工智能研究院发布了“悟道”大模型,上海人工智能实验室推出了“书生”大模型,鹏城实验室研发了“鹏城·脑海”大模型;京东、携程、好未来等也相继召开发布会;甚至连移动、联通、电信三大运营商,长虹等家电生产企业也欲分一杯羹……
更不用提诸多风云人物对此的讨论不断。其中,据财经网,华为创始人任正非3月中旬参加华为 “难题揭榜火花奖” 颁奖座谈会时称,华为会做底层算力平台:“未来AI大模型会风起云涌,不只微软一家。ChatGPT把计算、管道流量撑大,华为的产品就有了机会。”同月月底,腾讯总裁刘炽平在财报电话会上说,生成式人工智能可成为腾讯已有业务,如社交、游戏的 “倍增器”,也可帮助开拓数字助手、搜索等新增长线。此外,《张朝阳的物理课》直播结束后会自动生成字幕:“‘社交互动’‘算法推荐以及AIGC’‘自媒体’,是这些年来互联网的三个线索。”
数据则更为直观,据“趣解商业”,2023年5月的中关村论坛上,专家口中中国“10亿级参数规模以上”大模型的发布数量尚为79个;而《2023中国新一代人工智能科技产业发展报告》显示,截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省市/地区,国内大模型总数达238个;而据GitHub的统计数据,到2023年底国内已经发布的大语言模型接近300个。
所以,当“百模大战”如火如荼时,在2024年初发布Coze的字节跳动,与其说是抢跑,可能更精确的说法是“奋起直追”。
OpenAI抢占风头,字节又该如何应对?
字节跳动或许本想着在2024年初抢先崭露头角,却不料OpenAI再放“狠招”,直接“王炸”,抢占了风头。就在Coze上线后不久,Sora横空出世。
2月16日,OpenAI推出了一款能根据文字指令即时生成短视频的模型,命名为Sora。据介绍,Sora能够从文本说明中生成长达60秒的视频,并能够提供具有多个角色,特定类型的动作和详细的背景细节的场景。Sora还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。此外,Sora可以一次性生成整个视频,也可以扩展生成的视频,使其
Sora技术报告
这意味着,OpenAI已然在人工智能赛道上迈入下半场,国内外大模型的差距更明显了。当OpenAI官方公布长达60秒未经修改的AI视频,国内也有AI团队紧急上线相关“文字生成视频”大模型,但与国外主流AI视频模型能力相仿,均暂时无法超越Sora的水平。
不过,当OpenAI已经开始深耕文生视频的大模型,字节跳动却似乎如梦初醒,刚刚开始追赶对话问答大模型的进度。
日前虽有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型——Boximator。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。但对此,字节跳动相关人士回应新浪科技称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。
事实上,字节跳动的Coze也多少有些亦步亦趋,早在Coze发布之前,其实在2023年11月的OpenAI首届开发者大会上,GPTs就已经发布,而根据当时的介绍,GPTs无需编程技巧,可以让用户用自己的自然语言来创建“个人版ChatGPT”,实现全程“0代码”开发。
用OpenAI CEO奥尔特曼的话说,每个人都可以定制自己的ChatGPT,从而让GPT成为一个家族。那时候,外界讨论,GPTs搭配GPT Store,很可能会在AI应用生态中诞生下一个苹果。
彼时,华西证券研报曾评价,类比App Store,GPT Store将成为OpenAI生态重要一环。
按照研报的说法,对初创公司来说,GPTs本身就是一个值得挖掘的AI应用项目;而对于现有的互联网应用来说,GPT Store是一个优质的流量入口,GPTs要实现复杂功能普遍需调用外部API,若现有App能充分利用GPTs的高智能、高灵活性,并与自身应用进行结合,有望为现有互联网生态注入新鲜血液,“AI+一切”已近在咫尺。
显然,Coze的设定与此相同。
只不过,当字节跳动这次试图紧跟OpenAI脚步时,还是稍有差距。可以预想的是,国内或许很快也将掀起文生视频大模型的新浪潮,而字节跳动又该如何应对呢?