界面新闻记者 | 李彪
界面新闻编辑 |
【资料图】
“我曾经说过,国产大模型与ChatGPT之间的差距是两年,现在我想收回这句话。”这是360创始人周鸿祎针对当下备受关注的“百模大战”发表的最新言论。他认为国产大模型在许多方面已经赶上GPT3.5,追赶GPT4的速度也远超想象。
6月13日,三六零(601360.SH,以下简称“360”)发布“360智脑”大模型应用并开放公众申请测试。个人用户可登陆360智脑官网申请内测。当日其股价收盘报15.38元,上涨5.49%。
从首次披露正在研发类ChatGPT技术的demo版产品算起,历时长达四个月的多轮预热后,360终于正式加入“百模大战”。
据周鸿祎介绍,“360智脑”是360自研的千亿级参数通用语言大模型,具有10项核心基础能力,分别是:生成与创作、多轮对话、代码能力、逻辑与推理、知识问答、阅读理解、文本分类、翻译、文本改写、多模态。据悉,上述全部为信通院““可信AIGC大语言模型基础能力”评估的必选项目,360也是国内首家通过的公司。
在国内各大厂商纷纷“卷”大模型的参数规模、追求通用智能泛化的潮流中,周鸿祎判断大模型的未来一定是场景化、垂直化、专业化,专有化。
“中国已经进入‘百模大战’,基础能力各家都差不多。特别是互联网公司,比如百度、腾讯、头条、阿里、360都有自身固有的场景,真正比拼的还是应用落地的能力。”他表示。据悉,360旗下全端产品已经接入“360智脑”,包括360安全卫士、360安全浏览器、360搜索。
在这次大模型的首秀中,周鸿祎重点介绍了多模态能力与数字人应用。
360通过录屏形式展现了大模型在输入输出上的多模态能力,包括文生图、图生文、视频生文、文生视频。工作人员可以通过输入文字来要求大模型作画,还可以输入一张图片、一段视频来要求大模型用文字讲解图和视频中的内容。
周鸿祎认为,ChatGPT聊天机器人为同行指明了大模型发展路径的同时,也引导各家在文字输入输出表现上的较量,主要通过微调来实现。而下一步竞争的焦点在于多模态。目前GPT-4已经展现了这方面的部分能力,未来的GPT-5会全面支持多模态。
360此次推出的数字人广场的平台,内含有200多个角色,主要有两大类,一类是数字名人,一类是数字员工。
该数字人被360定义为在“360智脑”大模型的通用智能基础之上、融合多模态能力的产物——传统的2D或3D数字人主要通过动作捕捉、智能合成,再加上渲染生成虚拟人形象,但却不具备生成内容的能力。例如数字人主播只能按给定脚本“念稿”,而基于大模型的数字人模仿人的思维有人设、能对话、能互动,今后还会加入记忆功能,未来会是“有灵魂”的数字人。
周鸿祎将数字人视作大模型未来落地的一大关键应用场景,“未来人工智能的发展不仅仅只有大模型核心能力的增加,各种外部功能的包装、产品的定义会让人工智能跟我们每个人的工作、生活贴得更近,会让每个人更自如地使用人工智能。”