当前所在位置: 首页 > 生活常识

自主性包括哪些要求和要求 自主性的含义是什么

2023-08-08 14:57 · 生活常识 · 禾若彤 · 【 字体:

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

要说AutoGPT为啥会迅速蹿红?

还不是把人类对AI的想象力再次打开了。

使唤AI不用再一句句引导,更不用去研究提示工程了。

人人像钢铁侠那样拥有超级AI贾维斯不是梦。

自主性包括哪些要求和要求 自主性的含义是什么(图1)

而就在现在,这种Auto AI Copilot已经有人批量生产了。

大概画风be like:

如果你正在浏览旅行APP打算订酒店,点一下AI助手,它就会根据自己掌握的信息贴心发出询问:

我记得你说打算去新加坡旅游来着,有什么需要我帮忙的吗?

自主性包括哪些要求和要求 自主性的含义是什么(图2)

然后对着手机说出自己的情况和需求,它立马找出了13个方案,并且给出自己最推荐的选择。

不仅如此,它还会查询当地天气提醒你要准备什么衣服,并能根据天气情况来规划路线。整个过程,完全就是和真人助理对话的感觉啊。

除了旅行APP,如购物、家装等各类软件里都能内置这样一个AI。而且官方还透露说,底层平台将会在近期开源

这就让人好奇了,到底这些AI从哪里来?

生产有记忆会自学习的AI Copilot

如上看到的AI Copilot来自名为MindOS的AGI应用助手平台。

它主打的功能就是为各类软件打造一个超级AI,不光能回答人类用户提出的问题,还拥有记忆自主学习能力,同时也能有个性

比如当你打开家装软件准备再买点装饰,但其实没想好具体买什么时,AI Copilot就能根据它对你的了解,给出推荐的物品。

自主性包括哪些要求和要求 自主性的含义是什么(图3)自主性包括哪些要求和要求 自主性的含义是什么(图4)

除了推荐好物,AI Copilot还能基于人类的问题揣测意图。

比如让它查询下买的桌子椅子发货了没有,AI先是回答了物流的进度,然后感觉到人类可能希望桌椅能一起送过来,就马上提出了自己的猜测。

人类:我的订单到哪了?

AI Copilot:嗨,你的订单已经由DHL快递发出了,预计在今天下午7点送到。

人类:椅子和桌子是配套一起送过来的吗?

AI Copilt:它们是分开卖的。你有4把椅子会在今天送到。你是想今天也收到桌子,这样周六就能有一整套了是吗?

人类:是的,我能取消订单然后重新下单一整套吗?

而且它还会智能地根据情况给出推荐的解决办法。

比如告诉人类,已经发货的椅子没法取消订单了。与其现在把椅子退货再重新下单一整套桌椅,倒不如直接再买张桌子补齐吧。

自主性包括哪些要求和要求 自主性的含义是什么(图5)

据了解,MindOS平台现在支持包括中英文在内的30种语言,提供超过1000个带有性格、功能的预置AI角色,准确推断意图的准确率达到97%

而定制这些AI Copilot,其实并不难,不用懂算法和编程,也不用给数据打标,几分钟就能搞定。

平台上有多种类型的AI助手可以选择,包括购物、金融、网站引导等。

自主性包括哪些要求和要求 自主性的含义是什么(图6)

选好类型后,就能开始个性化定制了。

平台支持接入API、数据和文档等,并为AI助手提供了一些技能,可以按需选取使用。

自主性包括哪些要求和要求 自主性的含义是什么(图7)

然后只用自然语言描述,就能完成对AI助手的初始设定。

可以控制的内容包括AI的形象、自我介绍、对话风格、要完成哪些任务、不能做哪些事等。

整个过程就和招来一个新员工一样,告诉它工作守则即可。

自主性包括哪些要求和要求 自主性的含义是什么(图8)

设置完成后,将平台生成的代码插入到网站或软件中,即完成AI Copilot的接入。

据了解,MindOS其背后原理是以大模型作为底层基础,在此之上背后开发团队搭建了一套模仿人脑宏观架构的自研框架UMM(Unifined Mind Model),为AI加入复杂思考、记忆、服务和更强的自主学习能力,让大模型内容更可控、能力更自主、部署更灵活、整合更深度

其中,大模型就好比通用计算平台,类似于人类大脑的前额叶,具备很强的理解能力和逻辑推理能力。但人想要在现实世界中完成各种任务,一定还需要视觉、执行、动机、记忆等区域的配合。

因此,UMM框架就是给大模型接入了这些能力,比如可以感知和处理多模态信息、记住专业知识、历史信息和数据、自主学习等。以此让AI可以完成一个长链条任务,和AutoGPT非常相似。

而且相对于AutoGPT,MindOS背后框架的自主性更高。

举例来说,AutoGPT是在给定公开的技能下(如搜索),自主规划出合适的执行计划。

而MindOS中的AI,会在发现自己技能不够用时,主动去互联网上搜索新技能,自主测试、连接,并利用新学会的技能进一步完成复杂任务。

比如当用户提问“我想知道公司有哪些西雅图的客户?”

MindOS的AI发现自己现有能力没法解决这一问题,于是它就在公司网络中找到了一个CRM接口(客户信息系统),然后在用户允许下自主学会如何使用,最后给出了公司的西雅图头部客户和每个客户的具体介绍。

自主性包括哪些要求和要求 自主性的含义是什么(图9)

去年11月初,MindOS发布1.0版本,比ChatGPT还早了几周。

在经过几个月迭代后,在最近推出2.0版本,并将开放一轮封测,届时可以抢先体验。

而且幕后团队透露,其底层框架UMM也会在后续开源

这绝对算得上是一个重磅消息了,毕竟当下ChatGPT、AutoGPT热度够高,但是在使用和自主可控性上都还存在一些让人有顾虑的方面。一个真正可商用的、成熟的AI框架,加上完整的配置平台,相信有很多人会跃跃欲试。

这不免让人更加好奇,MindOS的背后开发团队到底是何人?

前脸书高级研究科学家带队打造

MindOS来自心识宇宙,在2022年1月创立,定位是一家AGI公司

公司团队成员来自Meta、Google、TikTok、Alibaba等,创立至今已获得红杉中国种子基金、线性资本、银杏谷资本等顶级基金投资。

创始人兼CEO陶芳波,是数据挖掘和AI领域的熟悉面孔了。

他本科毕业于清华大学,后赴伊利诺伊大学香槟分校获得计算机科学博士学位,师从数据挖掘领域鼻祖韩家炜教授。

陶芳波博士先后在美国微软研究院、Facebook Research、NASA等从事研发工作,并是阿里达摩院神经符号实验室的创建人。其研发成果已应用到NASA、波音公司等;搭建的Facebook大规模内容理解平台,日均服务超过2亿用户。

他还担任了EMNLP、CIKM、ACL、SIGMOD、WWW等领域顶会的评审专家。

自主性包括哪些要求和要求 自主性的含义是什么(图10)

心识宇宙的创立契机,主要有两方面。

一方面是底层技术的驱动,另一方面是需求真实存在。

其中,从技术维度出发的思考和准备,要从3年前说起。

2020年GPT-3震撼发布,让陶芳波看到了LLM的无限潜力。

这是第一个模型,可以一个模型完成很多复杂任务,承载了人类几乎所有知识。

当时,业内对AGI的讨论已经不绝于耳,陶芳波同样认同AGI会给未来世界带来变革。

怎么通往这里?大模型这条路已经逐渐清晰了起来。几年前,当时还在研究实验室的团队就已经开始搭建一种AGI框架的雏形了。

他们提出的技术理解是:大模型是一种全新的计算革命,提供了一种新的通用算力资源,即可以通过自然语言来调取的数字脑力资源

相比于提供“连接能力”的传统算力,现在这种算力可以直接提供“理解和推理”能力。

但问题是,目前这种算力依然是无差别的,和场景、个人需求没有深度整合(Grounding)。而这种整合需要非常复杂的场景理解、个人需求理解。

因此,需要在大模型之上构建一个有价值的调度框架,类似于新时代的操作系统,让这种算力不仅有理解能力,还和场景深度整合,可以在目标的驱动下独立成长和自我构建。

自主性包括哪些要求和要求 自主性的含义是什么(图11)

而技术创新,还只是底层的支撑。更上一步,需要行业中有真实存在的需求。

实际上,近几年不少软件和应用都倾向于为自己构建一个AI助手。一般是一些低频刚需APP,如银行、政府类;以及一些信息整合、用户决策路径长的APP,如电商、旅游类。

对于低频刚需类APP,因为打开频率低,用户对操作界面的熟悉程度不高。一旦有需求时,往往要先花费一段时间来摸索功能界面,有时甚至还得去网上搜教程,确实比较繁琐。

因此,APP会倾向于加一个AI助手,让用户通过自然语言交互,就像是问引导员一样,快速完成操作。

而对于决策路径比较长的APP,一般有两种情况。

用户还不知道自己明确需要什么

比如下周要去参加婚礼了,该准备什么样的礼物?很多人在打开购物软件时是没有想法的,这就需要自己来搜索找灵感,到最终确定商品下单,会是一个比较长的过程。

第二种情况,是用户需要进行复杂的货比三家,最后才能完成消费

比如大到汽车、房产,小到球鞋、护肤,购买时不同人会优先比对不同的规格参数;或者是订酒店,也要事先了解好多家的价格、环境、位置等信息。这类决策过程也都会比较复杂。

那么,如果有AI能够快速整合对比信息,或者给出明确的推荐,这会提升用户的体验感,也能提升平台商家的转化率。

由此也就不难理解,为什么心识宇宙联合创始人兼COO林宋琪在创业初期就反复表达:

所有分发都可以⽤AI再做⼀遍,所有UI都可以⽤⾃然语⾔再做⼀遍,所有软件(Application)都值得⽤虚拟⻆⾊再做⼀遍。

不可否认,软件AI化在最初也受到了不少来自市场的质疑。但随着OpenAI和微软的一系列组合拳,这一趋势开始逐渐被大家看到并相信。

ChatGPT引爆趋势后,微软率先将GPT-4整合到New bing,让AI渗入到人们日常使用搜索引擎的全流程中。这一波操作,直接让New bing日活用户破1亿,数百万活跃用户中,有三分之一都是新用户。

紧接着,Office全家桶也宣布接入GPT-4,推出新功能Microsoft 365 Copilot。微软CEO纳德拉在发布会上直接放话:今天,进入人机交互的新时代,重新发明生产力

随后国内大厂也纷纷跟进,阿里放话要在所有产品中接入通义千问。

但问题是,有能力自己推出大模型、自己完成AI化升级的,毕竟还是极少数科技巨头的“特权”。即便是直接接入API,也需要企业本身具备一定的开发团队。因此在新的趋势下,很多软件和应用服务方,都在急迫寻找一个效果好、门槛低的软件应用AI化方案。

而作为作为微软和OpenAI的企业级合作伙伴,拥有领先商业化成果的心识宇宙,这几个月自然要被人“踏破门槛”了。

据心识宇宙透露,从MindOS发布以来,他们收到了数百家企业的试用申请,尤其是今年1月趋势引爆以后,申请量更是空前暴增。

目前,他们已经和全球Top 3电商平台之一、亚太地区头部金融券商、全球顶尖跨境电商平台、国内头部虚拟人公司和头部元宇宙平台达成合作。

人机交互变革的新起点

心识宇宙的浮出水面,传递出了一个让人颇为兴奋的信号:

更加自主的AI Copilot,正在大踏步走进你我的生活。

加之最近AutoGPT、AgentGPT等自主人工智能工具爆火,再次验证了更加灵活、可靠、易用的AI是新趋势的方向。

作为提前看到趋势,并率先开启技术研发、商业化落地的AGI领域创始人,陶芳波提出了自己的认知和判断,即未来世界的发展将会分为三个阶段:

应用和服务的AI化:任何需要用户来做决策的过程,都应该有AI Copilot的辅助,来更好提供深度需求理解和场景化推理。个人为中心的AI出现:每一个人,都可以在交互的过程中,逐渐培养一个和自己深度绑定、且可以帮助串联任何事的AI Copilot。AI Copilot串联成网络:应用和服务的AI Copilot和每个个人AI Copilot,连接成一张全新的网络,服务的分发会在这个AI Network上发生。不是传统的基于连接的分发,而是基于理解和推理的分发,这些AI Copilot会相互合作、协同,帮助人类完成复杂任务。

目前心识宇宙正在快速推进的,就是第一阶段。

第二阶段也近在咫尺,在今年下半年,他们将会发布面向消费者的MindOS,届时所有人都有机会塑造一个专属于自己的AI Copilot。

在这些趋势下,一个更加震撼的变革也在悄然推进,即人机交互方式正在被改写

过去一百多年来,人机交互的方式从最初的基于按钮,发展到了通过命令行,再更进一步飞跃到通过图形界面完成交互。

当下的计算机、智能手机等,人和软件之间的信息交流,都是建立在GUI的基础上,也让人机交互从最初的仅限于专业人群,发展到了普通人范围。

但对人机交互稍有了解的人都知道,人类最自然的交互方式,其实是语言。

比如想要查询天气,如果通过语言,只需要说一句话“北京明天天气怎么样?”如果通过GUI,则需要用户找到软件、选择城市、再查看具体的日期。

过去,由于AI的能力有限,这种基于语言的交互也只能做到浅尝辄止。

AI语音助手往往是通过识别固定的句式、关键字,来做出机械式的回复,给人带来的体验升级比较有限。

如今,在大模型能力飞升的背景下,新的可能出现了。

当AI可以充分理解人类语言、链接各方面能力,仅通过语言的人机交互就会成为最方便的交互方式。传统由产品经理定义UI界面的方式,都可能被改写。

林宋琪表示:

未来用户通过自然语言讲解工作流程,AI就可以连通各个软件的API,自主构建工作流和专属用户的UI,这样所有屏幕都可以变成AI的画布,而每个AI助手都是用户的“马良神笔”。

也就是说,AGI之于软件,正如Made to order之于制造,之前是供给到需求,之后是需求到供给,这是一种全新的生产方式。

由此产生的影响,或许都不局限于软件领域,乃至硬件的生态都可能被改写。

未来,AI的载体可能是手机、电脑、头显,也可能像钢铁侠那样——是机器人。

自主性包括哪些要求和要求 自主性的含义是什么(图12)

或许在以前,这种说法会被定义为“美好的无限想象”,但是在ChatGPT趋势下,创新正在“以小时为单位”发生。

两个月前,学生们拿ChatGPT写作业、考试,已经让人咋舌;而如今,人们开始尝试让ChatGPT自己想办法开发网站、让GPT-4控制实验室的机器人做化学实验……

似乎已经没什么不可能发生了。

而人们的无限憧憬与期待,或许也是AI创造无限可能的必要因素之一。

那么,你觉得人人一个AI Copilot会是人类的未来吗?

P.S.本周心识宇宙将召开MindOS内测发布会,感兴趣的童鞋可戳下方链接报名:

Webinar 1: https://us02web.zoom.us/webinar/register/WN_mCV8jzA-S--4K5u9KssCug#/

Webinra 2: https://us02web.zoom.us/webinar/register/WN_Wpn01K2lTt2sbIw0M0e8IA#/registration

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

阅读全文

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:xuekun2008@foxmail.com

相关推荐

2021年全国有多少人口

2021年全国有多少人口
2021年全国人口数量已经超过14亿,这是一个庞大的数字,也是一个令人印象深刻的...

甜宠文有哪些

甜宠文有哪些
甜宠文,即甜蜜宠爱文。它是文学作品中的一种重要流派,是以情侣或伴侣之间甜蜜温馨、...

赟怎么读

赟怎么读
赟这个字读作yún,为一个多音字。在汉语拼音中,多音字是指一个字有多个发音的现象...

FC模拟器怎么用

FC模拟器怎么用
FC模拟器是一种可以模拟FC游戏主机的软件,可以让玩家在电脑上体验经典的FC游戏...

双色球号码的规则是什么

双色球号码的规则是什么
双色球是一种广泛参与的彩票游戏,它的规则非常简单明了。在双色球中,参与者需要从1...

教师课堂礼仪包括哪些

教师课堂礼仪包括哪些
教师课堂礼仪是指教师在课堂上的言谈举止以及与学生之间的互动方式。良好的教师课堂礼...

《永遇乐·京口北固亭怀古》讲述的什么

《永遇乐·京口北固亭怀古》讲述的什么
《永遇乐·京口北固亭怀古》是唐代诗人杨炯所作,是一首怀古咏史的长篇叙事诗。这首诗...

除夜是什么意思

除夜是什么意思
除夜是什么意思节日氛围洋溢,喜庆声声。在每年的最后一天,人们聚在一起迎接新的一年...

《蛙声十里出山泉》作者是谁

《蛙声十里出山泉》作者是谁
蛙声十里出山泉是一首流传至今的古诗,描绘了青蛙叫声引起山泉涌流的奇景。这首诗虽然...

定金罚则的主要内容是什么

定金罚则的主要内容是什么
定金罚则是指在商业交易中,当买方在签订合同后,未能按照约定时间或条件履行合同义务...