如何打造一个更聪明的“AI数字员工”
作者: 投资币 时间: 2024-11-02 23:13 阅读: 592
图片来源:由无界 AI生成
大语言模型正在各行各业崭露头角,理解人类语言、生成创新性内容,甚至帮助企业提高效率,无论企业大小,接入AI技术的门槛似乎越来越低。
然而,在快速迭代的背面,同样也充满了数据隐私、可解释性、数据伦理以及各类技术难题。
或许背后最大的困扰便是“安全”二字,这应该是360从创立之日起就开始解决的行业难题,只不过,这次放在了AI大模型时代下。
多轮探索后,360提出的“人工+大模型知识库+AI”的组合策略,确保数据安全的同时,还能大大降低企业自建大模型的成本,具体的策略我们曾在《360 开始猛扑AI数字员工》一文中有详解。
但行业的需求不仅如此,除了要更安全,要低成本,还得要更聪明。
本文便是对后者的补充,即,如何打造一个更聪明的“AI 数字员工”。
如果用专业术语来讲,360 是通过人工制定大模型工作流程,建立知识库系统,实现模型广场和微调预训练能力;再基于底层能力,如任务系统、决策链、思维链、推理系统等,打造一个低代码配置平台,同时具备自己的外部API调用能力。
这一平台让所有企业内部的管理员和一些IT技术信息的人都可以使用这个平台,他们不仅可以写一个Promt,而是写多个Promt,让大模型变成一个Copilot的形式来执行非常复杂的任务。
一句话总结就是,少量人工干预的情况下让“数字人”之间形成了协同。
在具体应用时,AI数字人的强大能力则主要体现在两个方面:对外能创造一批具备灵魂且能实时交互的数字人,如招商数字人、虚拟演讲者和虚拟销售代表等;对内则可以为企业提供更加高效的数字员工服务。
诸如此类的行业创新依旧在暗流涌动。
正如360 集团副总裁、N 世界负责人梁志辉在前不久的见实“920AI大会”上提及的那样,AI的发展趋势正在重新定义我们的工作方式,未来,我们将看到更多的AI应用出现,解决更多的挑战,成为人类的强大合作伙伴。
这是一个充满机遇和潜力的时代,企业需要不断关注AI的发展,以保持在这个领域的竞争力。AI如何变得更加智能、更有创造性,又将如何深远影响企业组织发展的,让我们回到现场一探究竟,听听360从一线带来的思考和观察,如下,Enjoy:
01 如何让大模型变得更聪明大模型最擅长的三件事:内容生成、内容理解以及逻辑推导。
如果想知道如何让大模型变得更聪明?
首先要看如何定义聪明,在很多场景下,与GPT交流时,你会发现仅能给出一条指令,但他只能回答一次,这很难完成一个非常复杂的任务。在这个过程中,360扩展了整个大模型的能力,并实现了多轮对话、多模态交互以及GOI的交互能力。
将这些交互能力转化为一个低代码配置平台,让所有企业内部的管理员和一些IT技术信息的人都可以使用这个平台,他们不仅可以写一个Promt,而是写多个Promt,让大模型变成一个Copilot的形式来执行非常复杂的任务。
目前,360数字员工平台已经有一个大模型的低代码工作流配置平台。大致的流程如下:
首先,基于现有大模型组件,通过人工制定大模型工作流程,建立知识库系统,实现模型广场和微调预训练能力;再基于底层能力,如任务系统、决策链、思维链、推理系统等,让大模型变得更聪明,可以执行更多步骤,与大模型进行交互,可以实现数百次大模型交互,同时具备自己的外部API调用能力。
在内部办公时,360团队专门研发了一个AI数据人工。这个AI数据人工可以在很多企业内部遇到文案分析和总结等多模态交互时使用。
这里是一个具体例子。例如,让大模型进行旅游规划,计划去丽江、玉龙雪山以及香格里拉的旅游景点。在这个过程中,大模型需要进行搜索并分步执行,找到景点以及其中的习俗和可玩的地方,以及酒店。
大模型可以为您制定一份非常专业的100步旅行规划。这里会产生大模型工作流的结果,包括民风习俗、旅游景点介绍以及旅游过程中的环境,形成表格,并逐步生成一份专业报告。
大家可以理解,这代表了大模型可以执行一个非常复杂的工作。今天它可以执行100步,相信不久的将来,可以让它执行1000步,甚至10000步。
在大模型应用中,如何让几个大模型或智能体系共同完成协同任务是非常重要的,这个功能已经在360智脑和AI数字员工上线。
在这个过程中,你只需要给一个指令就可以让几个AI数字员工完成所有工作。同时,AI还可以写一些带有鲜明风格的,例如新时代的8股文、周报、日报等。
相信在很多打工一族中,大家都感同身受。很多时候,你需要写得有格局,写得有盖帽子的话,这里面用GPT,用大模型去写效果是最好的。
在这里,360AI可以进行文章总结和工作总结,甚至可以请大模型撰写公文、请示、报告、函件和通知等。虽然一个小时最多可能写2000个字,但在大模型的协助下,一个小时可能写出2万个字或4万个字。
绘图功能也非常重要,在日常工作中,企业经常为营销文案配备许多设计图。近日,360推出了“LoRA360平台”,大家可以基于网上虚拟好的LoRA模型进行AI文生图的设计,在AI内容分析能力方面非常有效。
使用AI进行财报分析是大多数企业都在使用的功能,过去人工大约需要5到6个小时才能对财报进行分析,阅读一篇论文,可能也需要花费2~3天才能精读完整。
今天,你甚至都不需要额外上传一个PDF,就可以围绕这个PDF进行各种信息查询。此外,针对企业内部的知识和内容,还可以将其导入企业知识库,进行轻量级的大模型训练。
区别在于,进行大模型微调预训练通常需要一个月到两个月的时间。如果仅进行微调,可能需要一个星期左右的时间才能完成。
今天,通过知识库将许多事实性信息教授给大模型,并找到相关信息。
实际上,许多企业内部的知识都是以文档形式呈现,很多场景下只需将文档训练到系统提供的AI数字员工中,就能让大模型快速学会。
02 大模型时代下的困境与机遇在企业使用公有大模型落地应用的过程中,有三个问题:
首先,在与大模型聊天过程中,可能泄露企业秘密、代码和商业机密。
其次,大模型幻觉问题严重,一个明显的现象是,大模型会编写一些自己不知道的内容。例如,很多大模型没有地理位置信息,如询问北京有哪些好吃的地方,它们会编写杭州的饭馆。
最后,企业内部很多信息需要分开处理,财务团队和业务团队的信息要进行隔离。如果让大模型回答所有信息,实际上无法进行信息拆分。
企业落地大模型时常会遇到三个典型问题:
第一,很多人学不会提示词编程,让一个公司的文员学习如何编写提示词需要很长时间的培训。
第二,在许多大模型中,无论是公有大模型还是私有大模型,都缺乏行业知识。例如,你请了一个大学生或外包公司的人为你撰写文案和营销内容,如果不了解公司或行业,这种幻觉问题会更严重。
第三,在日常工作中需要解决的问题并非一个简单的promt,一次交互就能解决。很多时候,企业需要撰写行业报告和制定行动规划,需要上百部、上千部才能完成规划书。然而,与大模型沟通时,如果仅仅聊几句就会崩溃,首先,与GPT沟通时,token可能不够充足。
在这方面,360针对大模型的应用实际上采用了两个方向:
一是,为内部数字员工提供AI技术以及高效的数字员工服务;二是,针对外部营销获客,培养一批具备灵魂且能实时交互的数字人,他们可以包括数字客服、数字销售、数字主播以及一些数字名人。
通过大模型学习,这些数字人能成为客服、销售以及帮助你进行直播和培训的人。
数字人在企业降本增效方面有两个明显的优势:
一方面是数字人拥有强大的大脑和最佳外表,在外形方面,可以通过一张照片实现驱动;另一方面是即使一段5分钟的视频,也能成为数字主播的直播视频,为了达到这个效果,我们定了三个方向:
一是,让大模型不再简单使用Chat UI的方式交流,很多人与聊天机器人仅仅交流两句话,很难深入交流,如果能采用低延时面对面交流,实际上就能实现最自然的人机交互语言。
二是,让数字人具有灵魂和记忆,能够记住你说的所有话,而不会在说过几十句之后出现以往的问题。
三是,让数字人能够连网学习,遇到不会的东西可以实时上网进行搜索。基于这些能力,进行许多应用展示。
基于这一能力,在今年8月份,360请了一位前面提到的主持人,将其进行360度扫描,并成为主持人,这个数字人具有看得见、听得懂、说得好的特点,在这个过程中,他们可以观察整个环境的灯光因素,并与现场灯光系统进行连接,发挥中间指挥作用。
在AI加上感知层,让AI大模型数字人成为文旅、客服和销售场景的解答者。增加AI感知层,它可以代入角色,拥有自己的思维链,包括视觉、听觉、短期记忆、长期记忆。此外,还能将这个人克隆出来,声音、形象、动作和思维。
类似的案例还有很多,过去一段时间,360为各地直辖市的政府举办了招商数字人活动,这些数字人可以将政府内部的招商政策或公开信息训练到数字人中,在各种办事大厅回答招商相关问题。
再比如,公司各种高管需要经常去各地演讲、培训。在这个过程中,有时候你无法亲自去演讲,但你的PPT和演讲如何在活动中呈现?
在实际操作中,360曾遇到过这样的场景,有一天我的老板给我发了一条短信,说他在5月份有空,但又想出席一个创业大赛。在这种场景下,他们仅用了几张照片和音频,就实现了他在虚拟空间里进行演讲的过程。
回过头看,大模型创业中技术和产品是否存在壁垒?哪些部分最重要?哪些部分是壁垒?
最后发现,不仅技术和产品,产品的建设也非常重要。
AI是个人和企业的发展优先权,越早拥抱AI,就能获得比别人高出10倍以上的发展速度。