具身智能体

一、什么是具身智能体

  1. 产品定位

    具身智能体」是一款专为企业打造的对话型AI数字人应用终端产品,支持企业高效率创建出基于垂直业务场景的交互数字人应用,并能够为用户提供简单、快捷的数字人创建以及管理服务。无需任何编程知识,仅通过简单配置,就可以快速定制出覆盖全域多端(移动端/PC端/大屏)、1v1服务、7×24小时运行的AI数字人。无论是企业培训、智能问答、业务导办,还是前台接待、展会讲解等其他各种企业所需的服务场景,「魔珐魔珐有灵」都能轻松融入,为企业和用户提供高效、便捷的服务。
  2. 产品优势

    01 形象优:增强品牌认知和视觉吸引力
    通过海量AI数字人形象可显著增强视觉体验,助力品牌在多渠道中快速吸引用户并提升记忆度。魔珐的AI数字人支持个性化定制,提供丰富角色库,满足企业多样化需求,同时保持品牌形象的一致性和专业性。
    02 表达好:多模态多语言的信息交互,提升沟通效率
    AI数字人融合视频、语音、文本等多种交互模态,让信息传递更直观、清晰,交互体验更丰富生动。同时,支持多语言交互,打破语言壁垒,满足全球用户需求,提升国际市场竞争力。结合高质量动画与动作大模型,数字人以逼真的声音、表情和动作,精准传达情感与意图,增强沟通的亲和力与信任感。
    03 够专业:产品对接大模型,提供专业智能服务
    支持对接大模型,能够为用户提供更加专业、智能的服务体验。无论是业务讲解、客户服务还是内部管理,数字人都能提供精准、专业的回答,满足用户的需求。
    04 高效率:全新智能交互方式,提升各业务部门的对客效率
    在私域运营中,轻松应对多群组和复杂问题,为用户提供高效、专业的1v1服务;在全渠道客服场景下,快速响应售前售后问题,以金牌话术提升客户满意度;对于销售人员,尤其是新入职员工,助力其快速掌握业务,逐步实现金牌销售的转化效率。
    05 配置快:轻松上手,即刻拥有AI数字人智能体
    无需复杂准备工作,仅需简单配置,最快三分钟即可创建数字人应用,企业可快速享受AI数字人带来的便利与高效。

二、配置端

配置端是完成智能体从“创建”到“发布”全流程的操作后台。整个配置流程遵循 “先定义人物 → 再搭建场景 → 后编排对话 → 最终发布上线” 的逻辑链路,依次在“智能体配置”、“演播室”、“对话定义”三个核心模块中完成。发布后,还可以在“数据分析”模块持续追踪智能体的运行表现。

  1. 智能体配置

智能体配置是构建数字人形象与声音的第一步,需要在此处完成人物的“外在”定义(形象、音色、动作风格),为后续的演播室编排奠定角色基础。

  1. 创建智能体

创建智能体是进入配置流程的第一步。系统提供两种创建路径:从零开始创建从模板开始创建

  • 从模板开始创建:直接选用系统预设的智能体模板,模板中已包含基础的人设、对话模型和知识库配置,只需根据实际业务需求调整参数即可快速上线,适合标准化场景或初次使用者。
    •   进入模板选择界面后,可通过以下方式查找合适的模板:
    • 排序:支持按“综合排序”或“最新上线”两种方式排列模板列表
    • 关键词搜索:在搜索框中输入模板名称或场景关键词,快速定位目标模板
    • 屏幕分类:按“横屏”或“竖屏”分类筛选,匹配目标设备的显示比例
    • 智能体类型:按线上智能体或屏型智能体等类型进行筛选
  • 从零开始创建:从空白状态开始,自行完成人物定义、演播室编排和对话定义的全部配置。根据智能体的部署形态,进一步分为两种类型:

类型

屏幕比例

输出形态

部署方式

线上智能体

竖屏 9:16

可在线访问的具身智能体链接

嵌入网页、App 或小程序,用户通过链接直接访问

屏型智能体

竖屏 9:16 或 横屏 16:9

可部署到线下屏幕的智能体应用

配合客户端,在 LED 业务屏、BI 大屏、服务屏、营销屏、自助终端等设备上运行

💡 提示:线上智能体与屏型智能体的核心差异在于部署环境和屏幕适配。线上智能体面向线上用户访问,屏型智能体面向线下硬件设备。两者的后续配置流程(人物定义、演播室、对话定义)大体一致,差异点已在 1.3.2 和 1.3.3 章节中分别说明。

操作入口:点击左侧导航栏的【知识创作台】,在左侧区域勾选本次智能体需要调用的知识库(如产品手册、企业文档等),随后点击右侧的【具身智能体】按钮,选择“从零开始创建”或“从模板开始创建”,即可进入对应的配置流程。

💡 提示:知识库可在创建时预先关联,也可在后续的“对话定义”阶段再行添加,两者灵活可选。
  1. 人物定义

进入已创建好的智能体设计界面后,需要依次在页面上方完成形象、音色、动作风格三项核心配置,共同塑造数字人的人设基调。

  1. 形象设置

形象库提供了丰富的数字人外观供选择。可以通过顶部的搜索框输入名称快速定位,也可以使用以下筛选条件精准查找:

筛选维度

可选值

姿势

站姿、坐姿

角色类型

3D超写实、卡通、美型、机器人、二次元、2D超写实

性别

女、男、中性

族裔

中东裔、亚裔、欧美裔、非裔、印度裔、拉美裔

色系

粉色、紫色、蓝色、绿色、黄色、橙色、红色、棕色、灰色、白色、黑色

年龄

青年、中年、老年

系列风格

可爱风、优雅风、通勤风、复古风、古风、学院风、华丽风、中性风、民族风、暗黑风、甜心辣妹风、极简风、街头风

服装风格

运动、休闲、正装、科幻、节日、中式、制服

可根据业务场景(如政务服务选正装,品牌营销选休闲风)组合筛选,快速锁定合适的形象。

  1. 音色设置

为选定的形象搭配特定风格的语音,是提升数字人真实感的关键。

  • 音色选择:音色库中的部分音色标注为“基础版”,部分为“Pro版”(音质更佳、情感更丰富)。可以使用以下筛选条件缩小选择范围:
    • 语种:中文、英语、日语、韩语、俄语
    • 应用场景:活动宣传、企业营销、产品营销、社媒运营、跨境出海、电商运营、企业培训、工作学习、广电传媒、党建教育、本地生活、教育教学、个人生活、销售推广、企业管理、文旅宣传、医疗医美、政务服务,以及面向海外用户的(英)客户体验中心、(英)内容创作者、(英)IT与信息安全等。
    • 风格特点:自然平和、稳重深沉
  • 注音:对于人名、专业术语等特殊词汇,可以通过注音功能为其标注正确读音,确保数字人发音准确。点击“新增”即可对特定字/词语添加注音,并支持批量导入/导出已有注音列表。
  • 音色调节:选定音色后,还可以分别对语速语调音量进行微调,以获得最理想的听觉效果。
  1. 动作风格设置

为形象搭配一套动作风格,不同风格决定了数字人在说话时的肢体节奏与幅度,适用于不同情境的人物动态表现。

风格

适用场景

动作特征

通用

企业迎宾、智能销售等

日常通用的平衡型动作,稳重得体

客服

政务服务、企业服务等

官方正式,手势规范且克制

严肃

指挥中心、专业咨询等

严谨稳重,动作幅度小、节奏缓

活泼

品牌营销、活动接待等

活泼热情,手势丰富、节奏明快

自然

文旅导览、知识分享等

自然讲解,类真人日常交谈动作

选择后,可以在左侧预览区实时观察动作效果,按需切换。

  1. 演播室定义

演播室是完成AI数字人对话作品的核心编辑空间。将在此处依次完成环境搭建(场景与字幕)、角色设定(数字人形象与身份)以及对话剧本(开场白与预置问题)的配置。整个编辑区遵循“左侧预览与场景库、右侧属性面板”的布局,所有修改均会实时自动保存。

  1. 场景库的选择

场景库用于为作品选择3D虚拟环境,这是奠定作品整体视觉风格的第一步

  • 操作入口:点击页面左侧面板中的“3D场景库”缩略图(例如:演播室、医院门诊、品牌馆等)。
  • 生效范围(全局):左侧3D场景一旦被选中,该背景将一次性应用于欢迎页和所有对话页,保持作品视觉风格的全局统一。
  • 重要提示:若后续在右侧为单个页面设置了平面背景,再次切换左侧3D场景时,新场景会覆盖所有页面的现有背景,需谨慎操作。
💡 建议:如果希望每个页面拥有不同背景,请使用右侧的“平面素材”或“我的”素材库进行单页设置(详见1.3.2章节)。
  1. 线上智能体核心展示页面的设置

演播室的核心展示页面分为欢迎页对话页,可点击顶部预览区下方的选项卡进行切换,分别配置每个页面的独立信息。

  1. 欢迎页

欢迎页是用户进入对话前看到的第一个画面,主要用于展示数字人形象并告知用户当前的服务主题。

  • 背景设置:可以通过以下三种方式为欢迎页添加背景,不同方式对应不同的生效范围:
    • 选用3D场景(全局):即1.3.1中的操作,该背景会同时作用于欢迎页及所有对话页。
    • 选用平面素材(仅当前页):点击页面右侧的“素材库”,筛选“平面”分类后选择图片,该背景仅应用于当前欢迎页,不影响其他页面。
    • 上传自定义背景(灵活选择):进入**“我的”**素材库,点击上传按钮将本地图片添加为专属背景;上传后,可将其视为平面素材,应用于任意单个页面。
  • 文案信息:在此输入框中填写数字人的身份介绍或服务引导语(例如:“您好,我是您的专属面试官”)。该文案将在欢迎页以气泡形式展示,帮助用户快速建立认知。
  1. 对话页

对话页是用户与数字人进行实时交互的核心界面。可在此处配置数字人的外在呈现、内在话术及交互引导。

  • 场景呈现
    • 背景:设置方式与欢迎页的“背景设置”完全一致,支持使用左侧3D场景(全局)、右侧平面素材(仅当前页)或“我的”素材库中的自定义图片。
    • 字幕:点击“字幕”选项,可从有言提供的字幕样式库中为数字人对话选择匹配的字幕字体、颜色及动效,以提升观看体验。
  • 文案信息:在此输入框中填写引导访客继续对话的提示性文案(例如:“想和Ta聊点什么?”)。该文案将显示在访客输入框内作为占位引导。
  • 交互流程
    • 开场白:设置数字人在对话页主动说出的第一句话(例如:“你好,欢迎来到本次面试”)。这是用户进入对话后接收到的第一条语音信息,建议控制在20字以内以保证完整显示。
    • 预置问题:点击“添加预置问题”,可设置快捷提问按钮供用户一键点击(最多支持预设5个)。合理设置预置问题能有效降低用户输入门槛,引导对话走向期望的主题。
  1. 屏型智能体核心展示页面的设置

屏型智能体是针对线下大屏、一体机等硬件设备场景的特殊形态。与线上智能体相比,其展示页面扩展为默认待机页、识人欢迎页和对话页三个核心页面,且部分交互方式有所差异:

  1. 默认待机页

这是屏型设备无人交互时的“息屏”或“待机”画面。

  • 场景呈现:背景和字幕的设置方式与线上智能体完全一致(详见1.3.2)。
  • 交互流程(新增):相较于线上智能体,此处增加了唤醒词设置功能。开启后,设备可通过特定语音指令(如“你好,小言”)唤醒并进入服务状态。
  1. 识人欢迎页

此页面在设备通过人脸识别或感应到用户靠近时自动触发,用于主动迎接访客。

  • 交互流程:由以下四部分组成,与线上智能体的欢迎页在交互逻辑上有较大区别:
    • 开场白:设备主动说出的第一句欢迎语。
    • 展示内容:即向用户推荐的推荐问题列表,引导访客点击提问。
    • 展示文字:推荐问题列表上方显示的引导性说明文字(例如:“可以问我以下问题”)。
    • 预置问题:具体的推荐问题选项,用户点击后即可发起对话。
  1. 对话页

屏型智能体的对话页在呈现方式和结束机制上与线上版本存在差异:

  • 场景呈现
    • 背景:设置方式与线上智能体一致。
    • 对话样式:屏型智能体不再提供具体字幕样式的精细选择,统一使用默认字幕样式。同时,可以在“字幕样式”和“气泡样式”两种对话呈现模式中二选一,前者更正式,后者更贴近社交聊天场景。
  • 交互流程(新增)
    • 开场白:与线上智能体一致。
    • 结束触发语:此功能专为屏型交互设计,支持设置1个标准触发句(如“感谢,本次服务结束”)以及不限数量的相似触发句(如“谢谢”、“可以了”)。当用户说出触发语时,智能体将自动结束当前对话并返回待机状态,实现流程闭环。
  1. 对话定义

对话定义界面分为左侧的编排区和右侧的预览调试区,是决定智能体“如何思考与回应”的核心配置环节。

  1. 编排区

智能体模式分为基础模式对话流模式,前者适合标准问答场景,后者适合复杂的多步骤任务流程。

  1. 基础模式设置

基础模式通过以下五个模块的组合配置,定义智能体的认知与行为逻辑:

  • 角色人设:为智能体编写面向用户的人物设定,决定其“身份”与“说话立场”。
    • 手动填写:在空白输入框中自由撰写智能体的角色定位、承担任务、核心技能、输出规范及限制条件等(例如:“你是一名资深电商运营顾问,擅长数据分析,回答需简洁专业,不超过200字”)。
    • 使用模板:如果不确定如何撰写,也可以直接选用系统预设的角色模板,目前支持智能客服、内容创作、专业咨询、教育辅导、旅行规划5种典型场景,选中后自动填充基础人设框架,只需微调即可。
  • 感知理解:配置智能体对用户输入的识别与理解能力(如情感分析、意图识别等高级感知功能,具体选项视版本开放情况而定)。
  • 对话模型:为智能体选择底层的对话AI大模型,不同模型在推理能力、响应速度和知识广度上各有侧重。目前支持的大模型包括:有言中文客服大模型、火山方舟智能体联网、阶跃星辰step-2-mini、阶跃星辰step-1-32k、deepseek-v3、deepseek-chat、GPT4o、文心一言轻量版、豆包32k-lite、豆包32K等。
    • 点击对话模型下拉框,从列表中选择所需的大模型。
    • 点击模型右侧的编辑按钮(齿轮图标),可对以下两个核心参数进行调整:
      • 温度:控制模型输出的随机性与创造性。数值越大,模型回答更具创意和多样性;数值越小,模型更严格遵循指令,输出更保守、确定。创意类场景建议调高,专业问答场景建议调低。
      • 记忆轮次:控制模型能“记住”多少轮历史对话。轮次越多,上下文信息越丰富,回答更贴合语境,但响应速度可能略降;轮次越少,模型更聚焦当前问题,响应更快,但长对话中可能丢失前文信息。需根据实际对话深度需求平衡选择。
  • 知识:为智能体关联专属知识库,赋予其特定领域的专业信息储备,使回答有据可依。
    • 点击【添加知识】,从弹窗中选择已建好的知识库进行绑定,最多可绑定20个知识库。
    • 点击知识库右侧的设置按钮,可调整以下检索策略:
      • 问题改写:开启后,系统会自动对用户输入的不完整或口语化问题进行语义优化,让大模型理解更精准,输出更优质的结果。
      • 结果重排:开启后,系统会对从知识库中检索到的多条结果,按照相关性、质量等维度进行智能重新排序,将最符合用户意图的内容排在前列,提升最终回答的准确性与逻辑连贯性。
  • 技能:通过插件和工作流为智能体扩展外部能力,使其能调用API、执行自动化任务。
    • 配置插件:插件让智能体能调用外部API,执行实时搜索、浏览网页、生成图片等任务,从而突破知识库的静态限制,扩展功能边界。
    • 配置工作流:通过可视化的“工作流设计器”,可以将插件、大模型、代码块等组件连接成自动化流程,以应对旅行规划、报告分析等复杂多步骤任务。
    • 可以在【技能】区域直接选用官方预置的工作流,也可以点击“创建工作流”从零开始搭建。详细的创建工作流方法请参考本文档**“第二部分 第2点 工作流搭建”**。
  1. 对话流模式

对话流模式本质上是将智能体的全部对话逻辑以可视化工作流的形式呈现,适用于复杂任务编排场景。其配置方式与工作流搭建完全一致,通过拖拽节点、连线的方式,精细控制对话的每一个分支与跳转逻辑。如需高度定制化的对话流程(如多轮信息收集、条件分支判断等)。

  1. 预览调试区

编排区的所有配置均会在右侧的预览调试区实时生效。可直接在预览区的对话输入框中发送测试消息,模拟用户与智能体的真实交互,验证人设、知识库和模型参数的实际效果。发现回答不理想时,可随时返回左侧编排区调整参数,刷新后重新测试,直至效果满意。

  1. 智能体发布

完成人物定义、演播室编排和对话定义的全部配置后,即可进入发布环节。不同类型的智能体,其发布流程和产出物有所不同。

  1. 预览

在正式发布之前,建议先进行全流程预览,确保所有配置环节协同工作无误。

  • 操作方式:点击页面右上角的【预览】按钮,系统将在新弹窗中打开完整的对话体验页面,可在与真实用户完全一致的环境中测试智能体的表现,包括形象展示、对话响应、交互流畅度等。
  1. 发布

预览确认无误后,即可正式发布:

  • 线上智能体:首次发布需点击【发布】按钮,系统将生成一个免登录的智能体访问链接。此链接可嵌入网页、公众号或直接分享给用户。在发布弹窗中,还可以选择是否将当前智能体发布到模板中心,供平台其他创作者参考和使用。
  • 屏型智能体:首次发布需点击【完成】按钮,系统将生成 AppIDApp Secret(用于设备端SDK接入认证),并弹出部署到客户端的操作指引。可按照指引将智能体集成到线下大屏或一体机设备中。
  1. 数据分析

智能体上线后,可以通过数据分析界面持续追踪其运行表现与用户交互情况。该界面分为数据面板区对话详情区两大区域。

  1. 数据面板区

数据面板区提供了丰富的筛选与数据查看能力,帮助从宏观层面掌握智能体的整体表现。

  • 筛选栏:支持通过以下维度组合筛选数据,快速定位特定场景下的对话记录:
    • 数据来源:按数据产生的环境筛选——预览调试 / 终端测试 / 正式应用
    • 状态:按回复结果筛选——正常 / 被打断
    • 反馈:按用户评价筛选——点赞 / 点踩
    • 时间:通过起止时间范围筛选
    • 搜索框:支持通过“问题类型”或“用户IP”关键词搜索
  • 下载:勾选需要的数据条目后,点击下载按钮即可生成Excel表格,便于离线分析或存档。
  • 数据列表:以表格形式展示所有对话记录,包含以下字段:
    • 勾选框:支持逐条勾选或点击表头一键全选/取消,便于批量操作
    • 对话轮次:显示该场对话的问答总次数。点击列头右侧箭头可升序/降序排列
    • 发起时间:显示该场对话的开始时间。点击列头右侧箭头可升序/降序排列
    • 来源说明:标注该条数据来源于预览、测试还是正式环境
    • 操作:点击“查看详情”可进入对话详情区,查看完整对话内容
  1. 对话详情区

当在数据列表中点击某条记录的“查看详情”后,右侧或弹窗中将展示该场对话的完整详情,包括:

  • 对话内容:用户与智能体的完整问答记录,逐条呈现
  • 知识库来源:若智能体的回答引用了知识库内容,此处会标注具体引用的知识条目,便于溯源验证
  • 回复时间:智能体每轮回答的时间戳,便于分析响应效率
  1. 工作流搭建

  2. 什么是工作流

工作流是通过可视化设计器,将插件、大语言模型、代码块等不同组件连接而成的自动化流程,用于应对旅行规划、报告分析等复杂多步骤任务。

可以把工作流理解为一个自动化的流水线。以奶茶店的制作流程为例:点单 → 制作奶茶 → 加配料 → 打包 → 交给顾客,每一步按顺序执行,最终完成一杯完整的饮品。工作流的工作原理与之类似——让计算机按照预设好的步骤,一步步完成任务。例如:

  • 自动生成周报:收集数据 → 分析数据 → 撰写报告 → 发送邮件
  • 智能客服:接收问题 → 理解意图 → 检索知识库 → 生成回复

在有言中,工作流通过“拖拽”方式将各个步骤连接起来,无需代码即可让AI自动执行复杂任务。

  1. 节点

节点是工作流的基本组成单元,每一个节点代表一个具有特定功能的独立组件,相当于流水线上的一个工位。将多个节点按执行顺序连接,即可组成一个完整的工作流。

常用的节点类型包括:

节点类型

功能说明

开始节点

每个工作流有且仅有一个开始节点,用于定义工作流的起始入口和需要输入的参数

大模型节点

调用大语言模型执行文案撰写、数据分析、内容生成等AI任务

代码节点

执行自定义逻辑(如数据格式转换、数值计算、条件判断等),支持Python等编程语言

结束节点

每个工作流有且仅有一个结束节点,用于输出工作流的最终结果(如生成的报告、回复的消息等)

各节点的详细配置参数及使用说明,请参考本文档**“工作流节点”**章节。

  1. 使用工作流

在有言中,使用工作流有两种方式:直接选用官方工作流模板自行搭建工作流

  1. 官方工作流模板

官方工作流模板是由系统预置的、可直接调用的标准化工作流,覆盖常见业务场景(如自动回复、信息查询等)。

  • 操作方式:在智能体配置过程中,进入【对话配置】模块,在“技能”区域直接选用官方工作流,无需额外配置即可生效。
  1. 搭建工作流

当官方模板无法满足特定业务需求时,可自行搭建工作流。搭建流程分为创建、编辑、测试与发布三个步骤。

  • 创建工作流
    • 进入【资源库】页面,点击【创建】→【工作流】。
    • 在弹出的配置面板中填写以下信息:
      • 工作流名称:简明扼要地标识工作流的用途。
      • 工作流描述:详细描述工作流的使用场景和功能。该描述至关重要——大模型在收到用户提问后,会根据此描述判断是否调用该工作流,因此应尽可能清晰、具体(例如:“本工作流用于根据用户提供的销售原始数据,自动生成包含趋势分析和下月预测的周报”)。
    • 点击确认后,即进入工作流编辑画布,可开始编排节点。
  • 编辑工作流
    • 在画布中,按照任务的实际执行顺序,从左侧节点库中拖拽所需节点至画布。
    • 将各节点按流程顺序进行连接(通过拖拽节点间的连线端口建立上下游关系)。
    • 依次点击每个节点,在右侧属性面板中配置该节点所需的参数(如大模型节点的提示词模板、代码节点的执行逻辑、开始节点的输入变量定义等)。各节点的详细配置方法请参考本文档**“工作流节点”**章节。
  • 测试与发布
    • 配置完成后,点击画布上方的**“试运行”**按钮,输入测试参数,验证工作流各环节是否按预期执行。
    • 检查运行结果,若出现错误或输出不符合预期,返回画布调整节点配置或连接关系,重新测试直至运行成功。
    • 试运行通过后,点击**“发布”**按钮,工作流方可生效。发布后的工作流才能在智能体的【对话配置】中被选择并调用。
💡 提示:工作流发布后,若需修改,需在编辑后重新发布,修改内容才会在智能体中生效。

三、客户端

在使用本手册前,请先确保已配置好完整的屏型智能体应用。

  1. Windows版本

  2. 客户端下载

  3. 安装操作
  4. 进入已配置好的屏型智能体应用,在页面右上角找到发布按钮,点击按钮打开发布页面,点击下载链接,下载屏型智能体客户端
可通过以下方式操作:
  1. 将安装包下载至电脑上,通过U盘拷贝至终端设备
  2. 直接通过终端设备访问有言登录账号进行下载
部分设备可能会显示安全警告,请选择保留,并等待文件下载完成
  1. 找到下载好的文件,双击运行,按照指引完成安装。
  2. 登录操作
  3. 双击图标打开客户端,选择对应的应用模式
横屏/竖屏智能体选择自主模式
  1. 复制发布界面的APPID、SecretID至对应信息栏,并填写账号名称,即可打开对应屏型智能体应用
⚠️屏型智能体应用在客户端输入APPID、SecretID即可使用,无需将应用发布至模板中心
  1. 勾选登录属性选项,以便下次登录

记住登录信息(默认勾选):保存已输入的APPID、SecretID、账号名称,再次登录时无需重新输入

自动登录:勾选后,运行软件时自动登录

  1. 竖屏/横屏智能体

  2. 属性配置
属性配置入口为透明按钮,位于应用页面右下角,点击红框立置即可打开配置界面:
Windows预览模式下轻触进入配置页面
大屏终端应用连点5次进入配置页面
  • App Key、App Secret:显示应用的APP ID、SecretID,不可更改
  • VAD配置:配置后为停顿xx秒内没有声音都不会被判定为语音输入完成(默认800ms)
    • 纯软件模式:直接在输入框进行配置
    • 瓦力模式:联系负责的交付老师进行配置
  • 人脸检测时长:人脸固定1秒检测1次,配置后为当连续XX次检测都识别到人脸,判定为检测到人脸,自动进入欢迎页(默认3s)
无摄像头的终端设备无需设置
  • 人脸丢失时长:人脸固定1秒检测1次,配置后为当xx次检测都没有识别到人脸,判定为人脸丢失,自动返回待机页(默认300s)
目前默认对话页5min无互动返回欢迎页,欢迎页人脸丢失返回待机页
无摄像头的终端设备配置此项可视为:xx秒后欢迎页自动返回待机页
  • 对话模式选择:根据设备硬件条件和使用场景选择适用用模式
    • Windows系统:
      • 纯软件模式
      • 用户需说出唤醒词(默认为:你好小静,小静小静)开启语音识别,数字人回复时用户不可说话打断(需说出唤醒词或手动点击语音图标),数字人回复结束后可直接进行语音识别
      • 瓦力版本-无唤醒模式
      • 使用洲明瓦力盒子,支持人脸识别&随时说话互动,无需唤醒词
      • 瓦力版本-唤醒模式
      • 使用洲明瓦力盒子,支持人脸识别&随时说话互动,支持唤醒词
  • 缓存方式:根据设备硬件条件和使用场景选择适用缓存方试
    • 实时缓存(默认)
      • 当需要调用对应角色的某个数据时,下载到本地,之后不需要再下载
      • 每次调用数据前会先检测本地数据,若没有再进行下载
    • 预缓存
      • 第一次登录后,下载对应角色的全部数据至本地,之后不需要再下载
      • 当云端数据更新时,自动检测更新(每次登录时)
    • 无缓存
      • 不下载任何数据至本地,每次调用都直接从云端上获取
  • 缓存清理:清空所有缓存数据
  • 窗口属性
    • 启动时自动最大化:勾选后每次启动时窗口自动适配屏幕全屏显示
    • 窗口透明:勾选后不显示标题栏(通常搭配透明应用背景使用,仅显示数字人)
    • 窗口置顶:勾选后窗口强制显示在所有页面上方
    • 窗口位置固定:勾选后记住窗口位置,重新登陆后自动恢复
    • SDK消息反馈:勾选后当SDK有报错时,会在页面显示报错消息
    • 字幕:勾选后数字人回复时展示字幕
  1. 唤醒词修改

如有唤醒词修改需求,请联系负责的交付老师进行修改

  1. Android版本

  2. 客户端下载

  3. 安装操作
  4. 进入已配置好的屏型智能体应用,在页面右上角找到发布按钮,点击按钮打开发布页面,选择Android,点击下载链接,下载屏型智能体客户端
可通过以下方式操作:
  1. 将安装包下载至电脑上,通过U盘拷贝至终端设备
  2. 直接通过终端设备访问有言登录账号进行下载
  1. 在终端上找到下载好的文件,进行安装
本文档以平板设备为例,其他类型设备请参考
部分设备会提出风险提示,请点击继续安装
  1. 登录操作
  2. 点击图标打开应用,复制发布界面APP IDSecret ID至对应信息栏,并填写账号名称,即可打开对应屏型智能体应用
❗屏型智能体应用在客户端输入APP ID、Secret ID即可使用,无需将应用发布至模板中心
  1. 勾选登录属性选项,以便下次登录
  • 记住登录信息(默认勾选):保存已输入的APP ID、Secret ID、账号名称,再次登录时无需重新输入
  • 自动登录:勾选后,运行软件时自动登录
  1. 权限授权

屏型智能体运行需要使用系统相机、录音、存储功能,请点击弹框中同意按钮进行授权

  1. 竖屏/横屏智能体

  2. 属性配置
属性配置入口为透明按钮,位于应用页面右下角,点击红框位置即可打开配置界面
  • App Key、App Secret:显示应用的APP ID、Secret ID,不可更改
  • VAD配置:配置后为停顿xx秒内没有声音都不会被判定为语音输入完成(默认800ms)
    • 纯软件模式:直接在输入框进行配置
    • 瓦力模式:联系负责的交付老师进行配置
  • 人脸检测时长:人脸固定1秒检测1次,配置后为当连续xx次检测都识别到人脸,判定为检测到人脸,自动进入欢迎页(默认3s)
无摄像头的终端设备无需设置
  • 人脸丢失时长:人脸固定1秒检测1次,配置后为当xx次检测都没有识别到人脸,判定为人脸丢失,自动返回待机页(默认300s)
目前默认对话页5min无互动返回欢迎页,欢迎页人脸丢失返回待机页
无摄像头的终端设备配置此项可视为:xx秒后欢迎页自动返回待机页
  • 对话模式选择:根据设备硬件条件和使用场景选择适用模式
    • 纯软版本-全双工模式(支持如平板等能回声消除的设备)
    • 用户需说出唤醒词(或点击语音icon)开启语音识别,唤醒数字人后用户可随时说话互动
    • 纯软版本-半双工模式(支持无回声消除的设备)
    • 用户需说出唤醒词(或点击语音icon)开启语音识别,数字人回复时用户不可说话打断(需说出唤醒词或手动点击语音图标),数字人回复结束后可直接进行语音识别
    • 瓦力版本
    • 使用洲明瓦力盒子,支持人脸识别&随时说话互动,无需唤醒词
  • 缓存方式:根据设备硬件条件和使用场景选择适用缓存方式
    • 实时缓存(默认)
      • 当需要调用对应角色的某个数据时,下载到本地,之后不需要再下载
      • 每次调用数据前会先检测本地数据,若没有再进行下载
    • 预缓存
      • 第一次登录后,下载对应角色的全部数据至本地,之后不需要再下载
      • 当云端数据更新时,自动检测更新(每次登录时)
    • 无缓存
      • 不下载任何数据至本地,每次调用都直接从云端上获取
  • 缓存清理:清空所有缓存数据
  • 其他配置
    • 字幕:勾选后数字人回复时展示字幕
    • SDK消息反馈:勾选后当SDK有报错时,会在页面显示报错消息
  1. 唤醒词修改

如有唤醒词修改需求,请联系负责的交付老师进行修改


具身智能体
一、什么是具身智能体
二、配置端
三、客户端
文档是否有帮助?
有帮助
无帮助
咨询
预约
干货
客服