在LLM(大语言模型)引领人工智能领域的革新浪潮之后,大模型领域迎来了新的爆点“多模态”,为 AI 应用带来了更大的想象力。
钉钉 AI 重磅升级:加入多模态、工作流等能力
钉钉 AI 助理重磅升级,位数字化工作空间中的智慧使者,日前完成了其华丽而深远的升级之旅,以期在人工智能应用领域开辟更为广阔的疆域。此次更新新,上线图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与 RPA 技术在 AI 应用的落地。
依托于阿里巴巴通义千问大模型,升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力更加显著跃升。
01 钉钉 AI 已支持图像理解、视频速读,化身全能“小百科”
钉钉 AI 助理能够准确描述和识别图片信息,并根据图片进行信息推理、扩展创作、文字提取、翻译等,相当于一个全能的“图片小百科”。
无论图片展示的是什么,钉钉AI 助理都能一秒识别图片内容,并在此基础上进行多轮对话问答。例如,旅游时看到一个很美的建筑,拍照发给钉钉 AI 助理,就能快速了解它的历史背景和相关故事。
不仅如此,钉钉AI助理还具备对视频素材的超速洞察力。发送给 AI 助理的视频都可以被快速“观看”, 并根据视频内容生成字幕,提取关键词,并生成一份智能摘要,对于最高 2GB 的视频素材,AI助理只需 3 分钟就能完成智能解读。
02 “文档速读”能力升级,从冗长信息中解放生产力
在当今时代,大模型技术已悄然渗透至人们日常生活的经纬线中,ai助理利用大模型技术从文本中检索、总结信息。
钉钉 AI 助理可以快速阅读本地文件如 Word、PDF、PPT、Excel 、钉钉文档、网页链接等多种格式文件,轻松解析各类图书等。
比如,临时需要分析一个业务数据时,上传相关的 Excel 表格,AI 助理就可以直接给出数据结论;企业复杂的产品手册发送给 AI 助理后,可以快速总结和智能问答,大幅提升信息效率。
尤为突出的是,钉钉 AI 助理对长文本的处理能力已支持单次阅读 500 页的文件,可以为法律、医学、金融等专业领域提供更全面、准确的信息服务。
03 AI 助理上线“工作流”, AI 也能干复杂的活了
在今年 1 月,钉钉 AI 助理正式上线,企业和个人 AI 助理已进入到工作和生产力场景中。为让 AI 助理可以完成一系列更复杂的任务,钉钉 AI 助理上线了工作流能力。
工作流,作为AI Agent功能深化与拓展的关键路径,不仅是对其执行任务流程的精密擘画与艺术编排,使得 AI 助理可以主动接管完成相应操作,还能够打通外部的系统数据和 API 能力,进一步扩展了它的行动能力,比如搭建能自动写脚本并生成视频的创作 AI 助理。
为了极大地简化用户的操作流程,提升其工作效率,钉钉平台精心设计并推出了多样化的预设工作流模板。企业用户,工作流将用户反馈自动化整理,并存储到一张钉钉多维表中,帮助员工节约琐碎的时间;个人用户也通过连接微博 API,创建了自动追踪热点并撰写文章的助理,一个指令就能批量执行,大幅提升内容生产的效率。
目前,用户可在钉钉 APP 或 PC 客户端直接使用 AI 助理的各项功能,包括多模态、长文本和工作流,体验 AI 带来的便捷与高效。